SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Jönsson Arne)
 

Sökning: WFRF:(Jönsson Arne) > Classifying easy-to...

LIBRIS Formathandbok  (Information om MARC21)
FältnamnIndikatorerMetadata
00002527naa a2200325 4500
001oai:DiVA.org:liu-117547
003SwePub
008150504s2014 | |||||||||||000 ||eng|
024a https://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-1175472 URI
040 a (SwePub)liu
041 a engb eng
042 9 SwePub
072 7a ref2 swepub-contenttype
072 7a kon2 swepub-publicationtype
100a Falkenjack, Johan,d 1986-u Linköpings universitet,Institutionen för datavetenskap,Tekniska högskolan4 aut0 (Swepub:liu)johsj47
2451 0a Classifying easy-to-read texts without parsing
264 1b Association for Computational Linguistics,c 2014
338 a print2 rdacarrier
520 a Document classification using automated linguistic analysis and machine learning (ML) has been shown to be a viable road forward for readability assessment. The best models can be trained to decide if a text is easy to read or not with very high accuracy, e.g. a model using 117 parameters from shallow, lexical, morphological and syntactic analyses achieves 98,9% accuracy. In this paper we compare models created by parameter optimization over subsets of that total model to find out to which extent different high-performing models tend to consist of the same parameters and if it is possible to find models that only use features not requiring parsing. We used a genetic algorithm to systematically optimize parameter sets of fixed sizes using accuracy of a Support Vector Machine classi- fier as fitness function. Our results show that it is possible to find models almost as good as the currently best models while omitting parsing based features.
650 7a NATURVETENSKAPx Data- och informationsvetenskapx Språkteknologi0 (SwePub)102082 hsv//swe
650 7a NATURAL SCIENCESx Computer and Information Sciencesx Language Technology0 (SwePub)102082 hsv//eng
653 a Readability
653 a Readability Assessment
653 a Genetic optimization
653 a Machine Learning
653 a Support Vector Machine
700a Jönsson, Arneu Linköpings universitet,Institutionen för datavetenskap,Tekniska högskolan4 aut
710a Linköpings universitetb Institutionen för datavetenskap4 org
773t Proceedings of the 3rd Workshop on Predicting and Improving Text Readability for Target Reader Populations (PITR)d : Association for Computational Linguisticsg , s. 114-122q <114-122z 9781937284916
8564 8u https://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-117547

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Falkenjack, Joha ...
Jönsson, Arne
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Språkteknologi
Artiklar i publikationen
Proceedings of t ...
Av lärosätet
Linköpings universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy