Classifying easy-to-read texts without parsing

↓ Direkt till sidans innehåll
↓ Direkt till sidans sekundära innehåll (sidomenyn)

Sökning: WFRF:(Jönsson Arne) > Classifying easy-to...

LIBRIS Formathandbok (Information om MARC21)

Fältnamn	Indikatorer	Metadata
000		02527naa a2200325 4500
001		oai:DiVA.org:liu-117547
003		SwePub
008		150504s2014 \| \|\|\|\|\|\|\|\|\|\|\|000 \|\|eng\|
024	7	a https://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-1175472 URI
040		a (SwePub)liu
041		a engb eng
042		9 SwePub
072	7	a ref2 swepub-contenttype
072	7	a kon2 swepub-publicationtype
100	1	a Falkenjack, Johan,d 1986-u Linköpings universitet,Institutionen för datavetenskap,Tekniska högskolan4 aut0 (Swepub:liu)johsj47
245	1 0	a Classifying easy-to-read texts without parsing
264	1	b Association for Computational Linguistics,c 2014
338		a print2 rdacarrier
520		a Document classification using automated linguistic analysis and machine learning (ML) has been shown to be a viable road forward for readability assessment. The best models can be trained to decide if a text is easy to read or not with very high accuracy, e.g. a model using 117 parameters from shallow, lexical, morphological and syntactic analyses achieves 98,9% accuracy. In this paper we compare models created by parameter optimization over subsets of that total model to find out to which extent different high-performing models tend to consist of the same parameters and if it is possible to find models that only use features not requiring parsing. We used a genetic algorithm to systematically optimize parameter sets of fixed sizes using accuracy of a Support Vector Machine classi- fier as fitness function. Our results show that it is possible to find models almost as good as the currently best models while omitting parsing based features.
650	7	a NATURVETENSKAPx Data- och informationsvetenskapx Språkteknologi0 (SwePub)102082 hsv//swe
650	7	a NATURAL SCIENCESx Computer and Information Sciencesx Language Technology0 (SwePub)102082 hsv//eng
653		a Readability
653		a Readability Assessment
653		a Genetic optimization
653		a Machine Learning
653		a Support Vector Machine
700	1	a Jönsson, Arneu Linköpings universitet,Institutionen för datavetenskap,Tekniska högskolan4 aut
710	2	a Linköpings universitetb Institutionen för datavetenskap4 org
773	0	t Proceedings of the 3rd Workshop on Predicting and Improving Text Readability for Target Reader Populations (PITR)d : Association for Computational Linguisticsg , s. 114-122q <114-122z 9781937284916
856	4 8	u https://urn.kb.se/resolve?urn=urn:nbn:se:liu:diva-117547

Hitta via bibliotek

Proceedings of the 3rd Workshop on Predicting and Improving Text Readability for... (Sök värdpublikationen i LIBRIS)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...: Falkenjack, Joha ...; Jönsson, Arne

Om ämnet

NATURVETENSKAP: NATURVETENSKAP; och Data och informa ...; och Språkteknologi

Artiklar i publikationen: Proceedings of t ...

Av lärosätet: Linköpings universitet

Sök utanför SwePub

Sök vidare i:: Google; Google Book Search; Google Scholar

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

LIBRIS.kb.se