SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Björklund Johanna)
 

Sökning: WFRF:(Björklund Johanna) > An evaluation of st...

An evaluation of structured language modeling for automatic speech recognition

Björklund, Johanna (författare)
Umeå universitet,Institutionen för datavetenskap
Cleophas, Loek (författare)
Stellenbosch University, Republic of South Africa
Karlsson, My (författare)
Codemill
 (creator_code:org_t)
Graz : Graz university of technology, Institute for information systems computer media IICM, 2017
2017
Engelska.
Ingår i: Journal of universal computer science (Online). - Graz : Graz university of technology, Institute for information systems computer media IICM. - 0948-695X .- 0948-6968. ; 23:11, s. 1019-1034
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • We evaluated probabilistic lexicalized tree-insertion grammars (PLTIGs) on a classification task relevant for automatic speech recognition. The baseline is a family of n-gram models tuned with Witten-Bell smoothing. The language models are trained on unannotated corpora, consisting of 10,000 to 50,000 sentences collected from the English section of Wikipedia. For the evaluation, an additional 150 random sentences were selected from the same source, and for each of these, approximately 3,200 variations were generated. Each variant sentence was obtained by replacing an arbitrary word by a similar word, chosen to be at most 2 character edits from the original. The evaluation task consisted of identifying the original sentence among the automatically constructed (and typically inferior) alternatives. In the experiments, the n-gram models outperformed the PLTIG model on the smaller data set, but as the size of data grew, the PLTIG model gave comparable results. While PLTIGs are more demanding to train, they have the advantage that they assign a parse structure to their input sentences. This is valuable for continued algorithmic processing, for example, for summarization or sentiment analysis.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Språkteknologi (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Language Technology (hsv//eng)

Nyckelord

language modeling
automatic speech recognition
probabilistic lexicalized tree-insertion grammars

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Björklund, Johan ...
Cleophas, Loek
Karlsson, My
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Språkteknologi
Artiklar i publikationen
Journal of unive ...
Av lärosätet
Umeå universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy