SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:kth-53577"
 

Sökning: onr:"swepub:oai:DiVA.org:kth-53577" > Synthetic visual sp...

Synthetic visual speech driven from auditory speech

Agelfors, Eva (författare)
KTH,Tal, musik och hörsel
Beskow, Jonas (författare)
KTH,Tal, musik och hörsel
Granström, Björn (författare)
KTH,Tal, musik och hörsel
visa fler...
Lundeberg, Magnus (författare)
KTH,Tal, musik och hörsel
Salvi, Giampiero (författare)
KTH,Tal, musik och hörsel
Spens, Karl-Erik (författare)
KTH,Tal, musik och hörsel
Öhman, Tobias (författare)
KTH,Tal, musik och hörsel
visa färre...
 (creator_code:org_t)
1999
1999
Engelska.
Ingår i: Proceedings of Audio-Visual Speech Processing (AVSP'99)).
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • We have developed two different methods for using auditory, telephone speech to drive the movements of a synthetic face. In the first method, Hidden Markov Models (HMMs) were trained on a phonetically transcribed telephone speech database. The output of the HMMs was then fed into a rulebased visual speech synthesizer as a string of phonemes together with time labels. In the second method, Artificial Neural Networks (ANNs) were trained on the same database to map acoustic parameters directly to facial control parameters. These target parameter trajectories were generated by using phoneme strings from a database as input to the visual speech synthesis The two methods were evaluated through audiovisual intelligibility tests with ten hearing impaired persons, and compared to “ideal” articulations (where no recognition was involved), a natural face, and to the intelligibility of the audio alone. It was found that the HMM method performs considerably better than the audio alone condition (54% and 34% keywords correct respectively), but not as well as the “ideal” articulating artificial face (64%). The intelligibility for the ANN method was 34% keywords correct.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences (hsv//eng)

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy