SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:kth-34387"
 

Sökning: id:"swepub:oai:DiVA.org:kth-34387" > Audio-Visual Prosody :

Audio-Visual Prosody : Perception, Detection, and Synthesis of Prominence

Al Moubayed, Samer (författare)
KTH,Skolan för datavetenskap och kommunikation (CSC)
Beskow, Jonas (författare)
KTH,Tal-kommunikation
Granström, Björn (författare)
KTH,Tal-kommunikation
visa fler...
House, David (författare)
KTH,Tal-kommunikation
visa färre...
 (creator_code:org_t)
Berlin, Heidelberg : Springer Berlin Heidelberg, 2010
2010
Engelska.
Ingår i: 3rd COST 2102 International Training School on Toward Autonomous, Adaptive, and Context-Aware Multimodal Interfaces. - Berlin, Heidelberg : Springer Berlin Heidelberg. - 9783642181832 ; , s. 55-71
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • In this chapter, we investigate the effects of facial prominence cues, in terms of gestures, when synthesized on animated talking heads. In the first study a speech intelligibility experiment is conducted, where speech quality is acoustically degraded, then the speech is presented to 12 subjects through a lip synchronized talking head carrying head-nods and eyebrow raising gestures. The experiment shows that perceiving visual prominence as gestures, synchronized with the auditory prominence, significantly increases speech intelligibility compared to when these gestures are randomly added to speech. We also present a study examining the perception of the behavior of the talking heads when gestures are added at pitch movements. Using eye-gaze tracking technology and questionnaires for 10 moderately hearing impaired subjects, the results of the gaze data show that users look at the face in a similar fashion to when they look at a natural face when gestures are coupled with pitch movements opposed to when the face carries no gestures. From the questionnaires, the results also show that these gestures significantly increase the naturalness and helpfulness of the talking head.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Människa-datorinteraktion (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Human Computer Interaction (hsv//eng)

Nyckelord

visual prosody
prominence
stress
multimodal
gaze
head-nod
eyebrows
visual synthesis
talking heads

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy