SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:lup.lub.lu.se:b1ecf2af-e1c3-47ae-bb32-6970bde8421a"
 

Sökning: id:"swepub:oai:lup.lub.lu.se:b1ecf2af-e1c3-47ae-bb32-6970bde8421a" > A practical guide t...

A practical guide to calculating vocal tract length and scale-invariant formant patterns

Anikin, Andrey (författare)
Lund University,Lunds universitet,LUCS grupp för kognitiv zoologi,Forskargrupper vid Lunds universitet,Kognitionsvetenskap,Filosofiska institutionen,Institutioner,Humanistiska och teologiska fakulteterna,LU profilområde: Naturlig och artificiell kognition,Lunds universitets profilområden,LUCS Cognitive Zoology Group,Lund University Research Groups,Cognitive Science,Department of Philosophy,Departments,Joint Faculties of Humanities and Theology,LU Profile Area: Natural and Artificial Cognition,Lund University Profile areas,Jean Monnet University
Barreda, Santiago (författare)
University of California, Davis
Reby, David (författare)
Jean Monnet University,Institut Universitaire de France
 (creator_code:org_t)
2023
2023
Engelska 17 s.
Ingår i: Behavior Research Methods. - 1554-3528.
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • Formants (vocal tract resonances) are increasingly analyzed not only by phoneticians in speech but also by behavioral scientists studying diverse phenomena such as acoustic size exaggeration and articulatory abilities of non-human animals. This often involves estimating vocal tract length acoustically and producing scale-invariant representations of formant patterns. We present a theoretical framework and practical tools for carrying out this work, including open-source software solutions included in R packages soundgen and phonTools. Automatic formant measurement with linear predictive coding is error-prone, but formant_app provides an integrated environment for formant annotation and correction with visual and auditory feedback. Once measured, formants can be normalized using a single recording (intrinsic methods) or multiple recordings from the same individual (extrinsic methods). Intrinsic speaker normalization can be as simple as taking formant ratios and calculating the geometric mean as a measure of overall scale. The regression method implemented in the function estimateVTL calculates the apparent vocal tract length assuming a single-tube model, while its residuals provide a scale-invariant vowel space based on how far each formant deviates from equal spacing (the schwa function). Extrinsic speaker normalization provides more accurate estimates of speaker- and vowel-specific scale factors by pooling information across recordings with simple averaging or mixed models, which we illustrate with example datasets and R code. The take-home messages are to record several calls or vowels per individual, measure at least three or four formants, check formant measurements manually, treat uncertain values as missing, and use the statistical tools best suited to each modeling context.

Ämnesord

HUMANIORA  -- Språk och litteratur -- Jämförande språkvetenskap och allmän lingvistik (hsv//swe)
HUMANITIES  -- Languages and Literature -- General Language Studies and Linguistics (hsv//eng)

Nyckelord

Formants
Speaker normalization
Vocal tract length normalization
Vowel
Body size

Publikations- och innehållstyp

art (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Anikin, Andrey
Barreda, Santiag ...
Reby, David
Om ämnet
HUMANIORA
HUMANIORA
och Språk och litter ...
och Jämförande språk ...
Artiklar i publikationen
Behavior Researc ...
Av lärosätet
Lunds universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy