Sökning: onr:"swepub:oai:DiVA.org:kth-234295" >
Prediction of three...
-
Friberg, Anders,ProfessorKTH,Tal, musik och hörsel, TMH
(författare)
Prediction of three articulatory categories in vocal sound imitations using models for auditory receptive fields
- Artikel/kapitelEngelska2018
Förlag, utgivningsår, omfång ...
-
Acoustical Society of America (ASA),2018
-
electronicrdacarrier
Nummerbeteckningar
-
LIBRIS-ID:oai:DiVA.org:kth-234295
-
https://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-234295URI
-
https://doi.org/10.1121/1.5052438DOI
-
https://urn.kb.se/resolve?urn=urn:nbn:se:su:diva-221037URI
Kompletterande språkuppgifter
-
Språk:engelska
-
Sammanfattning på:engelska
Ingår i deldatabas
Klassifikation
-
Ämneskategori:ref swepub-contenttype
-
Ämneskategori:art swepub-publicationtype
Anmärkningar
-
QC 20181003
-
Vocal sound imitations provide a new challenge for understanding the coupling between articulatory mechanisms and the resulting audio. In this study, we have modeled the classification of three articulatory categories, phonation, supraglottal myoelastic vibrations, and turbulence from audio recordings. Two data sets were assembled, consisting of different vocal imitations by four professional imitators and four non-professional speakers in two different experiments. The audio data were manually annotated by two experienced phoneticians using a detailed articulatory description scheme. A separate set of audio features was developed specifically for each category using both time-domain and spectral methods. For all time-frequency transformations, and for some secondary processing, the recently developed Auditory Receptive Fields Toolbox was used. Three different machine learning methods were applied for predicting the final articulatory categories. The result with the best generalization was found using an ensemble of multilayer perceptrons. The cross-validated classification accuracy was 96.8 % for phonation, 90.8 % for supraglottal myoelastic vibrations, and 89.0 % for turbulence using all the 84 developed features. A final feature reduction to 22 features yielded similar results.
Ämnesord och genrebeteckningar
Biuppslag (personer, institutioner, konferenser, titlar ...)
-
Lindeberg, Tony,Professor,1964-KTH,Beräkningsvetenskap och beräkningsteknik (CST)(Swepub:kth)u1ht8xqq
(författare)
-
Hellwagner, MartinKTH,Tal, musik och hörsel, TMH(Swepub:kth)u1jzttcs
(författare)
-
Helgason, PéturKTH,Tal, musik och hörsel, TMH(Swepub:kth)u1yyj4gs
(författare)
-
Salomão, Gláucia Laís,PhDStockholms universitet,KTH,Tal, musik och hörsel, TMH,Avdelningen för fonetik,SUBIC – Centrum för hjärnavbildning vid Stockholms universitet,Speech, Music and Hearing, School of Electrical Engineering and Computer Science, KTH Royal Institute of Technology 1 , Lindstedtsvägen 24, 10044 Stockholm, Sweden(Swepub:su)glsa5764
(författare)
-
Elowsson, AndersKTH,Tal, musik och hörsel, TMH(Swepub:kth)u1m285z5
(författare)
-
Lemaitre, GuillaumeInstitute for Research and Coordination in Acoustics and Music, Paris, France
(författare)
-
Ternström, Sten,1956-KTH,Tal, musik och hörsel, TMH(Swepub:kth)u1bc9kv8
(författare)
-
KTHTal, musik och hörsel, TMH
(creator_code:org_t)
Sammanhörande titlar
-
Ingår i:Journal of the Acoustical Society of America: Acoustical Society of America (ASA)144:3, s. 1467-14830001-49661520-8524
Internetlänk
Hitta via bibliotek
Till lärosätets databas
- Av författaren/redakt...
-
Friberg, Anders, ...
-
Lindeberg, Tony, ...
-
Hellwagner, Mart ...
-
Helgason, Pétur
-
Salomão, Gláucia ...
-
Elowsson, Anders
-
visa fler...
-
Lemaitre, Guilla ...
-
Ternström, Sten, ...
-
visa färre...
- Om ämnet
-
- TEKNIK OCH TEKNOLOGIER
-
TEKNIK OCH TEKNO ...
-
och Elektroteknik oc ...
-
och Signalbehandling
-
- NATURVETENSKAP
-
NATURVETENSKAP
-
och Data och informa ...
-
- TEKNIK OCH TEKNOLOGIER
-
TEKNIK OCH TEKNO ...
-
och Maskinteknik
-
och Strömningsmekani ...
- Artiklar i publikationen
-
Journal of the A ...
- Av lärosätet
-
Kungliga Tekniska Högskolan
-
Stockholms universitet