SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:lup.lub.lu.se:ee7facac-c682-4041-b4ec-0e5083f99fa1"
 

Sökning: id:"swepub:oai:lup.lub.lu.se:ee7facac-c682-4041-b4ec-0e5083f99fa1" > Using Confidence In...

Using Confidence Intervals to Determine Adequate Item Sample Sizes for Vocabulary Tests : An Essential but Overlooked Practice

Gyllstad, Henrik (författare)
Lund University,Lunds universitet,Språkinlärning,Forskargrupper vid Lunds universitet,Språk, Kognition och Discourse@Lund (SKD@L),Engelska,Avdelningen för engelska,Sektion 4,Språk- och litteraturcentrum,Institutioner,Humanistiska och teologiska fakulteterna,Language Acquisition,Lund University Research Groups,Language, Cognition and Discourse@Lund (LCD@L),English Studies,Division of English Studies,Section 4,Centre for Languages and Literature,Departments,Joint Faculties of Humanities and Theology
McLean, Stuart (författare)
Momoyama Gakuin University (St Andrew's University ) Japan
Stewart, Jeffrey (författare)
Tokyo University of Science
 (creator_code:org_t)
2020-12-23
2021
Engelska 21 s.
Ingår i: Language Testing. - : SAGE Publications. - 1477-0946 .- 0265-5322. ; 38:4, s. 558-579
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • The last three decades have seen an increase of tests aimed at measuring an individual’s vocabulary level or size. The target words used in these tests are typically sampled from word frequency lists, which are in turn based on language corpora. Conventionally, test developers sample items from frequency bands of 1000 words; different tests employ different sampling ratios. Some have as few as 5 or 10 items representing the underlying population of words, whereas other tests feature a larger number of items, such as 24, 30, or 40. However, very rarely are the sampling size choices supported by clear empirical evidence. Here, using a bootstrapping approach, we illustrate the effect that a sample-size increase has on confidence intervals of individual learner vocabulary knowledge estimates, and on the inferences that can safely be made from test scores. We draw on a unique dataset consisting of adult L1 Japanese test takers’ performance on two English vocabulary test formats, each featuring 1000 words. Our analysis shows that there are few purposes and settings where as few as 5 to 10 sampled items from a 1000-word frequency band (1K) are sufficient. The use of 30 or more items per 1000-word frequency band and tests consisting of fewer bands is recommended.

Ämnesord

HUMANIORA  -- Språk och litteratur -- Jämförande språkvetenskap och allmän lingvistik (hsv//swe)
HUMANITIES  -- Languages and Literature -- General Language Studies and Linguistics (hsv//eng)

Nyckelord

Assessment
bootstrapping
confidence intervals
statistics
testing
validity
vocabulary

Publikations- och innehållstyp

art (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Gyllstad, Henrik
McLean, Stuart
Stewart, Jeffrey
Om ämnet
HUMANIORA
HUMANIORA
och Språk och litter ...
och Jämförande språk ...
Artiklar i publikationen
Language Testing
Av lärosätet
Lunds universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy