SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:lnu-78277"
 

Sökning: onr:"swepub:oai:DiVA.org:lnu-78277" > The Nordic Tweet St...

The Nordic Tweet Stream : A Dynamic Real-Time Monitor Corpus of Big and Rich Language Data

Laitinen, Mikko, 1973- (författare)
University of Eastern Finland, Finland,DISA-DH
Lundberg, Jonas, 1964- (författare)
Linnéuniversitetet,Institutionen för datavetenskap och medieteknik (DM),DISA-DH
Levin, Magnus, 1972- (författare)
Linnéuniversitetet,Institutionen för språk (SPR),DISA-DH
visa fler...
Martins, Rafael Messias, Dr. 1984- (författare)
Linnéuniversitetet,Institutionen för datavetenskap och medieteknik (DM)
visa färre...
 (creator_code:org_t)
CEUR-WS.org, 2018
2018
Engelska.
Ingår i: DHN 2018 Digital Humanities in the Nordic Countries 3rd Conference. - : CEUR-WS.org. ; , s. 349-362
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • This article presents the Nordic Tweet Stream (NTS), a cross-disciplinarycorpus project of computer scientists and a group of sociolinguists interestedin language variability and in the global spread of English. Our research integratestwo types of empirical data: We not only rely on traditional structured corpusdata but also use unstructured data sources that are often big and rich inmetadata, such as Twitter streams. The NTS downloads tweets and associatedmetadata from Denmark, Finland, Iceland, Norway and Sweden. We first introducesome technical aspects in creating a dynamic real-time monitor corpus, andthe following case study illustrates how the corpus could be used as empiricalevidence in sociolinguistic studies focusing on the global spread of English tomultilingual settings. The results show that English is the most frequently usedlanguage, accounting for almost a third. These results can be used to assess howwidespread English use is in the Nordic region and offer a big data perspectivethat complement previous small-scale studies. The future objectives include annotatingthe material, making it available for the scholarly community, and expandingthe geographic scope of the data stream outside Nordic region.

Ämnesord

HUMANIORA  -- Språk och litteratur -- Jämförande språkvetenskap och allmän lingvistik (hsv//swe)
HUMANITIES  -- Languages and Literature -- General Language Studies and Linguistics (hsv//eng)
HUMANIORA  -- Språk och litteratur -- Studier av enskilda språk (hsv//swe)
HUMANITIES  -- Languages and Literature -- Specific Languages (hsv//eng)

Nyckelord

Real-time language data
Nordic Tweet Stream
Twitter
Engelska med språkvetenskaplig inriktning
English

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Laitinen, Mikko, ...
Lundberg, Jonas, ...
Levin, Magnus, 1 ...
Martins, Rafael ...
Om ämnet
HUMANIORA
HUMANIORA
och Språk och litter ...
och Jämförande språk ...
HUMANIORA
HUMANIORA
och Språk och litter ...
och Studier av enski ...
Artiklar i publikationen
Av lärosätet
Linnéuniversitetet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy