SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:uu-407021"
 

Sökning: id:"swepub:oai:DiVA.org:uu-407021" > Text Processing Pro...

  • Dahlqvist, Bengt,1955-Uppsala universitet,Institutionen för lingvistik och filologi (författare)

Text Processing Procedures for Analysing a Corpus with Medieval Marian Miracle Tales in Old Swedish

  • Artikel/kapitelEngelska2020

Förlag, utgivningsår, omfång ...

  • Setúbal, Portugal :SciTePress,2020
  • printrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:uu-407021
  • https://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-407021URI
  • https://doi.org/10.5220/0009372204520458DOI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:kon swepub-publicationtype

Anmärkningar

  • A text corpus of one hundred and one Marian Miracle stories in Old Swedish written between c. 1272 and 1430 has been digitally compiled from three transcribed sources from the 19th Century. Highly specialized knowledge is needed to interpret these texts, since the medieval variant of Swedish differs significantly from the modern form of the language. Both the vocabulary and spelling as well as the grammar show substantial variances compared to modern Swedish. To advance the understanding of these texts, automated tools for textual processing are needed. This paper preliminary investigates a number of strategies, such as frequency list analysis and methods for identifying spelling variations for producing stop word lists and exposing the key words of the texts. This can be a help to understand the texts, identifying different word forms of the same word, to ease a lexicon lookup and be a starting point for lemmatisation.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • Uppsala universitetInstitutionen för lingvistik och filologi (creator_code:org_t)

Sammanhörande titlar

  • Ingår i:Proceedings of the 12th International Conference on Agents and Artificial IntelligenceSetúbal, Portugal : SciTePress, s. 452-4589789897583957

Internetlänk

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Dahlqvist, Bengt ...
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Språkteknologi
Artiklar i publikationen
Proceedings of t ...
Av lärosätet
Uppsala universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy