SwePub
Sök i SwePub databas

  Utökad sökning

Träfflista för sökning "WFRF:(de Smedt Koenraad Professor) "

Sökning: WFRF:(de Smedt Koenraad Professor)

  • Resultat 1-2 av 2
Sortera/gruppera träfflistan
   
NumreringReferensOmslagsbildHitta
1.
  • Adesam, Yvonne, 1975- (författare)
  • The Multilingual Forest : Investigating High-quality Parallel Corpus Development
  • 2012
  • Doktorsavhandling (övrigt vetenskapligt/konstnärligt)abstract
    • This thesis explores the development of parallel treebanks, collections of language data consisting of texts and their translations, with syntactic annotation and alignment, linking words, phrases, and sentences to show translation equivalence. We describe the semi-manual annotation of the SMULTRON parallel treebank, consisting of 1,000 sentences in English, German and Swedish. This description is the starting point for answering the first of two questions in this thesis.What issues need to be considered to achieve a high-quality, consistent,parallel treebank?The units of annotation and the choice of annotation schemes are crucial for quality, and some automated processing is necessary to increase the size. Automatic quality checks and evaluation are essential, but manual quality control is still needed to achieve high quality.Additionally, we explore improving the automatically created annotation for one language, using information available from the annotation of the other languages. This leads us to the second of the two questions in this thesis.Can we improve automatic annotation by projecting information available in the other languages?Experiments with automatic alignment, which is projected from two language pairs, L1–L2 and L1–L3, onto the third pair, L2–L3, show an improvement in precision, in particular if the projected alignment is intersected with the system alignment. We also construct a test collection for experiments on annotation projection to resolve prepositional phrase attachment ambiguities. While majority vote projection improves the annotation, compared to the basic automatic annotation, using linguistic clues to correct the annotation before majority vote projection is even better, although more laborious. However, some structural errors cannot be corrected by projection at all, as different languages have different wording, and thus different structures.
  •  
2.
  • Domeij, Rickard, 1958- (författare)
  • Datorstödd språkgranskning under skrivprocessen : svensk språkkontroll ur användarperspektiv
  • 2003
  • Doktorsavhandling (övrigt vetenskapligt/konstnärligt)abstract
    • Datorstödd språkgranskning med kontroll av stavning, teckenanvändning, ordval och grammatik är ett av språkteknologins största tillämpningsområden. Sådana språkkontrollfunktioner har funnits i ordbehandlingsprogram för engelska i mer än ett decennium. Utvecklingen av motsvarande teknik för svenska ligger efter, men sedan några år tillbaka går det även att språkkontrollera svensk text i ett ordbehandlingsprogram. Tyvärr är det inte möjligt att i befintligt skick överföra språkteknologiska lösningar från engelska till svenska vilket bl.a. beror på att svenskan morfologiskt och morfosyntaktiskt sett är rikare. Detta visar sig t.ex. i svenskans mer intrikata kongruenssystem och dess oändliga möjligheter att skapa nya sammansatta ord. För att sammansättningarna inte ska signaleras som misstänkt felstavade i en svensk stavningskontroll, krävs därför speciella analysmetoder. Vid en kontroll av svensk grammatik behövs dessutom teknik för detektion och korrektion av inkongruens och särskrivna sammansättningar, vilka blivit allt vanligare bl.a. som en effekt av att många skriver med ordbehandlare och influeras av främmande språk, särskilt då engelskan. I avhandlingen redogörs för hur effektiva och adekvata språkgranskningsfunktioner för svenska utvecklats under nittiotalet i olika projekt på Nada, KTH i Stockholm. Det finns dock ofrånkomliga begränsningar i den bakomliggande tekniken som yttrar sig i missade fel, misstolkningar och falska alarm. Denna begränsade, fragmentariska och inte alltid pålitliga datorgranskning kan antas skapa problem i samspelet mellan dator och skribent, vilket väcker frågor om teknikens användbarhet och dess effekter på språk och språkförmåga. I avhandlingen presenteras två användarstudier med syfte att undersöka dessa problem mot bakgrund av kognitiv skrivforskning. En kombination av textanalys och tänka högt-metodik används för att studera hur skribent och skrivande påverkas vid datorstödd språkgranskning. Resultatet visar bl.a. att ett språkgranskningsprogram kunde hjälpa skribenterna att upptäcka, definiera och åtgärda språkliga problem som de själva förbigått av olika skäl. Dock gav programmet ibland inte tillräcklig instruktiv hjälp för att en skribent skulle kunna åtgärda problemet. En skribent kunde också luras att ändra på ett inkorrekt eller mindre lyckat sätt vid falskt alarm eller felaktiga diagnoser. Resultatet tyder dessutom på att den kognitiva avlastning som programmet erbjuder kan leda till att skribenten åtgärdar ett problem på ett korrekt men mindre lyckat sätt p.g.a. att hon inte lägger ner samma tankearbete på problemet som när hon arbetar manuellt. I ljuset av framkomna resultat diskuteras hur användbarheten i befintliga språkgranskningsprogram kan förbättras.
  •  
Skapa referenser, mejla, bekava och länka
  • Resultat 1-2 av 2

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy