SwePub
Sök i SwePub databas

  Utökad sökning

Träfflista för sökning "WFRF:(Kann Viggo) srt2:(2005-2009)"

Sökning: WFRF:(Kann Viggo) > (2005-2009)

  • Resultat 1-10 av 18
Sortera/gruppera träfflistan
   
NumreringReferensOmslagsbildHitta
1.
  • Bigert, Johnny, 1976- (författare)
  • Automatic and unsupervised methods in natural language processing
  • 2005
  • Doktorsavhandling (övrigt vetenskapligt/konstnärligt)abstract
    • Natural language processing (NLP) means the computer-aided processing of language produced by a human. But human language is inherently irregular and the most reliable results are obtained when a human is involved in at least some part of the processing. However, manual workis time-consuming and expensive. This thesis focuses on what can be accomplished in NLP when manual workis kept to a minimum. We describe the construction of two tools that greatly simplify the implementation of automatic evaluation. They are used to implement several supervised, semi-supervised and unsupervised evaluations by introducing artificial spelling errors. We also describe the design of a rule-based shallow parser for Swedish called GTA and a detection algorithm for context-sensitive spelling errors based on semi-supervised learning, called ProbCheck. In the second part of the thesis, we first implement a supervised evaluation scheme that uses an error-free treebankto determine the robustness of a parser when faced with noisy input such as spelling errors. We evaluate the GTA parser and determine the robustness of the individual components of the parser as well as the robustness for different phrase types. Second, we create an unsupervised evaluation procedure for parser robustness. The procedure allows us to evaluate the robustness of parsers using different parser formalisms on the same text and compare their performance. Five parsers and one tagger are evaluated. For four of these, we have access to annotated material and can verify the estimations given by the unsupervised evaluation procedure. The results turned out to be very accurate with few exceptions and thus, we can reliably establish the robustness of an NLP system without any need of manual work. Third, we implement an unsupervised evaluation scheme for spell checkers. Using this, we perform a very detailed analysis of three spell checkers for Swedish. Last, we evaluate the ProbCheck algorithm. Two methods are included for comparison: a full parser and a method using tagger transition probabilities. The algorithm obtains results superior to the comparison methods. The algorithm is also evaluated on authentic data in combination with a grammar and spell checker.
  •  
2.
  • Dalianis, Hercules, et al. (författare)
  • Using Uplug and SiteSeeker to construct a cross language search engine for Scandinavian
  • 2007
  • Konferensbidrag (övrigt vetenskapligt/konstnärligt)abstract
    • This paper presents how we adapted a website search engine for cross language information retrieval, using the Uplug word alignment tool for parallel corpora.We first studied the monolingual search queries posed by the visitors of the website of the Nordic council containing five different languages. In order to compare how well different types of bilingual dictionaries covered the most common queries and terms on the website we tried a collection of ordinary bilingual dictionaries, a small manually constructed trilingual dictionary and an automatically constructed trilingual dictionary, constructed from the news corpus in the website using Uplug. The pre-cision and recall of the automatically constructed Swedish-English dictionary using Uplug were 71 and 93 percent, re-spectively. We found that precision and recall increase significantly in samples with high word frequency, but we could not confirm that POS-tags improve pre-cision. The collection of ordinary dic-tionaries, consisting of about 200 000 words, only cover 41 of the top 100 search queries at the website. The automatically built trilingual dictionary com-bined with the small manually built trilingual dictionary, consisting of about 2 300 words, and covers 36 of the top search queries.
  •  
3.
  •  
4.
  • Dalianis, Hercules, 1959-, et al. (författare)
  • Using Uplug and SiteSeeker to construct a cross language search engine for Scandinavian languages
  • 2009
  • Ingår i: Proceedings of the 17th Nordic Conference of Computational Linguistics, NODALIDA 2009. - : Northern European Association for Language Technology (NEALT). ; , s. 26-33
  • Konferensbidrag (refereegranskat)abstract
    • This paper presents how we adapted a website search engine for cross language information retrieval, using the Uplug word alignment tool for parallel corpora. We first studied the monolingual search queries posed by the visitors of the website of the Nordic council containing six different languages. In order to compare how well different types of bilingual dictionaries covered the most common queries and terms on the website we tried a collection of ordinary bilingual dictionaries, a small manually constructed trilingual dictionary and an automatically constructed trilingual dictionary, constructed from the news corpus in the website using Uplug. The precision and recall of the automatically constructed Swedish-English dictionary using Uplug were 71 and 93 percent, respectively. We found that precision and recall increase significantly in samples with high word frequency, but we could not confirm that POS-tags improve precision. The collection of ordinary dictionaries, consisting of about 200 000 words, only cover half of the top 100 search queries at the website. The automatically built trilingual dictionary combined with the small manually built trilingual dictionary consists of about 2000 words and covers 27 of the top 100 search queries.
  •  
5.
  • Hassel, Martin, 1971- (författare)
  • Resource Lean and Portable Automatic Text Summarization
  • 2007
  • Doktorsavhandling (övrigt vetenskapligt/konstnärligt)abstract
    • Today, with digitally stored information available in abundance, even for many minor languages, this information must by some means be filtered and extracted in order to avoid drowning in it. Automatic summarization is one such technique, where a computer summarizes a longer text to a shorter non-rendundant form. Apart from the major languages of the world there are a lot of languages for which large bodies of data aimed at language technology research to a high degree are lacking. There might also not be resources available to develop such bodies of data, since it is usually time consuming and requires substantial manual labor, hence being expensive. Nevertheless, there will still be a need for automatic text summarization for these languages in order to subdue this constantly increasing amount of electronically produced text. This thesis thus sets the focus on automatic summarization of text and the evaluation of summaries using as few human resources as possible. The resources that are used should to as high extent as possible be already existing, not specifically aimed at summarization or evaluation of summaries and, preferably, created as part of natural literary processes. Moreover, the summarization systems should be able to be easily assembled using only a small set of basic language processing tools, again, not specifically aimed at summarization/evaluation. The summarization system should thus be near language independent as to be quickly ported between different natural languages. The research put forth in this thesis mainly concerns three computerized systems, one for near language independent summarization – The HolSum summarizer; one for the collection of large-scale corpora – The KTH News Corpus; and one for summarization evaluation – The KTH eXtract Corpus. These three systems represent three different aspects of transferring the proposed summarization method to a new language. One aspect is the actual summarization method and how it relates to the highly irregular nature of human language and to the difference in traits among language groups. This aspect is discussed in detail in Chapter 3. This chapter also presents the notion of “holistic summarization”, an approach to self-evaluative summarization that weighs the fitness of the summary as a whole, by semantically comparing it to the text being summarized, before presenting it to the user. This approach is embodied as the text summarizer HolSum, which is presented in this chapter and evaluated in Paper 5. A second aspect is the collection of large-scale corpora for languages where few or none such exist. This type of corpora is on the one hand needed for building the language model used by HolSum when comparing summaries on semantic grounds, on the other hand a large enough set of (written) language use is needed to guarantee the randomly selected subcorpus used for evaluation to be representative. This topic briefly touched upon in Chapter 4, and detailed in Paper 1. The third aspect is, of course, the evaluation of the proposed summarization method on a new language. This aspect is investigated in Chapter 4. Evaluations of HolSum have been run on English as well as on Swedish, using both well established data and evaluation schemes (English) as well as with corpora gathered “in the wild” (Swedish). During the development of the latter corpora, which is discussed in Paper 4, evaluations of a traditional sentence ranking text summarizer, SweSum, have also been run. These can be found in Paper 2 and 3. This thesis thus contributes a novel approach to highly portable automatic text summarization, coupled with methods for building the needed corpora, both for training and evaluation on the new language.
  •  
6.
  • Kann, Viggo (författare)
  • Effektiv, formativ och målrelaterad sluttenta : [Efficient, formative and criterion-referenced final exam]
  • 2008
  • Konferensbidrag (refereegranskat)abstract
    • Den stora fördelen med skriftliga tentor, säger en vitt spridd myt på högskolan, är att det är enbillig och effektiv examinationsform. I denna artikel visas att så faktiskt inte är fallet.Missuppfattningen kommer nog av stordriften – alla tentander får samtidigt jobba med sammauppgifter – det måste ju vara effektivt! Genom att ersätta en vanlig skriftlig tenta med enkombination av en kamraträttad mindre teoritenta och en frivillig muntlig tenta för högre betyghar författaren minskat kostnaden för slutexaminationen per tentand från 800 kr till 270 kr, alltsåmed två tredjedelar. Den nya examinationen är inte bara billigare, den är också målrelaterad och ihögre grad formativ än den tidigare traditionella tentan.
  •  
7.
  • Kann, Viggo, et al. (författare)
  • Free Construction of a Free SwedishDictionary of Synonyms
  • 2005
  • Ingår i: NoDaLiDa 2005. ; , s. 1-6
  • Konferensbidrag (refereegranskat)abstract
    • Building a large dictionary of synonymsfor a language is a very tedioustask. Hence there exist veryfew synonym dictionaries for mostlanguages, and those that exist aregenerally not freely available due tothe amount of work that have beenput into them.The Lexin on-line dictionary1 is avery popular web-site for translationsof Swedish words to about tendifferent languages. By letting userson this site grade automatically generatedpossible synonym pairs a freedictionary of Swedish synonyms hasbeen created. The lexicon reflectsthe users intuitive definition of synonymityand the amount of work putinto the project is only as much asthe participants want to.
  •  
8.
  • Kann, Viggo (författare)
  • Lärarbemanning för kvalitet
  • 2009
  • Konferensbidrag (övrigt vetenskapligt/konstnärligt)abstract
    • Nada vid KTH har utvecklat ett system för bemanningen som gersärskilt goda möjligheter att säkra och utveckla kvaliteten iutbildningen. Systemet leder också till en ekonomisk budget medvars hjälp man kan besvara viktiga frågor som:Behöver vi anställa fler lärare och har vi råd med det?Vilka kurser är självbärande och vilka går med förlust?Kommer ett alternativt kursupplägg, t ex en ny examinationsform,  att kräva mer eller mindre lärartid?Hur mycket undervisning har vi råd att ge i en ny kurs?När ekonomin är kärv, vad är det effektivast att spara på?Kommer någon lärare att bli överbelastad av den planerade undervisningen?Varje vår har studierektorn och läraren ett bemanningssamtal därläsårets undervisning planeras. Resultatet av samtalet blir ettdokument (kontrakt) som beskriver hur många timmar som läraren skalägga på varje arbetsuppgift. Sedan ansvarar läraren för att deplanerade uppgifterna genomförs och slipper att i efterhand redovisasin arbetstid. Läraren kan därför själv disponera sin tid och vidbehov omfördela den mellan olika uppgifter.Bemanningsplanen som byggs upp vid bemanningssamtalen lagras i ettkalkylark. Kursparametrar som poängantal, elevantal, gruppantal ochantal timmar undervisning är ifyllda redan före samtalet. Vid samtaletfastställs dels parametrar som hur lång tid det tar att förbereda entimmes föreläsning och att rätta en tenta, dels hur stor del avarbetet som läraren själv ska genomföra. Tid ges i bemanningen förkvalitetsarbete som kursutveckling, kursutvärdering och kursanalys.Resultatet blir både en färdig bemanning av varje kurs och en kursbudget.Även lärarens egenutveckling planeras in vid bemanningen, fördelad påen oplanerad del, kallad "akademiskt deltagande", och planeradeaktiviteter. Läraren lämnar samtidigt in en självdeklaration av detsenaste årets egenutveckling.Bemanningssystemet infördes 2000 och har förfinats med åren. År 2006gjordes en utvärdering av skolans bemanningsprocess och resultatetblev att lärarna till största delen var mycket nöjda med bemanningen,bland annat dess tydlighet och flexibilitet. Endast inom ett avskolans ämnen fanns en viss kritik, vilket gjorde att vi inom dettaämne införde en bemanningsdiskussion för alla lärare förebemanningssamtalen.Systemet används på skolan av fem olika studierektorer i fem ämnen avolika karaktär. Det är flexibelt och bör kunna användas ellerenkelt anpassas för de flesta utbildningsmiljöer.
  •  
9.
  • Kann, Viggo (författare)
  • Målrelaterade betygskriterier kräver modifierad examination - examination efter betygskriterier i en algoritmkurs på KTH
  • 2007
  • Konferensbidrag (övrigt vetenskapligt/konstnärligt)abstract
    • Algoritmer, datastrukturer och komplexitet heter en datalogikurs på 6 poäng som är obligatorisk för Datateknikprogrammets årskurs 2 på KTH. Jag har hållit kursen åtta gånger och har funnit ett upplägg på undervisning och examination som fungerar bra. Kursen har drygt 100 elever, läses över en hel termin och består av 9 handledda labbtillfällen, 22 föreläsningar och 12 övningar. Examinationen har tidigare gjorts med labbar, två individuella uppgifter kallade mästarprov som redovisas skriftligt och muntligt, och en skriftlig tenta bestående av en teoridel utan hjälpmedel och en problemdel med kurslitteraturen som hjälpmedel. I och med Bologniseringen av högskolan utformade jag lärandemål och målrelaterade betygskriterier för kursen. För att kunna ge målrelaterade betyg var jag tvungen att modifiera examinationen. Jag har haft Biggs (1999) princip om constructive alignment som vägledning, det vill säga att lärandemål, undervisning och examination bör hänga ihop, vara samstämmiga och underlätta meningsfullt lärande. Jag formulerade betygskriterier för varje lärandemål, sammanlagt åtta stycken. För varje mål har jag angett hur det examineras (Kann 2007). Tre av målen är inte graderade, det vill säga alla kriterierna är lika. Det var naturligt att göra så på grund av dessa måls natur och hur de examineras (med datorlabbar eller teoritenta). Varje mästarprov består av tre uppgifter av olika svårighetsgrad. En rätt löst uppgift ger E på momentet, två ger C och tre ger A. Uppgifternas svårighetsgrad motsvarar betygskriterierna för relevanta mål. Eftersom mästarproven redovisas muntligt kan eleven korrigera mindre fel och ofullständigheter i den inlämnade skriftliga lösningen under redovisningen. Teoritentan utförs i storsal och följs omedelbart av genomgång av lösningarna och rättningsmallen. Varje tentand får sedan rätta en (anonym) kamrats tenta. Slutligen snabbgranskar jag rättningen. När jag införde betygskriterier ersatte jag problemtentan med en munta för högre betyg. Jag ville gå ifrån den kompensatoriska examinationen (Ekecrantz 2007), och då såg jag ingen möjlighet att behålla problemtentan. På muntan begär tentanden att få frågor på en viss betygsnivå och får då visa att han kan det som krävs för det betyget för alla mål som han tidigare inte examinerats på på den nivån.
  •  
10.
  • Kann, Viggo (författare)
  • Så lika är orden
  • 2008
  • Ingår i: Språktidningen. - 1654-5028. ; :4, s. 32-33
  • Tidskriftsartikel (populärvet., debatt m.m.)
  •  
Skapa referenser, mejla, bekava och länka
  • Resultat 1-10 av 18

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy