SwePub
Sök i SwePub databas

  Utökad sökning

Träfflista för sökning "L4X0:1401 5919 "

Sökning: L4X0:1401 5919

  • Resultat 1-37 av 37
Sortera/gruppera träfflistan
   
NumreringReferensOmslagsbildHitta
1.
  •  
2.
  • Malm, Per (författare)
  • Specificitetshypotesen : Om preteritumformer med referens till nutid och framtid
  • 2016
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • I svenskan har preteritumformen vanligtvis referens till dåtid (Teleman, Hellberg & Andersson 1999c:204). Ibland används den dock för att uttrycka nu- eller framtidsreferens som t.ex. i följande mening: Oj vad fin din klänning var!, dvs. personen tycker att klänningen är fin vid talögonblicket. Sådana fall kallar jag inkongruent preteritum. Tidigare förklaringar, eller beskrivningar, av inkongruent preteritum har pragmatiska förtecken (Teleman m.fl. 1999c:226–228), bl.a. som ett resultat av subjektiva uttryck för förvåning eller artighet, här kallat SAG-hypotesen. SAG-hypotesens förklaringar av inkongruent preteritum är dock något problematiska och glider in i varandra. Här jämförs SAG-hypotesen med vad jag kallar specificitetshypotesen: att talare använder inkongruent preteritum med både specifik referens och nutidsreferens för att undvika en generell utsaga. Resultatet visar att specificitetshypotesen bättre förklarar inkongruensen än SAG-hypotesen. 1 629 inkongruenta fall av preteritum i diskussionsforumet Familjeliv har samlats in via en korpusbaserad metod (Tognini-Bonelli 2001) med verktyget Korp (Borin, Forsberg & Roxendal 2012). Resultaten antyder att ett skifte från inkongruent preteritum till presens leder till generell referens, likt följande satser: (i) ost och kex passade bra ihop, (ii) ost och kex passar bra ihop. Exempel (i) är inte generaliserande som (ii), utan specifik, dvs. att den endast gäller för någons specifika upplevelse av kombinationen ost och kex, inte att dessa livsmedel generellt passar bra ihop. Jag argumenterar för att sådana fall förklaras av specificitetshypotesen. Det finns visst stöd för specificitetshypotesen. Inkongruent preteritum kan t.ex. inte modifieras av generiska satsadverbial (t.ex. alltid eller aldrig) utan att förlora sin inkongruens. Dessutom förekommer inkongruent preteritum sällan tillsammans med vissa subjektiva fraser, (t.ex. enligt mig). Detta antyder att subjektiva markörer är kommunikativt redundanta då specifik referens här ofta är subjektiv. Tidigare pragmatiska förklaringar kan då även kopplas till en förklarande semantik. För vidare studier föreslås en korpusdriven metod för materialinsamling för att undersöka om inkongruent preteritum förekommer i andra former och om specificitetshypotesen förklarar dessa. Men generell referens har också kopplats till nominalfraser (Hellberg 1987). Därför föreslås också en beskrivande grammatik av inkongruenta preteritum i vilken man antar symboliska enheter som sträcker sig över ordnivå.
  •  
3.
  •  
4.
  •  
5.
  •  
6.
  •  
7.
  •  
8.
  •  
9.
  •  
10.
  • Hammarstedt, Martin, et al. (författare)
  • Sparv 5 Developer’s Guide
  • 2022
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • The Sparv Pipeline developed by Språkbanken Text is a text analysis tool run from the command line. This Developer’s Guide describes its general structure and key concepts and serves as an API documentation. Most importantly, it describes how to write plugins for Sparv 5 so that you can add your own functions to the toolkit.
  •  
11.
  • Hammarstedt, Martin, et al. (författare)
  • Sparv 5 User Manual
  • 2022
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • The Sparv Pipeline developed by Språkbanken Text is a text analysis tool run from the command line. This user manual describes how to get Sparv 5 up and running on your own machine, how to configure it and how to use it for annotating your own corpora.
  •  
12.
  • Karlsson, Susanna, 1976 (författare)
  • Alumnundersökning 2019. Språkkonsultprogrammet, Göteborgs universitet
  • 2020
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • I den här rapporten återges resultatet från en enkätundersökning som genomfördes i december 2019 till och med januari 2020 och som riktade sig till alumner från kullarna 1–3 på Språkkonsultprogrammet, Göteborgs universitet. Enkäten gick ut till 46 personer som genomfört någon del av programmets sista termin. Av dessa valde 25 att delta. Deltagarna besvarade frågor om hur de har upplevt tiden efter ex amen, hur arbetssituationen ser ut i dag, samt hur de upplever programmet, nu när det har gått några år sedan examen.
  •  
13.
  • Landberg, Joel, 1980 (författare)
  • SAOL och vardagsspråket – bruklighet i sex upplagor från 1900-talet
  • 2013
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • Denna uppsats handlar om hur bruklighetsmarkören , vardagligt, användes i de sex upplagor av Svenska Akademiens ordlista som gavs ut under nittonhundratalet. Bruklighetsmarkörer är intressanta då de är svåra att entydigt tolka som ett deskriptivt (”så här används ordet”) eller normativt (”så här ska ordet användas”) inslag i ordböcker. Det material som studeras i uppsatsen är bokstaven p och förorden i de sex upplagorna. De 401 ord på p som beskrivits som i någon upplaga har sammanställts och deras utveckling har följts genom århundradet. Jag har sedan jämfört orden med de olika upplagornas förtexter – förord och inledningar – för att se om det som skrivits där är konsekvent med själva ordlisteinnehållet. Några av orden har också studerats med hjälp av korpusar, alltså stora mängder autentisk text från olika tider. Någon sorts jämförelse med språkbruket är nödvändig för att det alls ska vara meningsfullt att studera hur olika redaktörer förhållit sig till det de anser är . Om ett ord till exempel förblir enligt SAOL men börjar användas ofta i dagspressen har ju SAOL:s behandling av såväl det enskilda ordet som markören faktiskt förändrats. Olika upplagor och redaktörer pekar åt olika håll, och ingen utveckling är strikt linjär. Allmänt kan dock sägas att SAOL:s öppenhet gentemot vardagsspråket ökade under nittonhundratalet, även om förändringen i lemmalistorna inte alltid varit i takt med den i förtexterna.
  •  
14.
  • Landqvist, Hans, 1958 (författare)
  • Aktörer, ansvar och rättigheter i en kursplan för blivande svensklärare. Styrdokument inom högskolan ur ett textforskningsperspektiv med språkvetenskaplig grund : Persons involved, responsibilities, and rights in a university-level syllabus for future teachers of Swedish. A linguistically based textual analysis of steering documents in higher education
  • 2011
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • Det primära syftet för denna fallstudie är att identifiera, beskriva och försöka förklara några av de utmärkande egenskaperna hos (sub)genren ’kursplan inom högskolan’, vilken ingår i den övergripande genren ’styrdokument’. Därför genomförs,redovisas och diskuteras en analys av en kursplan, vilken avser den första terminens studier för blivande lärare i svenska för de senare åren i grundskolan och i gymnasieskolan. Centralt för studien är vilket ansvar och vilka rättigheter som olika aktörer i texten har samt vem eller vilka som kan sägas ha makt över den och vem eller vilka som får makt genom texten. Studiens sekundära syfte är att ge blivande svensklärare tillgång till en språkvetenskapligt grundad exempelanalys av en viktig typ av texter för alla kategorier av studenter. För lärarstudenter är den övergripande genren ’styrdokument’ dessutom en central genre under hela deras kommande yrkesliv; de skall läsa och tillämpa centrala och lokala styrdokument samt producera lokala styrdokument. Studien är textvetenskaplig med en språkvetenskaplig utgångspunkt men den har dessutom en samhällsvetenskaplig anknytning. Materialet för studien utgörs av kursplanen LSV110, Svenska för blivande lärare, Grundkurs, 30 högskolepoäng. Den teoretisk-metodiska utgångspunkten för studien är den analysmodell som presenteras i Lennart Hellspongs och Per Ledins Vägar genom texten. Handbok i brukstextanalys (1997) med sin förankring i Hallidays sociosemiotiska modell. I studien redovisas och diskuteras resultaten av olika delundersökningar utifrån textens kontext (situationell kontext, intertextuell kontext och kulturkontext), textens struktur (textuell, ideationell och interpersonell struktur) samt textens stil (textuella, ideationella, interpersonella och kontextuella stildrag). Bilden av kursplanen är relativt entydig i fråga om de studerade textuella, interpersonella och kontextuella stildragen. Den är mer nominal än verbal med en förhållandevis tung stil, men dess stil är både koncentrerad och yvig. Kursplanen är monologisk, relativt formell, objektiv och opersonlig samt relativt distanserad. Den är en klart skriftspråklig text, och den är både allmänspråklig och fackspråklig. Influenser från fackområdena pedagogik, didaktik, kulturvetenskap, litteraturvetenskap och språkvetenskap visar sig genom den ideationella strukturen. Därtill framträder kursplanen som en juridisk text, vilket visar sig i fråga om de tre strukturerna samt kontexten som omger texten och som den ingår i. Vad beträffar den ideationella strukturen är bilden mindre entydig. Kursplanen får sägas vara mer statisk än dynamisk men den uppvisar ändå egenskaper som kan antas bidra till en dynamisk karaktär. I fråga om de båda ideationella stilaxlarna konkret–abstrakt och exakt–vag är situationen densamma som i fråga om den textuella stilaxeln koncentrerad–yvig, dvs. intrycket blir inte entydigt. Resultatet av fallstudien är en beskrivning av stilen hos kursplanen i sig men också en beskrivning av texten som en representant för (sub)genren ’kursplan inom högskolan’, dvs. en genreanalys. Resultaten av analysen diskuteras och jämförelser görs med tidigare studier av den övergripande genren ’styrdokument’ med olika (sub)genrer. Studien avslutas med ett antal förslag till fortsatt forskning som gäller (sub)genren ’styrdokument inom högskolan’.
  •  
15.
  • Landqvist, Hans, 1958 (författare)
  • ”– Kuka … puhhuu …? stönade Esaias. Vem pratar?” Litterär flerspråkighet och språkväxling i Mikael Niemis roman Mannen som dog som en lax : “–Kuka … puhhuu …? Esaias moaned. Who is talking?” Literary multilingualism and literary code switching in Mikael Niemi’s novel Mannen som dog som en lax [‘The man who died like a salmon’]
  • 2012
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • I den här rapporten redovisas en fallstudie av litterär flerspråkighet och språkväxling utifrån Mikael Niemis roman Mannen som dog som en lax (2006). Romanen utspelar sig huvudsakligen i svenska Tornedalen, där många människor är tvåspråkiga och talar både meänkieli och svenska. Sändaren anser sig inte vara tvåspråkig och det är sannolikt inte heller flertalet tänkta mottagare. Däremot är språkliga förhållanden centrala för romanens tema. Svenska är huvudspråk i romanen och inslag på meänkieli/finska och andra språk svarar för en mindre del av textmassan. I det undersökta materialet, som utgör cirka hälften av det totala antalet textsidor i romanen, dominerar implicit språkväxling i form av metaspråkliga kommentarer och kontextuella ledtrådar. Den klart vanligaste typen av explicit språkväxling är svenska > meänkieli/finska. Explicit språkväxling markeras mestadels i texten, vanligen med kursiv stil och/eller översättning till svenska, och den uppträder främst i romanens dialog. Det är ovanligt med morfologisk integrering av belägg för explicit språkväxling i huvudspråket svenska, medan det är mer vanligt med syntaktisk integrering. Denna förekommer till största delen i olika former av anföring. I materialet finns exempel på att språkväxling används för att försöka återge ett autentiskt språkbruk och skildra en autentisk språkmiljö. Därtill finns exempel på att Tornedalen, tornedalingar och meänkieli mer skildras som exotiska fenomen jämfört med majoritetssamhället och människor som hör hemma i detta. Likaså finns det exempel på att läsare, beroende på sina kunskaper om Tornedalen, dess förhållanden och meänkieli/finska, kan inkluderas eller exkluderas i partier av Mannen som dog som en lax genom olika språkväxlingsstrategier som Mikael Niemi använder.
  •  
16.
  •  
17.
  • Landqvist, Hans, 1958 (författare)
  • Kvinnorna i Svenskt översättarlexikon. En ögonblicksbild utifrån översättningssociologiska och metalexikografiska utgångspunkter
  • 2019
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • I den här rapporten redovisas en empirisk undersökning om de kvinnliga översättare som behandlas i den version av Svenskt översättarlexikon (SÖL) som var tillgänglig det första kvartalet 2017. Undersökningen bygger på den presentation som jag genomförde vid konferensen ”Den andra halvan av nationallitteraturen. Om översättningarnas plats i svensk litteratur-, språk- och kulturhistoria”. Konferensen arrangerades vid Stockholms universitet den 26 november 2016. Artiklar som bygger på presentationerna vid denna konferens, tillsammans med artiklar utifrån konferensen ”Världslitteraturen och dess svenska röster. Bidrag till svensk översättningshistoria”, arrangerad av Kungl. Vitterhetsakademien den 9 och 10 februari 2017, ska utkomma i en volym under redaktion av Lars Kleberg. I väntan på denna volym publicerar jag här en rapport som utgår från mitt bidrag vid konferensen ”Den andra halvan av nationallitteraturen. Om översättningarnas plats i svensk litteratur-, språk- och kulturhistoria”. Några partier av det ursprungliga bidraget ingår inte i rapporten, medan andra är mer utvecklade. När det gäller de utvecklade partierna handlar det för det första om principerna som kan tänkas ligga bakom utformningen av SÖL som helhet med tanke på vilka översättare som hittills ingår i, och vilka som kan tänkas få utrymme i, lexikonet. För det andra handlar det om vissa tillägg till konferensbidraget, vilka jag har gjort för att texten ska bli mera tillgänglig för läsare som inte har en förankring inom översättningsvetenskapens fält. Dessutom tillfogar jag här ett avsnitt om några möjligheter till fortsatt forskning utifrån SÖL och några andra elektroniska resurser vilka också uppmärksammar översättare. Eventuella synpunkter på rapporten är mycket välkomna!
  •  
18.
  •  
19.
  •  
20.
  •  
21.
  • Ljunglöf, Peter, 1971, et al. (författare)
  • Assessing the quality of Språkbanken’s annotations
  • 2019
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • Most of the corpora in Språkbanken Text consist of unannotated plain text, such as almost all newspaper texts, social media texts, novels and official documents. We also have some corpora that are manually annotated in different ways, such as Talbanken (annotated for part-of-speech and syntactic structure), and the Stockholm Umeå Corpus (annotated for part-of-speech). Språkbanken’s annotation pipeline Sparv aims to automatise the work of automatically annotating all our corpora, while still keeping the manual annotations intact. When all corpora are annotated, they can be made available, e.g., in the corpus searh tools Korp and Strix. Until now there has not been any comprehensive overview of the annotation tools and models that Sparv has been using for the last eight years. Some of them have not been updated since the start, such as the part-of-speech tagger Hunpos and the dependency parser MaltParser. There are also annotation tools that we still have not included, such as a constituency-based parser. Therefore Språkbanken initiated a project with the aim of conducting such an overview. This document is the outcome of that project, and it contains descriptions of the types of manual and automatic annotations that we currently have in Språkbanken, as well as an incomplete overview of the state-of-the-art with regards to annotation tools and models.
  •  
22.
  • Loenheim, Lisa, 1979 (författare)
  • En ny bild av "bliva". Bakgrunden till hur "bliva" blev hjälpverb
  • 2013
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • Denna uppsats handlar om hur bliva successivt i forn- och nysvenskan tränger tillbaka varda, i takt med att bliva får nya användningsområden. Utöver ursprungsbetydelsen, ’stanna kvar, förbli’, finns redan i fornsvenskan exempel på en användning där bliva i konstruktion med predikativ (t.ex. bliva frisk) anger förändring och betyder ’övergå till att vara, varda’. Från fornsvenskans sista decennier påträffas belägg på bliva i en ny funktion: som passivbildande hjälpverb, vid sidan av varda. I uppsatsen ifrågasätts den traditionella förklaringsmodellen, enligt vilken bliva i de nya funktionerna är att betrakta som ett betydelselån från medellågtyska bliven med motsvarande funktioner. Resultatet av min granskning visar att bliven i betydelsen ’övergå till att vara, varda’ inte tycks ha varit fullt produktivt i den medeltida lågtyskan, utan i huvudsak använts i en lexikaliserad verbfras: dot bliven – och att bliven som passivbildande hjälpverb tycks ha varit en ytterst marginell företeelse i medellågtyskan, vid sidan av hjälpverbet werden. Som en alternativ förklaring anför jag att den nya betydelsen ’varda’ hos bliva kan ha uppkommit genom tvetydiga exempel, t.ex. de många fornsvenska beläggen på bliva död, där det är semantiskt rimligt att tolka in en förändring: ’övergå till att vara död’, i stället för ’stanna kvar, varande död’ – och jag framför hypotesen att det är denna verbfras som lånats in från lågtyskan, jfr dot bliven. När verbfrasen bliva död väl fått betydelsen ’övergå till att vara död’, kan man tänka sig en semantisk generalisering, genom vilken bliva allmänt ges tolkningsmöjligheten ’övergå till att vara’ i konstruktion med predikativ. Varda och bliva blir då i många fall utbytbara som huvudverb. I nästa steg, för att upprätthålla symmetrin i systemet, kan man tänka sig ytterligare en generalisering, genom vilken bliva blir ett fullgott alternativ till varda också i funktionen som hjälpverb.
  •  
23.
  •  
24.
  • Megyesi, Beáta, et al. (författare)
  • SweLL pseudonymization guidelines
  • 2021
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • The current document is a part of the SweLL guidelines series consisting of four parts which aim to report how we have worked on the material and which decisions we have made. Guidelines are available for each step in the manual annotation process, including: • Transcription guidelines • Pseudonymization guidelines • Normalization guidelines • Correction annotation guidelines We specifically described all processes in English to make sure our principles and experience can be of help to people working on other learner infrastructure projects independent of the language.
  •  
25.
  •  
26.
  •  
27.
  • Rudebeck, Lisa, et al. (författare)
  • SweLL correction annotation guidelines
  • 2021
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • The current document is a part of the SweLL guidelines series consisting of four parts which aim to report how we have worked on the material and which decisions we have made. Guidelines are available for each step in the manual annotation process, including: • Transcription guidelines • Pseudonymization guidelines • Normalization guidelines • Correction annotation guidelines We specifically described all processes in English to make sure our principles and experience can be of help to people working on other learner infrastructure projects independent of the language.
  •  
28.
  • Rudebeck, Lisa, et al. (författare)
  • SweLL normalization guidelines
  • 2021
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • The current document is a part of the SweLL guidelines series consisting of four parts which aim to report how we have worked on the material and which decisions we have made. Guidelines are available for each step in the manual annotation process, including: • Transcription guidelines • Pseudonymization guidelines • Normalization guidelines • Correction annotation guidelines We specifically described all processes in English to make sure our principles and experience can be of help to people working on other learner infrastructure projects independent of the language.
  •  
29.
  • Sandberg, Malin, 1989- (författare)
  • "Livskvalitet när du blir äldre" : En legitimeringsanalys av textmaterial från Kungsbacka kommuns äldreomsorg
  • 2013
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • Äldre är enligt tidigare forskning en heterogen del av befolkningen, med stora variationer i livsvillkor. Undersökningens syfte är mot bakgrund av detta att undersöka hur äldre som kategori konstrueras när Kungsbacka kommun i sitt informationsmaterial om äldreomsorg legitimerar sin verksamhet. Detta görs genom en språklig och multimodal legitimeringsanalys av sex broschyrer om Kungsbacka kommuns äldreomsorg, varpå resultaten diskuteras med hjälp av en intersektionell tolkningsram som tar fasta på hur olika sociala kategoriseringar samverkar.Studien har visat att den språkliga legitimeringen huvudsakligen sker genom instrumentell rationalisering och moralisk värdering, och därmed främst framhåller syften med verksamheten och ett antal värden som anses viktiga. Den multimodala legitimeringen sker i första hand genom moralisk värdering. Verksamheten legitimeras genom att trygghet, gemenskap, oberoende, det egna hemmet och generell livskvalitet framhålls. Genom legitimeringarna konstrueras också en homogen bild av den äldre som etniskt svensk, relativt välstående, frisk och oberoende. Detta sker främst i bilderna, där den äldre tydligast är fokuserad.
  •  
30.
  • Strandberg, Viktoria, 1994- (författare)
  • Initiala annex i en teckenbaserad konstruktionsgrammatik
  • 2019
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • Left-dislocations (Sw. initial dislokation ’initial dislocation’, ID) and hanging scenes (Sw. fritt initial annex som motsvarar ett fritt adverbial i den inre satsen ’free initial annex corresponding to a free adverbial in the main clause’, FIA) are both structures with a phrase preceding the main clause. While ID also has a pronominal copy, referring to that phrase, inside the main clause, no such copy is found in the main clause following FIA. This report investigates ID and FIA in a Construction Grammar framework, describing ID and FIA as constructions consisting of a form paired with an information structural meaning. An analysis of 295 instances of ID and FIA, most of them collected from spoken language, shows that ID can be construed in many ways, but that half of the instances of ID can be divided into three different construction patterns, where the following aspects are the same: the syntactic form of the ID and the pronominal copy, the syntactic function of the pronominal copy, the position of the pronominal copy, and the type of clause in which the pronominal copy occurs. In terms of information structure, the most interesting result is that ID does not only have the information structural status topic, but also scene, vocative topic and, at times, focus. The instances of FIA all have the information structural status scene, and these are used in any syntactic form instantiating that scene. Furthermore, ID and FIA are in this report formalized as constructions in the framework of Sign-based Construction Grammar, which is introduced in and applied to Swedish for the first time. The constructions are also formulated as entries in the construction database Swedish Constructicon. Finally, this report presents a preliminary sketch of how ID and FIA can be included in a constructicon network of Swedish, i.e. the mental network our grammars consist of. The proposed network introduces another categorization of ID and FIA than the one being used in the Swedish reference grammar, but the categories of the reference grammar could also be incorporated in this draft.
  •  
31.
  •  
32.
  • Thyberg, Kajsa, 1975 (författare)
  • Det-konstruktioners betydelse - Hur svenska konstruktioner med formellt och egentligt subjekt realiserar processer
  • 2015
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • I denna uppsats studeras betydelse som realiseras av svenska det-konstruktioner med formellt och egentligt subjekt. Konstruktionerna är av tre typer: presenteringskonstruktioner, konstruktioner med passiv och konstruktioner med postponerade led. De teoretiska utgångspunkterna är traditionell grammatik och systemisk-funktionell grammatik. Syftet är att undersöka hur konstruktionerna beskriver världen och hur ideationella processer som realiseras av konstruktionerna kan analyseras, varvid transitivitets tillämpas på meningar ur Språkbankens korpus Talbanken. Resultatet visar att konstruktionerna till största del realiserar relationella processer, varav de flesta är attributiva och existentiella. Resultatet visar även att processtyper och konstruktionstyper påverkar varandra, då vissa verb kan realisera olika processtyper beroende på om de står i en presenteringskontruktion eller i en konstruktion med ett postponerat led. Det framgår att omständigheter kan ha en viktig betydelse för existentiella processer med kopulaverb, och därtill påverka tolkningen av det som expletivt eller referentiellt. Jag diskuterar dessutom analyser av processer med verb som uppträder som grammatiska metaforer och därmed har en mer komplicerad analys. Undersökningen visar att traditionell och systemiskfunktionell grammatik kan komplettera varandra.
  •  
33.
  •  
34.
  • Volodina, Elena, 1973, et al. (författare)
  • SweLL transcription guidelines, L2 essays
  • 2021
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • The current document is a part of the SweLL guidelines series consisting of four parts which aim to report how we have worked on the material and which decisions we have made. Guidelines are available for each step in the manual annotation process, including: • Transcription guidelines • Pseudonymization guidelines • Normalization guidelines • Correction annotation guidelines We specifically described all processes in English to make sure our principles and experience can be of help to people working on other learner infrastructure projects independent of the language.
  •  
35.
  • Wilhelmsson, Kenneth, 1976 (författare)
  • Adverbialkarakteristik för praktisk informationsextraktion i svensk text - Projektrapport
  • 2012
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • Den aktuella rapporten beskriver ett projekt som i första hand har inneburit ett praktiskt arbete syftande till att skapa en automatiserad process som returnerar frågeled, t.ex. varifrån, för adverbialled, t.ex. inifrån rummet, i svensk digital text. Det är en utbytesprocess som behövs av rent praktiska skäl i uppgiften frågegenerering, vilken innebär att en samling frågor som en text besvarar genereras snabbt automatiskt. Denna process finner sin plats i program som på olika sätt syftar till att ge informationsåtkomst i godtycklig okänd svensk text. Det är i detta tillämpningsfall fråga om att på något sätt öppna upp för den stora informationsmängd som i datalogiskt perspektiv ligger ’ostrukturerad’, dvs. i naturligt språk-form. Syftet med att avgöra lämpliga frågeled (ofta till en hv-form) för förekommande satsled i text har dock förmodligen en mer allmän relevans än användning i nämnda programtyp. Förutom att också behövas i andra liknande datalingvistiska applikationer kan själva frågeställningen rymmas inom ramarna för grundforskningen. De vanliga semantiskt grundade adverbialkategorierna (vilka skiljer sig åt mellan olika grammatikor) definierar gärna adverbialkategorier just genom att beskriva vilka slags frågor de besvarar. Att som här sikta på att avgöra frågeled för adverbial är en mer detaljerad uppgift än att avgöra adverbialkategori. Den praktiska metod som implementerats i projektet kan sönderdelas i ett antal steg som antas vara allmängiltiga och svåra att undgå med det aktuella syftet. Indata till programmet är ett i princip godtyckligt adverbialled som användaren i prototypprogrammet kan skriva in. De nämnda steg som tar vid är de följande. 1) En uppmärkning med ordklass- och annan grammatisk information för varje löpord inleder. Detta sker med en statistisk trigrambaserad s.k. Hidden Markov-modell. 2/3) Ett avgörande av vilken strukturtyp som ledet har (bisats, PP, etc.) görs utifrån löporden med informationen i föregående steg. Intimt förknippat med denna uppgift är bestämning av huvudord, och för flera led även bestämning av andra signifikanta komponenter som rektionshuvudord. Lösningen till detta delsteg heter rangbaserad chunkning. 4) De steg som följer härefter skiljer sig mycket åt beroende på den aktuella strukturtypen. För prepositionsfraser undersöks t.ex. preposition och, beroende på vilken preposition det är fråga om, rektionshuvudord, dess grundform och andra ingående textsegment. I arbetet har t.ex. SweFN (Borin, Dannélls, Forsberg, Toporowska Gronostaj, & Kokkinakis, 2010) delvis undersökts för att eventuellt förbättra avgörandet av substantivsemantik, vilket ofta blir relevant för PP-adverbial. Rapporten visar hur uppgiften praktiskt sett varierar mycket i svårighetsgrad, från de fall där adverbialet utgörs av t.ex. particip-, adverbfraser eller bisatser, då en mappning till motsvarande frågeled ofta kan ske direkt utifrån huvudordet – till de mest komplicerade fallen av PP och s.k. som-fraser där kombinationer av huvudord, rektionshuvudord, dess grundform samt annan syntaktisk och semantisk information krävs för att urskilja förekomsters särskilda frågemotsvarigheter. Ett återkommande tema i det praktiska arbetet är undantag som behöver kännas igen. Exempelvis kategorin satsadverbial, som kan anta många olika strukturella former men som ändå oftast renderar resultatet ’ingen frågemotsvarighet’, måste kännas igen uttryckligen (ev. tillsammans med andra med samma frågeledsresultat). Även processen som helhet bygger emellertid programmeringstekniskt på grundfall och undantag. I många fall, som t.ex. för i-PP finns det en mängd olika motsvarigheter och vad som får utgöra grundfall i programmet blir en empirisk/heuristisk fråga under det att regler skrivs mot faktiska förekomster av adverbial i Stockholm Umeå Corpus (Hädanefter SUC). Att i liksom andra prepositioner kan sägas ha en prototypisk riktningsbetydelse betyder inte att var nödvändigtvis ska fungera som utgångsfall. Det förekommer ’lager’ av undantag inom olika strukturslag i programmet men även externt motiverade sådana utgående från huvudverbet, som genom valensmatchning kan klargöra att ett adverbial är ’prepositionsobjekt’ och därmed får andra omfrågningsegenskaper. De användargränssnitt som skapats och använts för regelskrivande utifrån faktiska exempel har tillåtit viss omedelbar regeluppdatering och återkontroll vid åsynen av felaktiga resultat. Det är också genom tillägg av nya undantagsregler i någon mening som programmet rimligen ska kunna förbättras framöver från den aktuella kvalitetsnivån. Korrektheten som uppnåtts hittills är inte kvantitativt övertygande men detta arbete som saknar föregångare möjliggör kontinuerlig förbättring genom programmet. Projektet visar att mappningsuppgiften…
  •  
36.
  • Wilhelmsson, Kenneth, 1976 (författare)
  • Huvudansatser för parsningsmetoder. Om programutvecklingens förutsättningar i en svensk kontext
  • 2016
  • Rapport (övrigt vetenskapligt/konstnärligt)abstract
    • Syftet med denna text var att ge en inblick i området (syntaktisk) parsning. Tanken var att ge en bild av utvecklingen som var 1) fri från alltför tekniska detaljer, då området är programmeringstekniskt, och 2) beskriven ur ett svenskt perspektiv. Bakgrunden till valet av ämne till texten, som var tänkt att finnas med i antologin Text och kontext, var att parsning är relativt okänt för många personer verksamma inom närliggande områden, samtidigt som det är ett absolut nyckelbegrepp för den som ägnar sig åt datorlingvistik eller språkteknologi. Målet var alltså att ge en ganska allmän utifrånblick på några centrala sidor av utvecklingen, samtidigt som det tydligt är så att den som själv arbetat med utveckling kan ha starka åsikter och preferenser rörande metodval, något som i ärlighetens namn kanske inte heller denna text är lösgjord från. Hur ska det göras? Konsten att utveckla automatisk syntaxanalys av naturlig text kan läras ut från ett flertal perspektiv. Det kan t.ex. ske med fokus på användandet av en viss grammatikformalism, med fokus på beräkningssnabbhet, med fokus på entydiggörande av möjliga ambiguiteter. Tolkningsval kan göras med hjälp av antingen handskrivna regler eller inhämtad statistik. En sorts huvudtema i denna text är hur metoder för parsning på senare år uppvisar förändringar som kanske kan förklaras med att programmen har fått andra användningsområden och att metoderna har anpassats därefter (en annan tolkning är att flera senare system inte längre gör parsning i strikt mening). När detta tänkta ”kapitel” var färdigt fick det kommentaren att det inte var anpassat för antologins målgrupp. Det fick skrivas en annan kapiteltext, men det kom samtidigt ett förslag att publicera texten om parsning här som denna rapport.
  •  
37.
  •  
Skapa referenser, mejla, bekava och länka
  • Resultat 1-37 av 37

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy