↓ Direkt till sidans innehåll
↓ Direkt till sidans sekundära innehåll (sidomenyn)

Tyck till om SwePub Sök här!

Träfflista för sökning "hsv:(NATURVETENSKAP) hsv:(Data och informationsvetenskap) hsv:(Språkteknologi) "

Sökning: hsv:(NATURVETENSKAP) hsv:(Data och informationsvetenskap) hsv:(Språkteknologi)

Resultat 1-10 av 3635

Sortera/gruppera träfflistan

Sortering: Träffar per sida:

Numrering	Referens	Omslagsbild	Hitta
1.	Wilhelmsson, Kenneth, 1976 (författare) Huvudansatser för parsningsmetoder. Om programutvecklingens förutsättningar i en svensk kontext 2016 Rapport (övrigt vetenskapligt/konstnärligt)abstract Syftet med denna text var att ge en inblick i området (syntaktisk) parsning. Tanken var att ge en bild av utvecklingen som var 1) fri från alltför tekniska detaljer, då området är programmeringstekniskt, och 2) beskriven ur ett svenskt perspektiv. Bakgrunden till valet av ämne till texten, som var tänkt att finnas med i antologin Text och kontext, var att parsning är relativt okänt för många personer verksamma inom närliggande områden, samtidigt som det är ett absolut nyckelbegrepp för den som ägnar sig åt datorlingvistik eller språkteknologi. Målet var alltså att ge en ganska allmän utifrånblick på några centrala sidor av utvecklingen, samtidigt som det tydligt är så att den som själv arbetat med utveckling kan ha starka åsikter och preferenser rörande metodval, något som i ärlighetens namn kanske inte heller denna text är lösgjord från. Hur ska det göras? Konsten att utveckla automatisk syntaxanalys av naturlig text kan läras ut från ett flertal perspektiv. Det kan t.ex. ske med fokus på användandet av en viss grammatikformalism, med fokus på beräkningssnabbhet, med fokus på entydiggörande av möjliga ambiguiteter. Tolkningsval kan göras med hjälp av antingen handskrivna regler eller inhämtad statistik. En sorts huvudtema i denna text är hur metoder för parsning på senare år uppvisar förändringar som kanske kan förklaras med att programmen har fått andra användningsområden och att metoderna har anpassats därefter (en annan tolkning är att flera senare system inte längre gör parsning i strikt mening). När detta tänkta ”kapitel” var färdigt fick det kommentaren att det inte var anpassat för antologins målgrupp. Det fick skrivas en annan kapiteltext, men det kom samtidigt ett förslag att publicera texten om parsning här som denna rapport.
2.	Wilhelmsson, Kenneth, 1976 (författare) Autentiska och artificiella frågor till svensk text Automatisk frågegenerering jämfört med användares frågor för informationsåtkomst : Authentic and artificial questions to Swedish text Automatically generated questions versus user-generated questions for information access 2015 Annan publikation (övrigt vetenskapligt/konstnärligt)abstract Informationssökning mot ostrukturerade datakällor som fri text är ett av de områden där användargränssnitt med fri formulering i naturligt språk har tagits fram. I ett sådant, eventuellt AI-betonat, system kan några grundläggande svårigheter från användarperspektivet märkas. En sådan svårighet är att en användare inte känner till huruvida en fråga som hon avser att ställa egentligen kan besvaras av den aktuella texten. Denna svårighet, tillsammans med andra, som de kraftiga variationsmöjligheterna för formen för ett giltigt svar på en ställd fråga, riskerar att leda till att användarintrycken av systemtypen blir negativa. De moment som behöver ingå i ett sådant frågebaserat informationssystems funktionssätt måste på något sätt inbegripa en mappning av frågeled i frågan (t.ex. när) till den form och grammatisk funktion som svaret i texten måste ha (för frågan när normalt ett tidsadverbial). Bland annat denna iakttagelse inbjuder till användning av automatisk frågegenerering (question generation, QG). Frågegenerering innebär att frågor som en naturlig text besvarar initialt utvinns av ett program som samlar in dem i explicit form. Tanken för användning i informationssökning är att en användare i gränssnittet enbart ska kunna ställa just dessa frågor, vilka faktiskt besvaras av texten. Denna studie gäller just de frågor som ett automatiskt frågegenereringssystem för svenska kan, och genom vidare utveckling, skulle kunna generera för godtycklig digital svensk text. Även om mängden automatiskt genererade frågor och frågeformuleringar kan bli mycket stor, utrymmesmässigt många gånger större än ursprungstexten, så är det tydligt att den beskrivna metoden för frågegenerering för svenska inte kan och troligen inte heller kommer att kunna förmås att skapa alla de frågor och frågeformuleringar som en vanlig användare skulle anse att en viss text besvarar. Men hur väl fungerar då automatiskt genererade frågor i detta sammanhang? Denna uppsats kretsar kring en användarundersökning där undersökningsdeltagare har ombetts att formulera frågor som texter besvarar, och som anses vara relevanta frågor. Den resulterande samlingen frågor undersöktes och kategoriserades. Resultatet av undersökningens huvudfråga visar att bara 20-25 % av användarnas frågeformuleringar skulle kunna genereras direkt automatiskt med aktuell ansats – utan vissa informationstekniska förbättringar. Uppsatsen föreslår viss ny terminologi för detta outforskade område, bl.a. för att skilja mellan de olika grader av processkrav som generering av olika frågeslag från text kräver.
3.	Ellison, Magnus, et al. (författare) En implementation för domänoberoende textkategorisering 2001 Annan publikation (övrigt vetenskapligt/konstnärligt)
4.	Norlund, Tobias, 1991, et al. (författare) Transferring Knowledge from Vision to Language: How to Achieve it and how to Measure it? 2021 Ingår i: Proceedings of the Fourth BlackboxNLP Workshop on Analyzing and Interpreting Neural Networks for NLP, pp. 149-162, Punta Cana, Dominican Republic. - : Association for Computational Linguistics. Konferensbidrag (refereegranskat)abstract Large language models are known to suffer from the hallucination problem in that they are prone to output statements that are false or inconsistent, indicating a lack of knowledge. A proposed solution to this is to provide the model with additional data modalities that complements the knowledge obtained through text. We investigate the use of visual data to complement the knowledge of large language models by proposing a method for evaluating visual knowledge transfer to text for uni- or multimodal language models. The method is based on two steps, 1) a novel task querying for knowledge of memory colors, i.e. typical colors of well-known objects, and 2) filtering of model training data to clearly separate knowledge contributions. Additionally, we introduce a model architecture that involves a visual imagination step and evaluate it with our proposed method. We find that our method can successfully be used to measure visual knowledge transfer capabilities in models and that our novel model architecture shows promising results for leveraging multimodal knowledge in a unimodal setting.
5.	Yun, Yixiao, 1987, et al. (författare) Maximum-Likelihood Object Tracking from Multi-View Video by Combining Homography and Epipolar Constraints 2012 Ingår i: 6th ACM/IEEE Int'l Conf on Distributed Smart Cameras (ICDSC 12), Oct 30 - Nov.2, 2012, Hong Kong. - 9781450317726 ; , s. 6 pages- Konferensbidrag (refereegranskat)abstract This paper addresses problem of object tracking in occlusion scenarios, where multiple uncalibrated cameras with overlapping fields of view are used. We propose a novel method where tracking is first done independently for each view and then tracking results are mapped between each pair of views to improve the tracking in individual views, under the assumptions that objects are not occluded in all views and move uprightly on a planar ground which may induce a homography relation between each pair of views. The tracking results are mapped by jointly exploiting the geometric constraints of homography, epipolar and vertical vanishing point. Main contributions of this paper include: (a) formulate a reference model of multi-view object appearance using region covariance for each view; (b) define a likelihood measure based on geodesics on a Riemannian manifold that is consistent with the destination view by mapping both the estimated positions and appearances of tracked object from other views; (c) locate object in each individual view based on maximum likelihood criterion from multi-view estimations of object position. Experiments have been conducted on videos from multiple uncalibrated cameras, where targets experience long-term partial or full occlusions. Comparison with two existing methods and performance evaluations are also made. Test results have shown effectiveness of the proposed method in terms of robustness against tracking drifts caused by occlusions.
6.	Wilhelmsson, Kenneth, 1976 (författare) Om förutsättningarna för språkligt datorstöd på ordnivån och uppåt 2017 Ingår i: Text och kontext - perspektiv på textanalys / Karin Helgesson, Hans Lundqvist, Anna Lyngfelt, Andreas Nord & Åsa Wengelin (red.). - Malmö : Gleerups. - 9789140693648 ; , s. 207-228 Bokkapitel (övrigt vetenskapligt/konstnärligt)
7.	Al Sabbagh, Khaled, 1987, et al. (författare) Improving Data Quality for Regression Test Selection by Reducing Annotation Noise 2020 Ingår i: Proceedings - 46th Euromicro Conference on Software Engineering and Advanced Applications, SEAA 2020. ; , s. 191-194 Konferensbidrag (refereegranskat)abstract Big data and machine learning models have been increasingly used to support software engineering processes and practices. One example is the use of machine learning models to improve test case selection in continuous integration. However, one of the challenges in building such models is the identification and reduction of noise that often comes in large data. In this paper, we present a noise reduction approach that deals with the problem of contradictory training entries. We empirically evaluate the effectiveness of the approach in the context of selective regression testing. For this purpose, we use a curated training set as input to a tree-based machine learning ensemble and compare the classification precision, recall, and f-score against a non-curated set. Our study shows that using the noise reduction approach on the training instances gives better results in prediction with an improvement of 37% on precision, 70% on recall, and 59% on f-score.
8.	Ferro, Nicola, et al. (författare) PROMISE Retreat Report Prospects and Opportunities for Information Access Evaluation 2013 Ingår i: ACM SIGIR Forum. - : Association for Computing Machinery (ACM). - 0163-5840 .- 1558-0229. ; 46:2, s. 60-84 Tidskriftsartikel (övrigt vetenskapligt/konstnärligt)abstract The PROMISE network of excellence organized a two-days brainstorming workshop on 30th and 31st May 2012 in Padua, Italy, to discuss and envisage future directions and perspectives for the evaluation of information access and retrieval systems in multiple languages and multiple media. This document reports on the outcomes of this event and provides details about the six envisaged research lines: search applications; contextual evaluation; challenges in test collection design and exploitation; component-based evaluation; ongoing evaluation; and signal-aware evaluation. The ultimate goal of the PROMISE retreat is to stimulate and involve the research community along these research lines and to provide funding agencies with effective and scientifically sound ideas for coordinating and supporting information access research.
9.	Samoaa, Hazem Peter, et al. (författare) A systematic mapping study of source code representation for deep learning in software engineering 2022 Ingår i: Iet Software. - : Institution of Engineering and Technology (IET). - 1751-8806 .- 1751-8814. ; 16:4, s. 351-385 Tidskriftsartikel (refereegranskat)abstract The usage of deep learning (DL) approaches for software engineering has attracted much attention, particularly in source code modelling and analysis. However, in order to use DL, source code needs to be formatted to fit the expected input form of DL models. This problem is known as source code representation. Source code can be represented via different approaches, most importantly, the tree-based, token-based, and graph-based approaches. We use a systematic mapping study to investigate i detail the representation approaches adopted in 103 studies that use DL in the context of software engineering. Thus, studies are collected from 2014 to 2021 from 14 different journals and 27 conferences. We show that each way of representing source code can provide a different, yet orthogonal view of the same source code. Thus, different software engineering tasks might require different (combinations of) code representation approaches, depending on the nature and complexity of the task. Particularly, we show that it is crucial to define whether the DL approach requires lexical, syntactical, or semantic code information. Our analysis shows that a wide range of different representations and combinations of representations (hybrid representations) are used to solve a wide range of common software engineering problems. However, we also observe that current research does not generally attempt to transfer existing representations or models to other studies even though there are other contexts in which these representations and models may also be useful. We believe that there is potential for more reuse and the application of transfer learning when applying DL to software engineering tasks.
10.	Huhnstock, Nikolas Alexander, 1988-, et al. (författare) An Infinite Replicated Softmax Model for Topic Modeling 2019 Ingår i: Modeling Decisions for Artificial Intelligence. - Cham : Springer. - 9783030267728 - 9783030267735 ; , s. 307-318 Konferensbidrag (refereegranskat)abstract In this paper, we describe the infinite replicated Softmax model (iRSM) as an adaptive topic model, utilizing the combination of the infinite restricted Boltzmann machine (iRBM) and the replicated Softmax model (RSM). In our approach, the iRBM extends the RBM by enabling its hidden layer to adapt to the data at hand, while the RSM allows for modeling low-dimensional latent semantic representation from a corpus. The combination of the two results is a method that is able to self-adapt to the number of topics within the document corpus and hence, renders manual identification of the correct number of topics superfluous. We propose a hybrid training approach to effectively improve the performance of the iRSM. An empirical evaluation is performed on a standard data set and the results are compared to the results of a baseline topic model. The results show that the iRSM adapts its hidden layer size to the data and when trained in the proposed hybrid manner outperforms the base RSM model.

Skapa referenser, mejla, bekava och länka

Länka till träfflistan

Resultat 1-10 av 3635

Avgränsa träffmängd

Typ av publikation: konferensbidrag (2350); tidskriftsartikel (553); bokkapitel (259); rapport (141); doktorsavhandling (79); proceedings (redaktörskap) (76); visa fler...; annan publikation (58); licentiatavhandling (44); samlingsverk (redaktörskap) (37); bok (21); forskningsöversikt (11); recension (4); konstnärligt arbete (2); patent (1); visa färre...

Typ av innehåll: refereegranskat (2658); övrigt vetenskapligt/konstnärligt (945); populärvet., debatt m.m. (27)

Författare/redaktör: Borin, Lars, 1957 (181); Nivre, Joakim, 1962- (139); Dobnik, Simon, 1977 (129); Larsson, Staffan, 19 ... (124); Kokkinakis, Dimitrio ... (121); Tiedemann, Jörg (112); visa fler...; Edlund, Jens (96); Cooper, Robin, 1947 (90); Volodina, Elena, 197 ... (88); Gustafson, Joakim (80); Beskow, Jonas (75); Johansson, Richard, ... (74); Ljunglöf, Peter, 197 ... (73); House, David (72); Nivre, Joakim (69); Forsberg, Markus, 19 ... (67); Dannélls, Dana, 1976 (64); Stymne, Sara, 1977- (60); Hardmeier, Christian (56); Ranta, Aarne, 1963 (55); Skantze, Gabriel (52); Howes, Christine, 19 ... (48); Bernardy, Jean-Phili ... (47); Sundberg, Johan (47); Tahmasebi, Nina, 198 ... (46); Jönsson, Arne, 1955- (46); Megyesi, Beata (43); Megyesi, Beáta, 1971 ... (43); Al Moubayed, Samer (38); Granström, Björn (38); Borin, Lars (37); Chatzikyriakidis, St ... (35); Adesam, Yvonne, 1975 (34); Hjalmarsson, Anna (34); Engwall, Olov (34); Kuhlmann, Marco, 197 ... (34); Boye, Johan (34); Pilán, Ildikó, 1985 (33); Wirén, Mats, 1954- (33); Heldner, Mattias (33); Karlgren, Jussi (32); Skantze, Gabriel, 19 ... (31); Sågvall Hein, Anna (31); Salvi, Giampiero (30); Sahlgren, Magnus (29); Maraev, Vladislav, 1 ... (29); Strömbergsson, Sofia (29); Bouma, Gerlof, 1979 (28); Alfter, David, 1986 (28); Friberg Heppin, Kari ... (28); visa färre...

Lärosäte: Göteborgs universitet (1335); Kungliga Tekniska Högskolan (831); Uppsala universitet (747); Stockholms universitet (257); Linköpings universitet (231); Chalmers tekniska högskola (211); visa fler...; Lunds universitet (97); Umeå universitet (91); Linnéuniversitetet (91); RISE (53); Högskolan i Borås (30); Högskolan i Halmstad (27); Luleå tekniska universitet (24); Södertörns högskola (18); Örebro universitet (15); Karlstads universitet (14); Karolinska Institutet (12); Institutet för språk och folkminnen (11); Mälardalens universitet (10); Mittuniversitetet (10); Jönköping University (8); Blekinge Tekniska Högskola (8); Malmö universitet (7); Högskolan i Skövde (7); Försvarshögskolan (5); Högskolan i Gävle (4); Sveriges Lantbruksuniversitet (3); Högskolan Kristianstad (1); Handelshögskolan i Stockholm (1); Enskilda Högskolan Stockholm (1); visa färre...

Språk: Engelska (3493); Svenska (125); Tyska (4); Spanska (4); Estniska (2); Franska (1); visa fler...; Danska (1); Italienska (1); Odefinierat språk (1); Portugisiska (1); Nygrekiska (1); Slovenska (1); visa färre...

Forskningsämne (UKÄ/SCB): Naturvetenskap (3632); Humaniora (1005); Samhällsvetenskap (240); Teknik (104); Medicin och hälsovetenskap (45); Lantbruksvetenskap (2)

År

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

Copyright © LIBRIS - Nationella bibliotekssystem
LIBRIS.kb.se

pil uppåt

Stäng

Kopiera och spara länken för att återkomma till aktuell vy