SwePub
Sök i SwePub databas

  Utökad sökning

Träfflista för sökning "WFRF:(Bizzoni Yuri 1989) "

Sökning: WFRF:(Bizzoni Yuri 1989)

  • Resultat 1-10 av 17
Sortera/gruppera träfflistan
   
NumreringReferensOmslagsbildHitta
1.
  • Alfter, David, 1986, et al. (författare)
  • From Distributions to Labels: A Lexical Proficiency Analysis using Learner Corpora
  • 2016
  • Ingår i: Linköping Electronic Conference Proceedings. - : Linköping University Electronic Press. - 1650-3686 .- 1650-3740. - 9789176856338
  • Konferensbidrag (refereegranskat)abstract
    • In this work we look at how information from second language learner essay corpora can be used for the evaluation of unseen learner essays. Using a corpus of learner essays which have been graded by well-trained human assessors using the CEFR scale, we extract a list of word distributions over CEFR levels. For the analysis of unseen essays, we want to map each word to a so-called target CEFR level using this word list. However, the task of mapping from a distribution to a single label is not trivial. We are also investigating how we can evaluate the mapping from distribution to label. We show that the distributional profile of words from the essays, informed with the essays’ levels, consistently overlaps with our frequency-based method, in the sense that words holding the same level of proficiency as predicted by our mapping tend to cluster together in a semantic space. In the absence of a gold standard, this information can be useful to see how often a word is associated with the same level in two different models. Also, in this case we have a similarity measure that can show which words are more central to a given level and which words are more peripheral.
  •  
2.
  • Alfter, David, 1986, et al. (författare)
  • Hybrid Language Segmentation for Historical Documents
  • 2016
  • Ingår i: Proceedings CLiC-it 2016 and EVALITA 2016, Napoli, Italy, December 5-7, 2016. Edited by : Pierpaolo Basile, Anna Corazza, Franco Cutugno, Simonetta Montemagni, Malvina Nissim, Viviana Patti, Giovanni Semeraro, Rachele Sprugnoli. - 1613-0073.
  • Konferensbidrag (refereegranskat)
  •  
3.
  • Bizzoni, Yuri, 1989, et al. (författare)
  • Bigrams and BiLSTMs Two neural networks for sequential metaphor detection
  • 2018
  • Ingår i: Proceedings of the Workshop on Figurative Language Processing at NAACL HLT 2018. 6 June 2018 New Orleans, Louisiana. - New Orleans, Louisiana, USA : Association of Computational Linguistics (ACL). - 9781948087155
  • Konferensbidrag (refereegranskat)abstract
    • We present and compare two alternative deep neural architectures to perform word-level metaphor detection on text: a bi-LSTM model and a new structure based on recursive feedforward concatenation of the input. We discuss different versions of such models and the effect that input manipulation - specifically, reducing the length of sentences and introducing concreteness scores for words - have on their performance.
  •  
4.
  •  
5.
  • Bizzoni, Yuri, 1989, et al. (författare)
  • "Deep" Learning : Detecting Metaphoricity in Adjective-Noun Pairs
  • 2017
  • Ingår i: Proceedings of the Workshop on Stylistic Variation, EMNLP2017, Copenhagen, Denmark, September 7–11, 2017. - Copenhagen, Denmark : Association for Computational Linguistics (ACL). - 9781945626999
  • Konferensbidrag (refereegranskat)abstract
    • Metaphor is one of the most studied and widespread figures of speech and an essential element of individual style. In this paper we look at metaphor identification in Adjective-Noun pairs. We show that using a single neural network combined with pre-trained vector embeddings can outperform the state of the art in terms of accuracy. In specific, the approach presented in this paper is based on two ideas: a) transfer learning via using pre-trained vectors representing adjective noun pairs, and b) a neural network as a model of composition that predicts a metaphoricity score as output. We present several different architectures for our system and evaluate their performances. Variations on dataset size and on the kinds of embeddings are also investigated. We show considerable improvement over the previous approaches both in terms of accuracy and w.r.t the size of annotated training data.
  •  
6.
  • Bizzoni, Yuri, 1989, et al. (författare)
  • Deep Learning of Binary and Gradient Judgements for Semantic Paraphrase
  • 2017
  • Ingår i: Proceedings of IWCS 2017 short papers volume, ACL anthology W17 - 69xx. IWCS 2017 — 12th International Conference on Computational Semantics. Montpellier 19 - 22 September 2017 / edited by Claire Gardent & Christian Retoré.. - : Association of Computational Linguistics.
  • Konferensbidrag (refereegranskat)
  •  
7.
  • Bizzoni, Yuri, 1989 (författare)
  • Detection and Aptness: A study in metaphor detection and aptness assessment through neural networks and distributional semantic spaces
  • 2019
  • Doktorsavhandling (övrigt vetenskapligt/konstnärligt)abstract
    • Metaphor is one of the most prominent, and most studied, figures of speech. While it is considered an element of great interest in several branches of linguistics, such as semantics, pragmatics and stylistics, its automatic processing remains an open challenge. First of all, the semantic complexity of the concept of metaphor itself creates a range of theoretical complications. Secondly, the practical lack of large scale resources for machine learning approaches forces researchers to work under conditions of data scarcity. This compilation thesis provides a set of experiments to (i) automatically detect metaphors and (ii) assess a metaphor's aptness with respect to a given literal equivalent. The first task has already been tackled by a number of studies. We approach it as a way to assess the potentialities and limitations of our approach, before dealing with the second task. For metaphor detection we were able to use existing resources, while we created our own dataset to explore metaphor aptness assessment, which constitutes the most innovative part of this research. In all of the studies presented here, I have used a combination of word embeddings and neural networks. This combination appears particularly effective since pre-trained word embeddings can provide the networks with information necessary to deal with metaphors under conditions of data scarcity. To deal with metaphor aptness assessment, we frame the problem as a case of paraphrase identification. Given a sentence containing a metaphor, the task is to find the best literal paraphrase from a set of candidates. We build a dataset designed for this task, that allows a gradient scoring of various paraphrases with respect to a reference sentence, so that paraphrases are ordered according to their degree of aptness. Therefore, we can use it for both binary classification and ordering tasks. This dataset is annotated through crowd sourcing by an average of 20 annotators for each pair. We then design a deep neural network to be trained on this dataset. We show that its architecture is able achieve encouraging levels of performance, despite the serious limitations of data scarcity in which it is applied. In the final experiment of this compilation, more context is added to a sub-section of the dataset in order to study the effect of extended context on metaphor aptness rating. We show that extended context changes human perception of metaphor aptness and that this effect is reproduced by our neural classifier. The conclusion of the last study is that extended context compresses aptness scores towards the center of the scale, raising low ratings and decreasing high ratings given to paraphrase candidates outside of any context.
  •  
8.
  • Bizzoni, Yuri, 1989, et al. (författare)
  • Diachronic Trends in Homeric Translations
  • 2017
  • Ingår i: Digital Humanities Quarterly. - 1938-4122. ; 11:2
  • Tidskriftsartikel (refereegranskat)abstract
    • Our program compares French and Italian translations of Homer’s Odyssey, from the XVIth to the XXth century. Open data algorithms are still either too dependent on language specifications and databases or unreliable. We hope to overcome these aporias. The Greek text is first cut on anchor points (proper nouns), and so is its corresponding translation ; the corpus is then aligned with our algorithm and divided in fixed chunks. Each Greek chunk is given a fixed ID, allowing us to give its translations the corresponding IDs. Each translation is therefore aligned one to another according to their identification. The alignment of the source to the target is done in three steps (preprocessing, alignment and postprocessing). To align textual chunks we use three main systems: 1, an automatically generated bilingual dictionary of GreekFrench proper nouns ; 2, length and frequency measures ; 3, a dictionary of distributionally related terms .
  •  
9.
  • Bizzoni, Yuri, 1989, et al. (författare)
  • Distributional semantic models for detection of textual entailment
  • 2016
  • Ingår i: The Sixth Swedish language technology conference (SLTC), Umeå University, 17-18 November, 2016, (ed. Björklund, Johanna and Stymne, Sara). - Umeå : Umeå University.
  • Konferensbidrag (refereegranskat)abstract
    • We present our experiments on integrating and evaluating distributional semantics with the recognising textual entailment task (RTE). We consider entailment as semantic similarity between text and hypothesis coupled with additional heuristic, which can be either selecting the top scoring hypothesis or a pre-defined threshold. We show that a distributional model is particularly good at detecting entailment related to “world knowledge”, and that aligning the hypothesis with the text improves detection of lexical entailment.
  •  
10.
  • Bizzoni, Yuri, 1989 (författare)
  • L'alignement Automatique des Traductions d'Homère : le Péril de l'Incalculable
  • 2015
  • Ingår i: International Conference "L'Intraduisible : les méandres de la traduction". Université Evry Val d'Essonne, 3-4 décembre 2015.
  • Konferensbidrag (övrigt vetenskapligt/konstnärligt)abstract
    • Le traitement automatique des langues en matière de traduction a une visée maximaliste : le principe est de fournir utilitairement une solution à toutes les apories de la langue. Tout traducteur automatique va d’abord considérer la langue comme un espace géométrique (permettant une évolution dans un espace-langue) nécessaire (chaque élément de langue faisant système). Le traducteur automatique génère une traduction en partant du principe que chaque mot dans la langue source et dans la langue cible a une place qui n’est que minoritairement arbitraire, ce qui peut être encore contrôlé par la prise en compte de la fréquence à laquelle cet arbitraire se reproduit. Ainsi, le traducteur automatique construit des modèles, identifiant la structure de la séquence source et la reproduisant en la transformant dans la séquence cible. La place des mots dans la géométrie d’une séquence ne doit donc pas être totalement arbitraire, et la réussite du traducteur est proportionnelle à la longueur du corpus qui lui permet de créer et modifier ses modèles. Notre programme d’alignement automatique de traductions part du même principe. Nous disposons d’un corpus de 207 traductions françaises de l’Odyssée d’Homère, et nous souhaitons les comparer automatiquement. Le corpus est constitué de traductions rééditées au moins une fois, depuis le XVIème siècle jusqu’au XXème siècle. Entendons par aligneur de traduction un programme permettant de découper chacun des textes en séries de séquences logiques identifiables, d’associer chacune des séquences d’un texte source à un texte cible et de donner à l’intérieur de ces séquences alignées à chaque mot ou expression source son équivalent dans la séquence cible. A la différence du traducteur automatique, puisque nous ne sommes pas tenus de produire une traduction, mais que nous nous contentons d’aligner des traductions existantes les unes aux autres, nous proposons à l’utilisateur de déterminer le degré de tolérance aux séquences qui resteront non alignées, et donc considérées comme inassociables au texte source. Enfin, pour procéder à l’alignement de toutes les traductions entre elles (en attribuant des identifiants à chacune de leurs séquences en fonction du texte source), nous devons aussi envisager le texte source grec de façon maximaliste : nous n’excluons aucun fragment qui aurait pu être potentiellement traduit dans une des traductions. Si le fragment ajouté est apocryphe, cela est visible dans l’interface, puisque seuls quelques traducteurs l’auront traduit. A l’inverse, si une traduction ne traduit pas un des passages du texte source, cela est aussi visible (le texte cible est signalé comme lacunaire). Le mérite de cette approche est que l’intraduisible devient une affaire de choix du lecteur : selon que l’utilisateur du programme concède ou non au programme la possibilité de laisser des séquences non alignables, la traduction peut être lacunaire ou maximaliste. Dans l’un ou l’autre des cas, le choix est moins celui de l’intraduisible que de l’incalculable. Notre algorithme de calcul d’alignement de séquences n’implique pas, ou à très faible degré, de reconnaissance ou d’identification sémantique. Nous ne déterminons pas l’association du texte source au texte cible en fonction du sens des mots, mais en fonction de leur dissémination géométrique, en prenant le texte comme une structure complexe globale. Cette approche déplace donc le problème fréquemment rencontré de l’intraduisible : il n’y a pas tant d’intraduisible d’une langue à une autre, comme aporie du sens à tous ses niveaux d’une langue à une autre, mais de l’incalculable d’un système linguistique, comme élément géométriquement déterminé, à un autre. Nous mettrons ici en parallèle la démarche de l’homme-traducteur et celle de la machine-traductrice face au texte homérique, puis nous verrons que les apories rencontrées sont empiriquement d’une seule nature, l’incompatibilité d’un schéma langagier à un autre, sémantique ou statistique. Enfin nous verrons que l’approche traditionnelle de la traduction dans le traitement automatique des langues ne saurait se dispenser à long terme d’une approche philologique et sémantique de la langue.
  •  
Skapa referenser, mejla, bekava och länka
  • Resultat 1-10 av 17

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy