SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:ri-59869"
 

Sökning: id:"swepub:oai:DiVA.org:ri-59869" > Quality Assurance o...

Quality Assurance of Generative Dialog Models in an Evolving Conversational Agent Used for Swedish Language Practice

Borg, Markus (författare)
RISE,Mobilitet och system
Bengtsson, J. (författare)
Lund University, Sweden
Osterling, H. (författare)
Lund University, Sweden
visa fler...
Hagelborn, A. (författare)
NordAxon AB, Sweden
Gagner, Isabella (författare)
RISE,Mobilitet och system
Tomaszewski, Piotr (författare)
RISE,Mobilitet och system
visa färre...
 (creator_code:org_t)
2022-10-17
2022
Engelska.
Ingår i: Proceedings - 1st International Conference on AI Engineering - Software Engineering for AI, CAIN 2022. - New York, NY, USA : Institute of Electrical and Electronics Engineers Inc.. - 9781450392754 ; , s. 22-32
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Due to the migration megatrend, efficient and effective second-language acquisition is vital. One proposed solution involves AI-enabled conversational agents for person-centered interactive language practice. We present results from ongoing action research targeting quality assurance of proprietary generative dialog models trained for virtual job interviews. The action team elicited a set of 38 requirements for which we designed corresponding automated test cases for 15 of particular interest to the evolving solution. Our results show that six of the test case designs can detect meaningful differences between candidate models. While quality assurance of natural language processing applications is complex, we provide initial steps toward an automated framework for machine learning model selection in the context of an evolving conversational agent. Future work will focus on model selection in an MLOps setting.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Programvaruteknik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Software Engineering (hsv//eng)

Nyckelord

action research
AI quality
conversational agent
generative dialog model
requirements engineering
software testing
Learning algorithms
Natural language processing systems
Quality assurance
Software agents
Conversational agents
Dialogue models
Megatrends
Model Selection
Requirement engineering
Software testings
Swedishs

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy