Sökning: onr:"swepub:oai:DiVA.org:lnu-126305" >
Optimized Machine L...
-
Olsson, Tobias,1974-Linnéuniversitetet,Institutionen för datavetenskap och medieteknik (DM)
(författare)
Optimized Machine Learning Input for Evolutionary Source Code to Architecture Mapping
- Artikel/kapitelEngelska2023
Förlag, utgivningsår, omfång ...
-
Springer,2023
-
printrdacarrier
Nummerbeteckningar
-
LIBRIS-ID:oai:DiVA.org:lnu-126305
-
https://urn.kb.se/resolve?urn=urn:nbn:se:lnu:diva-126305URI
-
https://doi.org/10.1007/978-3-031-36889-9_28DOI
Kompletterande språkuppgifter
-
Språk:engelska
-
Sammanfattning på:engelska
Ingår i deldatabas
Klassifikation
-
Ämneskategori:ref swepub-contenttype
-
Ämneskategori:kon swepub-publicationtype
Anmärkningar
-
Automatically mapping source code to architectural modules is an interesting and difficult problem. Mapping can be considered a classification problem, and machine learning approaches have been used to automatically generate mappings. Feature engineering is an essential element of machine learning. We study which source code features are important for an algorithm to function effectively. Additionally, we examine stemming and data cleaning. We systematically evaluate various combinations of features on five datasets created from JabRef, TeamMates, ProM, and two Hadoop subsystems. The systems are open-source with well-established mappings. We find that no single set of features consistently provides the highest performance, and even the subsystems of Hadoop have varied optimal feature combinations. Stemming provided minimal benefit, and cleaning the data is not worth the effort, as it also provided minimal benefit.
Ämnesord och genrebeteckningar
Biuppslag (personer, institutioner, konferenser, titlar ...)
-
Ericsson, Morgan,Docent,1973-Linnéuniversitetet,Institutionen för datavetenskap och medieteknik (DM)(Swepub:lnu)moeraa
(författare)
-
Wingkvist, Anna,PhD,1976-Linnéuniversitetet,Institutionen för datavetenskap och medieteknik (DM)(Swepub:lnu)awimsi
(författare)
-
LinnéuniversitetetInstitutionen för datavetenskap och medieteknik (DM)
(creator_code:org_t)
Sammanhörande titlar
-
Ingår i:Software Architecture. ECSA 2022 Tracks and Workshops. ECSA 2022: Springer, s. 421-43597830313688829783031368899
Internetlänk
Hitta via bibliotek
Till lärosätets databas