SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:lup.lub.lu.se:17f70ca1-ff4f-4e4a-b571-66daef21bfa5"
 

Sökning: id:"swepub:oai:lup.lub.lu.se:17f70ca1-ff4f-4e4a-b571-66daef21bfa5" > Connecting firm's w...

Connecting firm's web scraped textual content to body of science : Utilizing microsoft academic graph hierarchical topic modeling

Hajikhani, Arash (författare)
VTT Technical Research Center of Finland, Espoo
Pukelis, Lukas (författare)
Public Policy and Management Institute
Suominen, Arho (författare)
VTT Technical Research Center of Finland, Espoo
visa fler...
Ashouri, Sajad (författare)
VTT Technical Research Center of Finland, Espoo
Schubert, Torben (författare)
Lund University,Lunds universitet,CIRCLE,Institutionen för designvetenskaper,Institutioner vid LTH,Lunds Tekniska Högskola,Department of Design Sciences,Departments at LTH,Faculty of Engineering, LTH,Fraunhofer Institute for Systems and Innovation Research
Notten, Ad (författare)
Maastricht University: School of Business and Economics
Cunningham, Scott W. (författare)
University of Strathclyde
visa färre...
 (creator_code:org_t)
Elsevier BV, 2022
2022
Engelska.
Ingår i: MethodsX. - : Elsevier BV. - 2215-0161. ; 9
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • This paper demonstrates a method to transform and link textual information scraped from companies' websites to the scientific body of knowledge. The method illustrates the benefit of Natural Language Processing (NLP) in creating links between established economic classification systems with novel and agile constructs that new data sources enable. Therefore, we experimented on the European classification of economic activities (known as NACE) on sectoral and company levels. We established a connection with Microsoft Academic Graph hierarchical topic modeling based on companies' website content. Central to the operationalization of our method are a web scraping process, NLP and a data transformation/linkage procedure. The method contains three main steps: data source identification, raw data retrieval, and data preparation and transformation. These steps are applied to two distinct data sources.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Språkteknologi (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Language Technology (hsv//eng)

Nyckelord

A method for creating a linkage between web scraped company's websitecontent to scientific literature topical structure
Economic classification scheme
Knowledge transformation
Natural language processing
Web scraping

Publikations- och innehållstyp

art (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

  • MethodsX (Sök värdpublikationen i LIBRIS)

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy