SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:liu-114450"
 

Sökning: id:"swepub:oai:DiVA.org:liu-114450" > A novel approach to...

A novel approach to locomotion learning: Actor-Critic architecture using central pattern generators and dynamic motor primitives

Li, Cai (författare)
Högskolan i Skövde,Institutionen för informationsteknologi,Forskningscentrum för Informationsteknologi,Interaction Lab,University of Skovde, Sweden
Lowe, Robert (författare)
Högskolan i Skövde,Institutionen för informationsteknologi,Forskningscentrum för Informationsteknologi,Interaction Lab,University of Skovde, Sweden
Ziemke, Tom (författare)
Högskolan i Skövde,Linköpings universitet,Interaktiva och kognitiva system,Tekniska högskolan,University of Skovde, Sweden,Institutionen för informationsteknologi,Forskningscentrum för Informationsteknologi,Department of Computer and Information Science, Linköping University, Sweden,Interaction Lab
 (creator_code:org_t)
2014-10-02
2014
Engelska.
Ingår i: Frontiers in Neurorobotics. - : Frontiers. - 1662-5218. ; 8
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • In this article, we propose an architecture of a bio-inspired controller that addresses the problem of learning different locomotion gaits for different robot morphologies. The modeling objective is split into two: baseline motion modeling and dynamics adaptation. Baseline motion modeling aims to achieve fundamental functions of a certain type of locomotion and dynamics adaptation provides a "reshaping" function for adapting the baseline motion to desired motion. Based on this assumption, a three-layer architecture is developed using central pattern generators (CPGs, a bio-inspired locomotor center for the baseline motion) and dynamic motor primitives (DMPs, a model with universal "reshaping" functions). In this article, we use this architecture with the actor-critic algorithms for finding a good "reshaping" function. In order to demonstrate the learning power of the actor-critic based architecture, we tested it on two experiments: (1) learning to crawl on a humanoid and, (2) learning to gallop on a puppy robot. Two types of actor-critic algorithms (policy search and policy gradient) are compared in order to evaluate the advantages and disadvantages of different actor-critic based learning algorithms for different morphologies. Finally, based on the analysis of the experimental results, a generic view/architecture for locomotion learning is discussed in the conclusion.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap -- Datorseende och robotik (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Vision and Robotics (hsv//eng)

Nyckelord

actor-critic; central pattern generators (CPG); reinforcement learning; locomotion control; NAO robot
Interaction Lab (ILAB)

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy