SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:liu-53328"
 

Sökning: id:"swepub:oai:DiVA.org:liu-53328" > Reinforcement Learn...

Reinforcement Learning Adaptive Control and Explicit Criterion Maximization

Landelius, Tomas (författare)
Linköpings universitet,Bildbehandling,Tekniska högskolan
Knutsson, Hans (författare)
Linköpings universitet,Bildbehandling,Tekniska högskolan
 (creator_code:org_t)
Linköping, Sweden : Linköping University, Department of Electrical Engineering, 1996
Engelska 8 s.
Serie: LiTH-ISY-R, 1400-3902 ; 1829
  • Rapport (övrigt vetenskapligt/konstnärligt)
Abstract Ämnesord
Stäng  
  • This paper reviews an existing algorithm for adaptive control based on explicit criterion maximization (ECM) and presents an extended version suited for reinforcement learning tasks. Furthermore, assumptions under which the algorithm convergences to a local maxima of a long term utility function are given. Such convergence theorems are very rare for reinforcement learning algorithms working with continuous state and action spaces. A number of similar algorithms, previously suggested to the reinforcement learning community, are briefly surveyed in order to give the presented algorithm a place in the field. The relations between the different algorithms is exemplified by checking their consistency on a simple problem of linear quadratic regulation (LQR).

Nyckelord

lReinforcement learning
Adaptive control
TECHNOLOGY
TEKNIKVETENSKAP

Publikations- och innehållstyp

vet (ämneskategori)
rap (ämneskategori)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Landelius, Tomas
Knutsson, Hans
Delar i serien
LiTH-ISY-R,
Av lärosätet
Linköpings universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy