SwePub
Tyck till om SwePub Sök här!
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Borga Magnus)
 

Sökning: WFRF:(Borga Magnus) > A Binary Competitio...

A Binary Competition Tree for Reinforcement Learning

Borga, Magnus (författare)
Linköpings universitet,Bildbehandling,Tekniska högskolan
Knutsson, Hans (författare)
Linköpings universitet,Bildbehandling,Tekniska högskolan
 (creator_code:org_t)
Linköping, Sweden : Linköping University, Department of Electrical Engineering, 1994
Engelska 19 s.
Serie: LiTH-ISY-R, 1400-3902 ; 1623
  • Rapport (övrigt vetenskapligt/konstnärligt)
Abstract Ämnesord
Stäng  
  • A robust, general and computationally simple reinforcement learning system is presented. It uses a channel representation which is robust and continuous. The accumulated knowledge is represented as a reward prediction function in the outer product space of the input- and output channel vectors. Each computational unit generates an output simply by a vector-matrix multiplication and the response can therefore be calculated fast. The response and a prediction of the reward are calculated simultaneously by the same system, which makes TD-methods easy to implement if needed. Several units can cooperate to solve more complicated problems. A dynamic tree structure of linear units is grown in order to divide the knowledge space into a sufficiently number of regions in which the reward function can be properly described. The tree continuously tests split- and prune criteria in order to adapt its size to the complexity of the problem.

Nyckelord

Reinforcement learning
TECHNOLOGY
TEKNIKVETENSKAP

Publikations- och innehållstyp

vet (ämneskategori)
rap (ämneskategori)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Borga, Magnus
Knutsson, Hans
Delar i serien
LiTH-ISY-R,
Av lärosätet
Linköpings universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy