SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:kth-8797"
 

Sökning: id:"swepub:oai:DiVA.org:kth-8797" > Reinforcement Learn...

  • Johansson, Christopher,1977-KTH,Numerisk analys och datalogi, NADA,Beräkningsbiologi, CB (författare)

Reinforcement Learning Based on a Bayesian Confidence Propagating Neural Network

  • Artikel/kapitelEngelska2003

Förlag, utgivningsår, omfång ...

  • 2003
  • printrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:kth-8797
  • https://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-8797URI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:kon swepub-publicationtype

Anmärkningar

  • We present a system capable of reinforcement learning (RL) based on the Bayesian confidence propagating neural network (BCPNN). The system is called BCPNNRL and its architecture is somewhat motivated by parallels to biology. We analyze the systems properties and we benchmark it against a simple Monte Carlo (MC) based RL algorithm, pursuit RL methods, and the Associative Reward Penalty (AR-P) algorithm. The system is used to solve the n-armed bandit problem, pattern association, and path finding in a maze.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • Raicevic, PeterKTH,Numerisk analys och datalogi, NADA(Swepub:kth)u1j91g3r (författare)
  • Lansner, AndersKTH,Numerisk analys och datalogi, NADA(Swepub:kth)u12s8cr8 (författare)
  • KTHNumerisk analys och datalogi, NADA (creator_code:org_t)

Internetlänk

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy