↓ Direkt till sidans innehåll
↓ Direkt till sidans sekundära innehåll (sidomenyn)

Träfflista för sökning "id:"swepub:oai:DiVA.org:kth-8797" "

Sökning: id:"swepub:oai:DiVA.org:kth-8797"

Resultat 1-1 av 1

Sortera/gruppera träfflistan

Sortering: Träffar per sida:

Numrering	Referens	Omslagsbild	Hitta
1.	Johansson, Christopher, 1977-, et al. (författare) Reinforcement Learning Based on a Bayesian Confidence Propagating Neural Network 2003 Konferensbidrag (refereegranskat)abstract We present a system capable of reinforcement learning (RL) based on the Bayesian confidence propagating neural network (BCPNN). The system is called BCPNNRL and its architecture is somewhat motivated by parallels to biology. We analyze the systems properties and we benchmark it against a simple Monte Carlo (MC) based RL algorithm, pursuit RL methods, and the Associative Reward Penalty (AR-P) algorithm. The system is used to solve the n-armed bandit problem, pattern association, and path finding in a maze.

Skapa referenser, mejla, bekava och länka

Länka till träfflistan

Resultat 1-1 av 1

Avgränsa träffmängd

Typ av publikation: konferensbidrag (1)

Typ av innehåll: refereegranskat (1)

Författare/redaktör: Lansner, Anders (1); Johansson, Christoph ... (1); Raicevic, Peter (1)

Lärosäte: Kungliga Tekniska Högskolan (1)

Språk: Engelska (1)

Forskningsämne (UKÄ/SCB): Naturvetenskap (1)

År: 2003 (1)

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

Copyright © LIBRIS - Nationella bibliotekssystem
LIBRIS.kb.se

pil uppåt

Stäng

Kopiera och spara länken för att återkomma till aktuell vy