SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Mariani P)
 

Sökning: WFRF:(Mariani P) > A new Q-learning al...

A new Q-learning algorithm based on the Metropolis criterion

Guo, MZ (författare)
Liu, Y (författare)
Malec, Jacek (författare)
Lund University,Lunds universitet,Data Vetenskap,Naturvetenskapliga fakulteten,Computer Science,Faculty of Science
 (creator_code:org_t)
2004
2004
Engelska.
Ingår i: IEEE Transactions on Systems, Man, and Cybernetics, Part B: Cybernetics. - 1083-4419. ; 34:5, s. 2140-2143
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • The balance between exploration and exploitation is one of the key problems of action selection in Q-learning. Pure exploitation causes the agent to reach the locally optimal policies quickly, whereas excessive exploration degrades the performance of the Q-learning algorithm even if it may accelerate the learning process and allow avoiding the locally optimal policies. In this paper, finding the optimum policy in Q-learning is de scribed as search for the optimum solution in combinatorial optimization. The Metropolis criterion of simulated annealing algorithm is introduced in order to balance exploration and exploitation of Q-learning, and the modified Q-learning algorithm based on this criterion, SA-Q-learning, is presented. Experiments show that SA-Q-learning converges more quickly than Q-learning or Boltzmann exploration, and that the search does not suffer of performance degradation due to excessive exploration.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)

Nyckelord

reinforcement learning
Q-learning
metropolis criterion
exploitation
exploration

Publikations- och innehållstyp

art (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Guo, MZ
Liu, Y
Malec, Jacek
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datavetenskap
Artiklar i publikationen
IEEE Transaction ...
Av lärosätet
Lunds universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy