SwePub
Sök i LIBRIS databas

  Utökad sökning

L773:9783642238079 OR L773:9783642238086
 

Sökning: L773:9783642238079 OR L773:9783642238086 > Preference elicitat...

Preference elicitation and inverse reinforcement learning

Rothkopf, C.A. (författare)
Dimitrakakis, Christos, 1975 (författare)
Chalmers tekniska högskola,Chalmers University of Technology
 (creator_code:org_t)
ISBN 9783642238079
Berlin, Heidelberg : Springer Berlin Heidelberg, 2011
2011
Engelska.
Ingår i: Machine Learning and Knowledge Discovery in Databases, ECML 2011. - Berlin, Heidelberg : Springer Berlin Heidelberg. - 9783642238079
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • We state the problem of inverse reinforcement learning in terms of preference elicitation, resulting in a principled (Bayesian) statistical formulation. This generalises previous work on Bayesian inverse reinforcement learning and allows us to obtain a posterior distribution on the agent's preferences, policy and optionally, the obtained reward sequence, from observations. We examine the relation of the resulting approach to other statistical methods for inverse reinforcement learning via analysis and experimental results. We show that preferences can be determined accurately, even if the observed agent's policy is sub-optimal with respect to its own preferences. In that case, significantly improved policies with respect to the agent's preferences are obtained, compared to both other methods and to the performance of the demonstrated policy. © 2011 Springer-Verlag.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences (hsv//eng)

Nyckelord

preference elicitation
Inverse reinforcement learning
decision theory
Bayesian inference

Publikations- och innehållstyp

kon (ämneskategori)
ref (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Rothkopf, C.A.
Dimitrakakis, Ch ...
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
Artiklar i publikationen
Machine Learning ...
Av lärosätet
Chalmers tekniska högskola

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy