SwePub
Sök i LIBRIS databas

  Utökad sökning

L773:9798350301243 OR L773:9798350301250
 

Sökning: L773:9798350301243 OR L773:9798350301250 > Conformal Off-Polic...

Conformal Off-Policy Evaluation in Markov Decision Processes

Russo, Alessio (författare)
KTH,Reglerteknik,Statistical Learning for Control
Foffano, Daniele (författare)
KTH,Reglerteknik,Statistical Learning for Control
Proutiere, Alexandre (författare)
KTH,Reglerteknik
 (creator_code:org_t)
IEEE, 2023
2023
Engelska.
Ingår i: 2023 62ND IEEE CONFERENCE ON DECISION AND CONTROL, CDC. - : IEEE. - 9798350301243 ; , s. 3087-3094
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Reinforcement Learning aims at identifying and evaluating efficient control policies from data. In many real-world applications, the learner is not allowed to experiment and cannot gather data in an online manner (this is the case when experimenting is expensive, risky or unethical). For such applications, the reward of a given policy (the target policy) must be estimated using historical data gathered under a different policy (the behavior policy). Most methods for this learning task, referred to as Off-Policy Evaluation (OPE), do not come with accuracy and certainty guarantees. We present a novel OPE method based on Conformal Prediction that outputs an interval containing the true reward of the target policy with a prescribed level of certainty. The main challenge in OPE stems from the distribution shift due to the discrepancies between the target and the behavior policies. We propose and empirically evaluate different ways to deal with this shift. Some of these methods yield conformalized intervals with reduced length compared to existing approaches, while maintaining the same certainty level. 

Ämnesord

TEKNIK OCH TEKNOLOGIER  -- Elektroteknik och elektronik -- Reglerteknik (hsv//swe)
ENGINEERING AND TECHNOLOGY  -- Electrical Engineering, Electronic Engineering, Information Engineering -- Control Engineering (hsv//eng)
NATURVETENSKAP  -- Data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences (hsv//eng)

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Russo, Alessio
Foffano, Daniele
Proutiere, Alexa ...
Om ämnet
TEKNIK OCH TEKNOLOGIER
TEKNIK OCH TEKNO ...
och Elektroteknik oc ...
och Reglerteknik
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
Artiklar i publikationen
2023 62ND IEEE C ...
Av lärosätet
Kungliga Tekniska Högskolan

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy