SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Fersman Elena)
 

Sökning: WFRF:(Fersman Elena) > BEERL :

  • Terra, AhmadKTH,Mekatronik och inbyggda styrsystem,Ericsson AB, Royal Institute of Technology, Stockholm, 164 83, Sweden (författare)

BEERL : Both Ends Explanations for Reinforcement Learning

  • Artikel/kapitelEngelska2022

Förlag, utgivningsår, omfång ...

  • 2022-10-28
  • MDPI AG,2022
  • printrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:kth-329022
  • https://urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-329022URI
  • https://doi.org/10.3390/app122110947DOI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:art swepub-publicationtype

Anmärkningar

  • QC 20230614
  • Deep Reinforcement Learning (RL) is a black-box method and is hard to understand because the agent employs a neural network (NN). To explain the behavior and decisions made by the agent, different eXplainable RL (XRL) methods are developed; for example, feature importance methods are applied to analyze the contribution of the input side of the model, and reward decomposition methods are applied to explain the components of the output end of the RL model. In this study, we present a novel method to connect explanations from both input and output ends of a black-box model, which results in fine-grained explanations. Our method exposes the reward prioritization to the user, which in turn generates two different levels of explanation and allows RL agent reconfigurations when unwanted behaviors are observed. The method further summarizes the detailed explanations into a focus value that takes into account all reward components and quantifies the fulfillment of the explanation of desired properties. We evaluated our method by applying it to a remote electrical telecom-antenna-tilt use case and two openAI gym environments: lunar lander and cartpole. The results demonstrated fine-grained explanations by detailing input features’ contributions to certain rewards and revealed biases of the reward components, which are then addressed by adjusting the reward’s weights.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • Inam, Rafia,1974-KTH,Mekatronik och inbyggda styrsystem,Ericsson AB, Royal Institute of Technology, Stockholm, 164 83, Sweden(Swepub:kth)u1n9z4n1 (författare)
  • Fersman, ElenaKTH,Mekatronik och inbyggda styrsystem,Ericsson Inc., Royal Institute of Technology, Santa Clara, 95054, CA, United States(Swepub:kth)u1d2m69p (författare)
  • KTHMekatronik och inbyggda styrsystem (creator_code:org_t)

Sammanhörande titlar

  • Ingår i:Applied Sciences: MDPI AG12:21, s. 10947-2076-3417

Internetlänk

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Terra, Ahmad
Inam, Rafia, 197 ...
Fersman, Elena
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
och Datavetenskap
Artiklar i publikationen
Applied Sciences
Av lärosätet
Kungliga Tekniska Högskolan

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy