SwePub
Tyck till om SwePub Sök här!
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Winther O)
 

Sökning: WFRF:(Winther O) > The Role Of Pretrai...

The Role Of Pretrained Representations For The Ood Generalization Of Rl Agents

Träuble, F. (författare)
Dittadi, A. (författare)
Wüthrich, M. (författare)
visa fler...
Widmaier, F. (författare)
Gehler, P. (författare)
Winther, O. (författare)
Locatello, F. (författare)
Bachem, O. (författare)
Schölkopf, B. (författare)
Bauer, Stefan (författare)
KTH,Intelligenta system,Max Planck Institute for Intelligent Systems, Tübingen, Germany
visa färre...
 (creator_code:org_t)
International Conference on Learning Representations, ICLR, 2022
2022
Engelska.
Ingår i: ICLR 2022 - 10th International Conference on Learning Representations. - : International Conference on Learning Representations, ICLR.
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • Building sample-efficient agents that generalize out-of-distribution (OOD) in real-world settings remains a fundamental unsolved problem on the path towards achieving higher-level cognition. One particularly promising approach is to begin with low-dimensional, pretrained representations of our world, which should facilitate efficient downstream learning and generalization. By training 240 representations and over 10,000 reinforcement learning (RL) policies on a simulated robotic setup, we evaluate to what extent different properties of pretrained VAE-based representations affect the OOD generalization of downstream agents. We observe that many agents are surprisingly robust to realistic distribution shifts, including the challenging sim-to-real case. In addition, we find that the generalization performance of a simple downstream proxy task reliably predicts the generalization performance of our RL agents under a wide range of OOD settings. Such proxy tasks can thus be used to select pretrained representations that will lead to agents that generalize. 

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap -- Datavetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences -- Computer Sciences (hsv//eng)

Nyckelord

Down-stream
Generalisation
Generalization performance
High-level cognition
Learning policy
Low dimensional
Real world setting
Reinforcement learning agent
Reinforcement learnings
Unsolved problems

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Till lärosätets databas

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy