↓ Direkt till sidans innehåll
↓ Direkt till sidans sekundära innehåll (sidomenyn)

Sökning: WFRF:(Talebi Mazraeh Shahi Mohammad Sadegh 1982 ) > Variance-Aware Regr...

9 av 9
Föregående post
Nästa post
Till träfflistan

Variance-Aware Regret Bounds for Undiscounted Reinforcement Learning in MDPs

Talebi Mazraeh Shahi, Mohammad Sadegh, 1982- (författare): KTH,Reglerteknik

Maillard, Odalric Ambrym (författare): INRIA Lille – Nord Europe, Villeneuve d’Ascq, France

(creator_code:org_t)

ML Research Press, 2018
2018
Engelska.
Ingår i: Proceedings of 29th International Conference on Algorithmic Learning Theory, ALT 2018. - : ML Research Press. ; , s. 770-805

Relaterad länk:: https://urn.kb.se/re...

Konferensbidrag (refereegranskat)

Abstract Ämnesord

Stäng

Till lärosätets databas

9 av 9
Föregående post
Nästa post
Till träfflistan

Hitta mer i SwePub

Av författaren/redakt...: Talebi Mazraeh S ...; Maillard, Odalri ...

Om ämnet

TEKNIK OCH TEKNOLOGIER: TEKNIK OCH TEKNO ...; och Elektroteknik oc ...; och Reglerteknik

Artiklar i publikationen: Proceedings of 2 ...

Av lärosätet: Kungliga Tekniska Högskolan

Sök utanför SwePub

Sök vidare i:: Google; Google Book Search; Google Scholar

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

Copyright © LIBRIS - Nationella bibliotekssystem
LIBRIS.kb.se

pil uppåt

Stäng

Kopiera och spara länken för att återkomma till aktuell vy