SwePub
Sök i LIBRIS databas

  Utökad sökning

WFRF:(Takemoto N)
 

Sökning: WFRF:(Takemoto N) > Last-Iterate Conver...

Last-Iterate Convergence with Full and Noisy Feedback in Two-Player Zero-Sum Games

Abe, Kenshi (författare)
CyberAgent, Inc.
Ariu, Kaito (författare)
KTH,Reglerteknik,CyberAgent, Inc.
Sakamoto, Mitsuki (författare)
visa fler...
Toyoshima, Kentaro (författare)
University of Electro-Communications
Iwasaki, Atsushi (författare)
visa färre...
CyberAgent, Inc Reglerteknik (creator_code:org_t)
MLResearchPress, 2023
2023
Engelska.
Ingår i: Proceedings of The 26th International Conference on Artificial Intelligence and Statistics. - : MLResearchPress. ; , s. 7999-8028
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • This paper proposes Mutation-Driven Multiplicative Weights Update (M2WU) for learning an equilibrium in two-player zero-sum normal-form games and proves that it exhibits the last-iterate convergence property in both full and noisy feedback settings. In the former, players observe their exact gradient vectors of the utility functions. In the latter, they only observe the noisy gradient vectors. Even the celebrated Multiplicative Weights Update (MWU) and Optimistic MWU (OMWU) algorithms may not converge to a Nash equilibrium with noisy feedback. On the contrary, M2WU exhibits the last-iterate convergence to a stationary point near a Nash equilibrium in both feedback settings. We then prove that it converges to an exact Nash equilibrium by iteratively adapting the mutation term. We empirically confirm that M2WU outperforms MWU and OMWU in exploitability and convergence rates.

Ämnesord

NATURVETENSKAP  -- Data- och informationsvetenskap (hsv//swe)
NATURAL SCIENCES  -- Computer and Information Sciences (hsv//eng)

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Abe, Kenshi
Ariu, Kaito
Sakamoto, Mitsuk ...
Toyoshima, Kenta ...
Iwasaki, Atsushi
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Data och informa ...
Artiklar i publikationen
Av lärosätet
Kungliga Tekniska Högskolan

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy