SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:kth-292032"
 

Sökning: id:"swepub:oai:DiVA.org:kth-292032" > A Distributed Prima...

A Distributed Primal-Dual Algorithm for Bandit Online Convex Optimization with Time-Varying Coupled Inequality Constraints

Yi, Xinlei (författare)
KTH,Reglerteknik
Li, Xiuxian (författare)
Nanyang Technol Univ, Sch Elect & Elect Engn, 50 Nanyang Ave, Singapore 639798, Singapore.
Yang, Tao (författare)
Northeastern Univ, State Key Lab Synthet Automat Proc Ind, Shenyang 110819, Peoples R China.
visa fler...
Xie, Lihua (författare)
Nanyang Technol Univ, Sch Elect & Elect Engn, 50 Nanyang Ave, Singapore 639798, Singapore.
Chai, Tianyou (författare)
Northeastern Univ, State Key Lab Synthet Automat Proc Ind, Shenyang 110819, Peoples R China.
Johansson, Karl H., 1967- (författare)
KTH,Reglerteknik
visa färre...
 (creator_code:org_t)
Institute of Electrical and Electronics Engineers (IEEE), 2020
2020
Engelska.
Ingår i: Proceedings 2020 American Control Conference, ACC 2020. - : Institute of Electrical and Electronics Engineers (IEEE). ; , s. 327-332
  • Konferensbidrag (refereegranskat)
Abstract Ämnesord
Stäng  
  • This paper considers distributed bandit online optimization with time-varying coupled inequality constraints. The global cost and the coupled constraint functions are the summations of local convex cost and constraint functions, respectively. The local cost and constraint functions are held privately and only at the end of each period the constraint functions are fully revealed, while only the values of cost functions at queried points are revealed, i.e., in a so called bandit manner. A distributed bandit online primal-dual algorithm with two queries for the cost functions per period is proposed. The performance of the algorithm is evaluated using its expected regret, i.e., the expected difference between the outcome of the algorithm and the optimal choice in hindsight, as well as its constraint violation. We show that O(T-c) expected regret and O(T1-c/2) constraint violation are achieved by the proposed algorithm, where T is the total number of iterations and c is an element of [0.5, 1) is a user-defined trade-off parameter. Assuming Slater's condition, we show that O(root T) expected regret and O(root T) constraint violation are achieved. The theoretical results are illustrated by numerical simulations.

Ämnesord

TEKNIK OCH TEKNOLOGIER  -- Elektroteknik och elektronik -- Reglerteknik (hsv//swe)
ENGINEERING AND TECHNOLOGY  -- Electrical Engineering, Electronic Engineering, Information Engineering -- Control Engineering (hsv//eng)

Publikations- och innehållstyp

ref (ämneskategori)
kon (ämneskategori)

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Yi, Xinlei
Li, Xiuxian
Yang, Tao
Xie, Lihua
Chai, Tianyou
Johansson, Karl ...
Om ämnet
TEKNIK OCH TEKNOLOGIER
TEKNIK OCH TEKNO ...
och Elektroteknik oc ...
och Reglerteknik
Artiklar i publikationen
Av lärosätet
Kungliga Tekniska Högskolan

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy