SwePub
Sök i LIBRIS databas

  Utökad sökning

id:"swepub:oai:DiVA.org:kth-316730"
 

Sökning: id:"swepub:oai:DiVA.org:kth-316730" > Rollout approach to...

Rollout approach to sensor scheduling for remote state estimation under integrity attack

Liu, Hanxiao (författare)
KTH,Reglerteknik,Shanghai Univ, Sch Artificial Intelligence, Shanghai, Peoples R China.;Nanyang Technol Univ, Sch Elect & Elect Engn, Singapore, Singapore.
Li, Yuchao (författare)
KTH,Reglerteknik
Johansson, Karl H., 1967- (författare)
KTH,Reglerteknik
visa fler...
Mårtensson, Jonas, 1976- (författare)
KTH,Reglerteknik
Xie, Lihua (författare)
Nanyang Technol Univ, Sch Elect & Elect Engn, Singapore, Singapore.
visa färre...
 (creator_code:org_t)
Elsevier BV, 2022
2022
Engelska.
Ingår i: Automatica. - : Elsevier BV. - 0005-1098 .- 1873-2836. ; 144
  • Tidskriftsartikel (refereegranskat)
Abstract Ämnesord
Stäng  
  • We consider the sensor scheduling problem for remote state estimation under integrity attacks. We seek to optimize a trade-off between the energy consumption of communications and the state estimation error covariance when the acknowledgment (ACK) information, sent by the remote estimator to the local sensor, is compromised. The sensor scheduling problem is formulated as an infinite horizon discounted optimal control problem with infinite states. We first analyze the underlying Markov decision process (MDP) and show that the optimal scheduling without ACK attack is of the threshold type. Thus, we can simplify the problem by replacing the original state space with a finite state space. For the simplified MDP, when the ACK is under attack, the problem is modeled as a partially observable Markov decision process (POMDP). We analyze the induced MDP that uses a belief vector as its state for the POMDP. We investigate the properties of the exact optimal solution via contractive models and show that the threshold type of solution for the POMDP cannot be readily obtained. A suboptimal solution is then obtained via a rollout approach, which is a prominent class of reinforcement learning (RL) methods based on approximation in value space. We present two variants of rollout and provide performance bounds of those variants. Finally, numerical examples are used to demonstrate the effectiveness of the proposed rollout methods by comparing them with a finite history window approach that is widely used in RL for POMDP.

Ämnesord

NATURVETENSKAP  -- Geovetenskap och miljövetenskap -- Miljövetenskap (hsv//swe)
NATURAL SCIENCES  -- Earth and Related Environmental Sciences -- Environmental Sciences (hsv//eng)
MEDICIN OCH HÄLSOVETENSKAP  -- Klinisk medicin -- Ortopedi (hsv//swe)
MEDICAL AND HEALTH SCIENCES  -- Clinical Medicine -- Orthopaedics (hsv//eng)
MEDICIN OCH HÄLSOVETENSKAP  -- Klinisk medicin -- Urologi och njurmedicin (hsv//swe)
MEDICAL AND HEALTH SCIENCES  -- Clinical Medicine -- Urology and Nephrology (hsv//eng)

Publikations- och innehållstyp

ref (ämneskategori)
art (ämneskategori)

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Liu, Hanxiao
Li, Yuchao
Johansson, Karl ...
Mårtensson, Jona ...
Xie, Lihua
Om ämnet
NATURVETENSKAP
NATURVETENSKAP
och Geovetenskap och ...
och Miljövetenskap
MEDICIN OCH HÄLSOVETENSKAP
MEDICIN OCH HÄLS ...
och Klinisk medicin
och Ortopedi
MEDICIN OCH HÄLSOVETENSKAP
MEDICIN OCH HÄLS ...
och Klinisk medicin
och Urologi och njur ...
Artiklar i publikationen
Automatica
Av lärosätet
Kungliga Tekniska Högskolan

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy