SwePub
Sök i LIBRIS databas

  Utökad sökning

onr:"swepub:oai:DiVA.org:hig-27845"
 

Sökning: onr:"swepub:oai:DiVA.org:hig-27845" > Continuous residual...

  • Aslani, MohammadHögskolan i Gävle,Datavetenskap (författare)

Continuous residual reinforcement learning for traffic signal control optimization

  • Artikel/kapitelEngelska2018

Förlag, utgivningsår, omfång ...

  • NRC Research Press,2018
  • printrdacarrier

Nummerbeteckningar

  • LIBRIS-ID:oai:DiVA.org:hig-27845
  • https://urn.kb.se/resolve?urn=urn:nbn:se:hig:diva-27845URI
  • https://doi.org/10.1139/cjce-2017-0408DOI
  • https://urn.kb.se/resolve?urn=urn:nbn:se:uu:diva-364927URI

Kompletterande språkuppgifter

  • Språk:engelska
  • Sammanfattning på:engelska

Ingår i deldatabas

Klassifikation

  • Ämneskategori:ref swepub-contenttype
  • Ämneskategori:art swepub-publicationtype

Anmärkningar

  • Traffic signal control can be naturally regarded as a reinforcement learning problem. Unfortunately, it is one of the most difficult classes of reinforcement learning problems owing to its large state space. A straightforward approach to address this challenge is to control traffic signals based on continuous reinforcement learning. Although they have been successful in traffic signal control, they may become unstable and fail to converge to near-optimal solutions. We develop adaptive traffic signal controllers based on continuous residual reinforcement learning (CRL-TSC) that is more stable. The effect of three feature functions is empirically investigated in a microscopic traffic simulation. Furthermore, the effects of departing streets, more actions, and the use of the spatial distribution of the vehicles on the performance of CRL-TSCs are assessed. The results show that the best setup of the CRL-TSC leads to saving average travel time by 15% in comparison to an optimized fixed-time controller.

Ämnesord och genrebeteckningar

Biuppslag (personer, institutioner, konferenser, titlar ...)

  • Seipel, StefanUppsala universitet,Högskolan i Gävle,Datavetenskap,Division of Visual Information and Interaction, Department of Information Technology, Uppsala University, Uppsala, Sweden,Avdelningen för visuell information och interaktion,Bildanalys och människa-datorinteraktion(Swepub:uu)stefseip (författare)
  • Wiering, MarcoInstitute of Artificial Intelligence and Cognitive Engineering, University of Groningen, Groningen, the Netherlands (författare)
  • Högskolan i GävleDatavetenskap (creator_code:org_t)

Sammanhörande titlar

  • Ingår i:Canadian journal of civil engineering (Print): NRC Research Press45:8, s. 690-7020315-14681208-6029

Internetlänk

Hitta via bibliotek

Till lärosätets databas

Hitta mer i SwePub

Av författaren/redakt...
Aslani, Mohammad
Seipel, Stefan
Wiering, Marco
Om ämnet
TEKNIK OCH TEKNOLOGIER
TEKNIK OCH TEKNO ...
och Annan teknik
TEKNIK OCH TEKNOLOGIER
TEKNIK OCH TEKNO ...
och Elektroteknik oc ...
och Reglerteknik
Artiklar i publikationen
Canadian journal ...
Av lärosätet
Högskolan i Gävle
Uppsala universitet

Sök utanför SwePub

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy