liu.seSök publikationer i DiVA
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Using Reinforcement Learning for Model-free Linear Quadratic Control with Process and Measurement Noises
Linköpings universitet, Institutionen för systemteknik, Reglerteknik. Linköpings universitet, Tekniska fakulteten.ORCID-id: 0000-0002-6665-5881
Linköpings universitet, Institutionen för systemteknik, Reglerteknik. Linköpings universitet, Tekniska fakulteten.
2019 (Engelska)Ingår i: 2019 IEEE 58TH CONFERENCE ON DECISION AND CONTROL (CDC), IEEE , 2019, s. 6510-6517Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

In this paper, we analyze a Linear Quadratic (LQ) control problem in terms of the average cost and the structure of the value function. We develop a completely model-free reinforcement learning algorithm to solve the LQ problem. Our algorithm is an off-policy routine where each policy is greedy with respect to all previous value functions. We prove that the algorithm produces stable policies given that the estimation errors remain small. Empirically, our algorithm outperforms the classical Q and off-policy learning routines.

Ort, förlag, år, upplaga, sidor
IEEE , 2019. s. 6510-6517
Serie
IEEE Conference on Decision and Control, ISSN 0743-1546
Nationell ämneskategori
Reglerteknik
Identifikatorer
URN: urn:nbn:se:liu:diva-169303DOI: 10.1109/CDC40024.2019.9029904ISI: 000560779005155ISBN: 978-1-7281-1398-2 (digital)ISBN: 978-1-7281-1399-9 (tryckt)OAI: oai:DiVA.org:liu-169303DiVA, id: diva2:1466580
Konferens
58th IEEE Conference on Decision and Control (CDC), Nice, FRANCE, dec 11-13, 2019
Anmärkning

Funding Agencies|Vinnova Competence Center LINK-SIC; Wallenberg Artificial Intelligence, Autonomous Systems and Software Program (WASP)

Tillgänglig från: 2020-09-12 Skapad: 2020-09-12 Senast uppdaterad: 2021-04-20

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

Förlagets fulltext

Sök vidare i DiVA

Av författaren/redaktören
Adib Yaghmaie, FarnazGustafsson, Fredrik
Av organisationen
ReglerteknikTekniska fakulteten
Reglerteknik

Sök vidare utanför DiVA

GoogleGoogle Scholar

doi
isbn
urn-nbn

Altmetricpoäng

doi
isbn
urn-nbn
Totalt: 924 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf