liu.seSearch for publications in DiVA
3839404142434441 of 92
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Fidelity Invariance Curriculum Learning: Accelerating Learning of Drone Navigation Policies using a General Multi-Fidelity Curriculum Learning Framework
Linköping University, Department of Computer and Information Science, Artificial Intelligence and Integrated Computer Systems.
2025 (English)Independent thesis Advanced level (degree of Master (Two Years)), 20 credits / 30 HE creditsStudent thesisAlternative title
Naturtrogenhetsinvariant läroplansinlärning : Snabbare inlärning av drönarnavigering via generellt ramverk för varierande naturtrogenhet inom läroplansinlärning (Swedish)
Abstract [en]

This thesis introduces Fidelity Invariance Curriculum Learning (FICL), a general reinforcement learning framework that integrates curriculum learning with multi-fidelity optimisation to reduce training costs and improve policy generalisation. Building on Teacher-Student Curriculum Learning (TSCL), FICL incorporates cost-aware task sampling and leverages both low- and high-fidelity environments. To evaluate the approach, we construct a quad-rotor drone navigation scenario where an agent must locate and reach a target using GPS-like, approximate coordinates and visual input. FICL is compared against two baselines: high-fidelity TSCL and high-fidelity non-curriculum learning. Comparisons use convergence cost, episodic return, and episode termination metrics. Experimental results show that FICL achieves faster convergence in wall-clock time and maintains policy performance compared to baselines, while also contributing to more stable training dynamics, demonstrating improved sample efficiency without compromising solution quality. Results suggest that combining curriculum learning with fidelity-aware task sampling provides a promising approach for scalable reinforcement learning in resource-constrained domains, such as autonomous navigation.

Abstract [sv]

Denna avhandling introducerar Fidelity Invariance Curriculum Learning (FICL), ett generellt ramverk för förstärkningsinlärning som integrerar curriculum learning (läroplansinlärning) med varierande naturtrogenhet för att minska träningskostnader och förbättra generaliseringen hos policies. Med utgångspunkt i Teacher-Student Curriculum Learning (TSCL) inkluderar FICL kostnadsmedveten uppgiftssampling och utnyttjar både miljöer av låg och hög naturtrogenhet. För att utvärdera metoden konstrueras ett navigationsscenario för en fyrrotordrönare där en agent måste lokalisera och nå ett mål med hjälp av GPS-liknande, approximativa koordinater och visuella indata. FICL jämförs med två baslinjer: TSCL med hög naturtrogenhet och icke-curriculum-baserad inlärning med hög naturtrogenhet. Jämförelserna görs utifrån konvergenskostnad, episodavkastning och mått för episodterminering. Experimentella resultat visar att FICL uppnår snabbare konvergens i faktisk tid och bibehåller policy-prestanda jämfört med baslinjerna, samtidigt som den bidrar till mer stabila träningsprocesser. Detta visar på förbättrad sample-effektivitet utan att kompromissa med lösningens kvalitet. Resultaten tyder på att en kombination av läroplansinlärning och naturtrogenhetsmedveten uppgiftssampling är ett lovande angreppssätt för skalbar förstärkningsinlärning i resursbegränsade domäner, såsom autonom navigation.

Place, publisher, year, edition, pages
2025. , p. 45
Keywords [en]
Artificial intelligence, Machine learning, Reinforcement learning, Curriculum learning, Multi-fidelity optimization, Costs, Robotics, Quad-rotor, Drone, Proximal policy optimization (PPO)
Keywords [sv]
Artificiell intelligens, Maskininlärning, Förstärkningsinlärning, Läroplansinlärning, Multifidelity-optimering, Kostnader, Robotik, Kvadrokopter, Drönare
National Category
Artificial Intelligence
Identifiers
URN: urn:nbn:se:liu:diva-219986ISRN: LIU-IDA/LITH-EX-A--25/107--SEOAI: oai:DiVA.org:liu-219986DiVA, id: diva2:2021448
External cooperation
Totalförsvarets forskningsinstitut
Subject / course
Computer science
Presentation
2025-09-19, Alan Turing, Olaus Magnus väg, 583 30, Linköping, 11:00 (English)
Supervisors
Examiners
Available from: 2026-02-24 Created: 2025-12-14 Last updated: 2026-02-24Bibliographically approved

Open Access in DiVA

fulltext(7608 kB)8 downloads
File information
File name FULLTEXT01.pdfFile size 7608 kBChecksum SHA-512
dd9a3aecda4550112e4d5f1586ec391f06362b1acc663f0e6506f1e0cc59855a4fb86dcbadd772987f346b52ca71a1c28045e3c00dc95b39ace9fb1f104351b1
Type fulltextMimetype application/pdf

By organisation
Artificial Intelligence and Integrated Computer Systems
Artificial Intelligence

Search outside of DiVA

GoogleGoogle Scholar
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 1353 hits
3839404142434441 of 92
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • oxford
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf