Lehrinhalte
Auffrischung des Hintergrundwissens
Black box Reinforcement Learning
Modellierung als Bandit, Markov Decision Processes und Partially Observable Markov Decision Processes
Optimale Steuerung und Regelung
Modellernen
Wertefunktionslernen
Policy Search
Tiefe Wertefunktion Methoden
Tiefe Policy Search Methoden
Exploration vs Exploitation
Hierarchisches Reinforcement Learning
Intrinsische Motivation
Voraussetzungen
Gute Programmierkenntnisse in Python.
Vorherige Belegung der Vorlesung Statistical Machine Learning ist hilfreich aber nicht zwingend erforderlich
Online-Angebote
moodle
Auffrischung des Hintergrundwissens
Black box Reinforcement Learning
Modellierung als Bandit, Markov Decision Processes und Partially Observable Markov Decision Processes
Optimale Steuerung und Regelung
Modellernen
Wertefunktionslernen
Policy Search
Tiefe Wertefunktion Methoden
Tiefe Policy Search Methoden
Exploration vs Exploitation
Hierarchisches Reinforcement Learning
Intrinsische Motivation
Voraussetzungen
Gute Programmierkenntnisse in Python.
Vorherige Belegung der Vorlesung Statistical Machine Learning ist hilfreich aber nicht zwingend erforderlich
Online-Angebote
moodle
- Lehrende: Georgia Chalvatzaki
- Lehrende: Carlo D'Eramo
- Lehrende: Jan Peters
- Lehrende: Davide Tateo
Semester: SoSe 2022