Lehrinhalte
• Auffrischung des Hintergrundwissens
• Black box Reinforcement Learning
• Modellierung als Bandit, Markov Decision Processes und Partially Observable Markov Decision Processes
• Optimale Steuerung und Regelung
• Modellernen
• Wertefunktionslernen
• Policy Search
• Tiefe Wertefunktion Methoden
• Tiefe Policy Search Methoden
• Exploration vs Exploitation
• Hierarchisches Reinforcement Learning
• Intrinsische Motivation

Voraussetzungen
Gute Programmierkenntnisse in Python.
Vorherige Belegung der Vorlesung Statistical Machine Learning ist hilfreich aber nicht zwingend erforderlich

Online-Angebote
moodle

Semester: SoSe 2022