Nach positiver Absolvierung der Lehrveranstaltung sind Studierende in der Lage, sowohl die Theorie und die Methoden des Reinforcement Learning inklusive der neuesten Entwicklungen zu verstehen, zu erklären und anzuwenden als auch die wichtigsten Algorithmen zu implementieren.
Reinforcement Learning ist ein Teilgebiet der künstlichen Intelligenz und beschäftigt sich mit der Entwicklung von Strategien, mit deren Hilfe ein Agent seinen Erfolg in einer stochastischen Umgebung (model free) maximieren kann. Zu den Anwendungen zählen Robotik (OpenAI gym), computer vision, Spiele (wie z.B. Go, Schach, Atari 2600 oder Dota 2) auf menschlichem Niveau oder besser und vieles mehr.
Theorie und Algorithmen des Reinforcement Learning:
- Introduction
- Bandit problems
- Markov decision problems
- Bellman equations
- Hamilton-Jacobi-Bellman equation
- Dynamic programming
- Monte-Carlo learning
- Temporal-difference learning
- Tabular methods
- Function approximation and deep learning
- On-policy vs. off-policy
- Eligibility traces
- Policy gradients and actor-critic
- Applications
Im Übungsteil wird die Theorie vertieft und die Algorithmen werden implementiert.
Vorbesprechung: Do., 4.3., um 15:00 via GoToMeeting.
==========
VU Reinforcement Learning
Nehmen Sie an meinem Meeting per Computer, Tablet oder Smartphone teil.
https://global.gotomeeting.com/join/206032389
Sie können sich auch über ein Telefon einwählen.
Österreich: +43 7 2081 5337
Zugangscode: 206-032-389
Nehmen Sie über einen Videokonferenzraum oder ein Videokonferenzsystem teil.
Einwählen oder Eingabe: 67.217.95.2 oder inroomlink.goto.com
Meeting-ID: 206 032 389
Oder Direktwahl: 206032389@67.217.95.2 oder 67.217.95.2##206032389
Sie kennen GoToMeeting noch nicht? Installieren Sie jetzt die App, damit Sie für Ihr erstes Meeting bereit sind:
https://global.gotomeeting.com/install/206032389
==========