101.789 AKNUM Reinforcement Learning
Diese Lehrveranstaltung ist in allen zugeordneten Curricula Teil der STEOP.
Diese Lehrveranstaltung ist in mindestens einem zugeordneten Curriculum Teil der STEOP.

2020S, VU, 4.0h, 6.0EC
TUWEL

Merkmale

  • Semesterwochenstunden: 4.0
  • ECTS: 6.0
  • Typ: VU Vorlesung mit Übung

Lernergebnisse

Nach positiver Absolvierung der Lehrveranstaltung sind Studierende in der Lage, sowohl die Theorie und die Methoden des Reinforcement Learning inklusive der neuesten Entwicklungen zu verstehen, zu erklären und anzuwenden als auch die wichtigsten Algorithmen zu implementieren.

Inhalt der Lehrveranstaltung

Reinforcement Learning ist ein Teilgebiet der künstlichen Intelligenz und beschäftigt sich mit der Entwicklung von Strategien, mit deren Hilfe ein Agent seinen Erfolg in einer stochastischen Umgebung (model free) maximieren kann. Zu den Anwendungen zählen Robotik (OpenAI gym), computer vision, Spiele (wie z.B. Go, Schach, Atari 2600 oder Dota 2) auf menschlichem Niveau oder besser und vieles mehr.

Theorie und Algorithmen des Reinforcement Learning:

  • Introduction
  • Bandit problems
  • Markov decision problems
  • Bellman equations
  • Hamilton-Jacobi-Bellman equation
  • Dynamic programming
  • Monte-Carlo learning
  • Temporal-difference learning
  • Tabular methods
  • Function approximation and deep learning
  • On-policy vs. off-policy
  • Eligibility traces
  • Policy gradients and actor-critic
  • Applications

Im Übungsteil wird die Theorie vertieft und die Algorithmen werden implementiert.

Methoden

Vortrag, Skriptum, Übungsbeispiele.

Prüfungsmodus

Schriftlich

Vortragende Personen

Institut

LVA Termine

TagZeitDatumOrtBeschreibung
Mi.14:30 - 16:0004.03.2020 Institutsbibliothek, DA 06 G14Reinforcement Learning
Do.10:00 - 11:0005.03.2020 - 12.03.2020Sem.R. DA grün 03 A Reinforcement Learning
Do.10:00 - 11:3005.03.2020 - 25.06.2020 Sem.R. DA grün 03CReinforcement Learning
Do.12:00 - 14:0005.03.2020 - 12.03.2020Sem.R. DB gelb 03 Reinforcement Learning
Mi.14:00 - 16:0011.03.2020FH Hörsaal 6 - TPH Reinforcement Learning
Mi.14:30 - 16:0011.03.2020 - 24.06.2020 Sem.R. DA grün 03CReinforcement Learning
AKNUM Reinforcement Learning - Einzeltermine
TagDatumZeitOrtBeschreibung
Mi.04.03.202014:30 - 16:00 Institutsbibliothek, DA 06 G14Reinforcement Learning
Do.05.03.202010:00 - 11:00Sem.R. DA grün 03 A Reinforcement Learning
Do.05.03.202010:00 - 11:30 Sem.R. DA grün 03CReinforcement Learning
Do.05.03.202012:00 - 14:00Sem.R. DB gelb 03 Reinforcement Learning
Mi.11.03.202014:00 - 16:00FH Hörsaal 6 - TPH Reinforcement Learning
Mi.11.03.202014:30 - 16:00 Sem.R. DA grün 03CReinforcement Learning
Do.12.03.202010:00 - 11:00Sem.R. DA grün 03 A Reinforcement Learning
Do.12.03.202010:00 - 11:30 Sem.R. DA grün 03CReinforcement Learning
Do.12.03.202012:00 - 14:00Sem.R. DB gelb 03 Reinforcement Learning
Mi.18.03.202014:30 - 16:00 Sem.R. DA grün 03CReinforcement Learning
Do.19.03.202010:00 - 11:30 Sem.R. DA grün 03CReinforcement Learning
Mi.25.03.202014:30 - 16:00 Sem.R. DA grün 03CReinforcement Learning
Do.26.03.202010:00 - 11:30 Sem.R. DA grün 03CReinforcement Learning
Mi.01.04.202014:30 - 16:00 Sem.R. DA grün 03CReinforcement Learning
Do.02.04.202010:00 - 11:30 Sem.R. DA grün 03CReinforcement Learning
Mi.22.04.202014:30 - 16:00 Sem.R. DA grün 03CReinforcement Learning
Do.23.04.202010:00 - 11:30 Sem.R. DA grün 03CReinforcement Learning
Mi.29.04.202014:30 - 16:00 Sem.R. DA grün 03CReinforcement Learning
Do.30.04.202010:00 - 11:30 Sem.R. DA grün 03CReinforcement Learning
Mi.06.05.202014:30 - 16:00 Sem.R. DA grün 03CReinforcement Learning

Leistungsnachweis

Kontinuierlich in den Übungen; schriftliche Tests.

LVA-Anmeldung

Von Bis Abmeldung bis
02.03.2020 00:00 08.04.2020 00:00 08.04.2020 00:00

Curricula

StudienkennzahlVerbindlichkeitSemesterAnm.Bed.Info
066 645 Data Science Gebundenes Wahlfach
860 GW Gebundene Wahlfächer - Technische Mathematik Keine Angabe

Literatur

Ein Skriptum (englisch) wird kostenlos an die Teilnehmer ausgegeben.

Vorkenntnisse

Die Theorie wird in der Vorlesung in sich abgeschlossen erklärt, sodass die LVA ab dem vierten Semester absolviert werden kann. Programmierkenntnisse werden vorausgesetzt (z.B. Python oder Julia).

Weitere Informationen

Sprache

bei Bedarf in Englisch