101.789 AKNUM Reinforcement Learning
Diese Lehrveranstaltung ist in allen zugeordneten Curricula Teil der STEOP.
Diese Lehrveranstaltung ist in mindestens einem zugeordneten Curriculum Teil der STEOP.

2020S, VU, 4.0h, 6.0EC

TUWEL-Kurs

Merkmale

Semesterwochenstunden: 4.0
ECTS: 6.0
Typ: VU Vorlesung mit Übung

Lernergebnisse

Nach positiver Absolvierung der Lehrveranstaltung sind Studierende in der Lage, sowohl die Theorie und die Methoden des Reinforcement Learning inklusive der neuesten Entwicklungen zu verstehen, zu erklären und anzuwenden als auch die wichtigsten Algorithmen zu implementieren.

Inhalt der Lehrveranstaltung

Reinforcement Learning ist ein Teilgebiet der künstlichen Intelligenz und beschäftigt sich mit der Entwicklung von Strategien, mit deren Hilfe ein Agent seinen Erfolg in einer stochastischen Umgebung (model free) maximieren kann. Zu den Anwendungen zählen Robotik (OpenAI gym), computer vision, Spiele (wie z.B. Go, Schach, Atari 2600 oder Dota 2) auf menschlichem Niveau oder besser und vieles mehr.

Theorie und Algorithmen des Reinforcement Learning:

Introduction
Bandit problems
Markov decision problems
Bellman equations
Hamilton-Jacobi-Bellman equation
Dynamic programming
Monte-Carlo learning
Temporal-difference learning
Tabular methods
Function approximation and deep learning
On-policy vs. off-policy
Eligibility traces
Policy gradients and actor-critic
Applications

Im Übungsteil wird die Theorie vertieft und die Algorithmen werden implementiert.

Methoden

Vortrag, Skriptum, Übungsbeispiele.

Prüfungsmodus

Schriftlich

Vortragende Personen

Institut

E101 Institut für Analysis und Scientific Computing

LVA Termine

Tag	Zeit	Datum	Ort	Beschreibung
Mi.	14:30 - 16:00	04.03.2020	Institutsbibliothek, DA 06 G14	Reinforcement Learning
Do.	10:00 - 11:00	05.03.2020 - 12.03.2020	Sem.R. DA grün 03 A	Reinforcement Learning
Do.	10:00 - 11:30	05.03.2020 - 25.06.2020	Sem.R. DA grün 03C	Reinforcement Learning
Do.	12:00 - 14:00	05.03.2020 - 12.03.2020	Sem.R. DB gelb 03	Reinforcement Learning
Mi.	14:00 - 16:00	11.03.2020	FH Hörsaal 6 - TPH	Reinforcement Learning
Mi.	14:30 - 16:00	11.03.2020 - 24.06.2020	Sem.R. DA grün 03C	Reinforcement Learning

Einzeltermine anzeigen

AKNUM Reinforcement Learning - Einzeltermine

Tag	Datum	Zeit	Ort	Beschreibung
Mi.	04.03.2020	14:30 - 16:00	Institutsbibliothek, DA 06 G14	Reinforcement Learning
Do.	05.03.2020	10:00 - 11:00	Sem.R. DA grün 03 A	Reinforcement Learning
Do.	05.03.2020	10:00 - 11:30	Sem.R. DA grün 03C	Reinforcement Learning
Do.	05.03.2020	12:00 - 14:00	Sem.R. DB gelb 03	Reinforcement Learning
Mi.	11.03.2020	14:00 - 16:00	FH Hörsaal 6 - TPH	Reinforcement Learning
Mi.	11.03.2020	14:30 - 16:00	Sem.R. DA grün 03C	Reinforcement Learning
Do.	12.03.2020	10:00 - 11:00	Sem.R. DA grün 03 A	Reinforcement Learning
Do.	12.03.2020	10:00 - 11:30	Sem.R. DA grün 03C	Reinforcement Learning
Do.	12.03.2020	12:00 - 14:00	Sem.R. DB gelb 03	Reinforcement Learning
Mi.	18.03.2020	14:30 - 16:00	Sem.R. DA grün 03C	Reinforcement Learning
Do.	19.03.2020	10:00 - 11:30	Sem.R. DA grün 03C	Reinforcement Learning
Mi.	25.03.2020	14:30 - 16:00	Sem.R. DA grün 03C	Reinforcement Learning
Do.	26.03.2020	10:00 - 11:30	Sem.R. DA grün 03C	Reinforcement Learning
Mi.	01.04.2020	14:30 - 16:00	Sem.R. DA grün 03C	Reinforcement Learning
Do.	02.04.2020	10:00 - 11:30	Sem.R. DA grün 03C	Reinforcement Learning
Mi.	22.04.2020	14:30 - 16:00	Sem.R. DA grün 03C	Reinforcement Learning
Do.	23.04.2020	10:00 - 11:30	Sem.R. DA grün 03C	Reinforcement Learning
Mi.	29.04.2020	14:30 - 16:00	Sem.R. DA grün 03C	Reinforcement Learning
Do.	30.04.2020	10:00 - 11:30	Sem.R. DA grün 03C	Reinforcement Learning
Mi.	06.05.2020	14:30 - 16:00	Sem.R. DA grün 03C	Reinforcement Learning

Leistungsnachweis

Kontinuierlich in den Übungen; schriftliche Tests.

LVA-Anmeldung

Von	Bis	Abmeldung bis
02.03.2020 00:00	08.04.2020 00:00	08.04.2020 00:00

Curricula

Studienkennzahl	Verbindlichkeit	Semester	Anm.Bed.	Info
066 645 Data Science	Gebundenes Wahlfach
860 GW Gebundene Wahlfächer - Technische Mathematik	Keine Angabe

Literatur

Ein Skriptum (englisch) wird kostenlos an die Teilnehmer ausgegeben.

Zu den Lehrunterlagen

Vorkenntnisse

Die Theorie wird in der Vorlesung in sich abgeschlossen erklärt, sodass die LVA ab dem vierten Semester absolviert werden kann. Programmierkenntnisse werden vorausgesetzt (z.B. Python oder Julia).

Weitere Informationen

Homepage der Lehrveranstaltung

Sprache

bei Bedarf in Englisch