Nach positiver Absolvierung der Lehrveranstaltung sind Studierende in der Lage, daten-orientiert in Python zu programmieren, unter Verwendung von SciPy, Numpy und Pandas, die Grundlagen von maschinellen Lernen und Netzwerkanalyse zu erklären und ein Data Science Projekt umtzsetzen.
Vorlesungen über die Grundlagen
2 praktische Übungen (Übung 1 wird individuell umgesetzt und besteht aus zwei Teilen, Übung 2 ist eine Gruppenübung)
Die Leistung besteht deshalb aus 3 Teilleistungen:
- Übung 1a
- Übung 1b
- Übung 2
Die 3 Teilleistungen sind verpflichtend. Da es sich bei jede dieser drei oben angegebenen Teilleistungen um eine Teilleistung handelt, die längerfristig zu erfüllen ist (mindestens zwei Wochen sind pro Übung vorgesehen), gibt es für diese Teilleistung keine Wiederholungsmöglichkeit.
Die Vorlesungen sind online. Die Link zur online Vorlesung ist auf TUWEL.
Alle andere Termine finden in Präsenz statt (falls sie wegen der Pandemie online stattfinden müssen, werden eine entsprechende Ankündigung gemacht).
Termine
Alle Vorlesungen am Dienstag 12:00 c.t.-13:45.
-
Kickoff-Session, data science process, community, solution examples (8.10.2024)
-
SciPy, NumPy, vectorisation, visualisation, benchmarking (15.10.2024)
-
Preprocessing, Pandas (22.10.2024)
-
Intro to Machine Learning (5.11.2023)
-
Network Analysis (12.11.2024)
- Data suitability, Data biases (26.11.2024)
- Introduction to Text Processing (3.12.2024)
Exercise-related sessions
Review meetings for exercise 2 (15 minutes for each group):
Exercise 2 Sprechstunde in EI11 zu den üblichen Vorlesungszeiten (freiwillig):
Project presentation: 28.1.2025, 9:00-18:00
Aufwand:
Lectures: 7 sessions @ 2h: 14h
Exercises:
EX1 (data science process): 25h
EX2 (project): 36h [includes review meeting (topic + questions + work plan)]
SUM: 75h
Zwei praktische Übungen.
Die 1. Übung besteht aus zwei Teilen, die individuell umgesetzt werden.
Die 2. Übung ist eine Gruppenübung und wird anhand von einem Bericht, Jupyter Notebook und Präsentation der Ergebnisse beurteilt.