Nach positiver Absolvierung der Lehrveranstaltung sind Studierende in der Lage:
(1) ...Domänenspezifikationen in RDF-S, SHACL und in den OWL-Profilen zu schreiben.
(2) ... zu einer gegebenen Spezifikation und eines Datengraphen, einen geeigneten Validierungs-Algorithmus auszuwählen, und einen vorhandenen Engine für die Aufgabe zu nennen. Für kleine Beispiele, können die Studierenden die Validierung manuell auf Papier durchführen.
(3) ...die Semantik von closed-world Formalismen wie SHACL, mit open-world Formalismen wie OWL zu vergleichen. Die Studierenden können auch erklären, welche Konsequenzen sich aus diesen unterschiedlichen semantischen Annahmen ergeben.
(4) ...einen Algorithmus zur Auswertung einer gegebenen SPARQL-Abfrage (in einem wohlgeformten monotonen SPARQL-Fragment) über einen Wissensgraph zu erklären.
(5) ...wenn ein inkonsistenter Wissensgraph vorliegt, seine Reparaturen zu beschreiben, und die Antworten auf eine gegebene Frage zu berechnen, wobei die Standardvariationen der Reparatursemantik berücksichtigt werden.
(6) ...angesichts der Beschreibung einer Domäne und möglicherweise heterogener, unvollständiger Datenquellen, eine OBDA-Spezifikation für diese Domäne zu schreiben.
(7) ...anhand einer Anfrage und einer OBDA-Spezifikation, zu erklären wie die Antworten über die dargestellten virtuellen Wissensgraphen berechnet werden können.
Der Kurs behandelt verschiedene semantische Technologien und die Art und Weise, wie sie für die Integration und den Zugriff auf Daten eingesetzt werden können, insbesondere auf Daten, die mit Legacy-Techniken nicht einfach zu handhaben sind, weil sie unvollständig, inkonsistent oder heterogen sind und ihre Integration und Pflege teuer sein kann.Wir werden Spezifikationssprachen wie RDF-S, SHACL und die OWL-Profile sowie die Abfragesprache SPARQL untersuchen. Diese Formalismen werden im Detail untersucht, wobei ihre abstrakte Syntax, ihre semantischen Annahmen und ihre Kernalgorithmen für die Validierung und Abfrageauswertung verglichen werden. Wir werden sehen, wie RDF-S, SHACL und OWL zur Validierung von Graphen-Daten und zur Gewinnung nützlicher Wissensgraphen aus möglicherweise unvollständigen und heterogenen Daten verwendet werden können. Wir werden untersuchen, wie diese Graphen in (Fragmenten der) SPARQL-Abfragesprache abgefragt werden können, einige der algorithmischen und rechnerischen Herausforderungen, die sich aus der unterschiedlichen Wahl der Formalismen ergeben, sowie Lösungen für die Abfrage sowohl virtueller als auch inkonsistenter Wissensgraphen. Teil 1: Abfragen von Graphen Thema 1: Datenmodell für graphisch-strukturierte Daten (GSD)1.1 Das Grundmodell des GSD- Definition einer GSD-Instanz- Darstellungen von GSD-Instanzen (als beschriftete Graphen und als Menge von Atomen, Konversionen) - Das GSD-Modell als Spezialfall des relationalen Modells1.2 Eigenschaftsgraphen - Eigenschaftsdiagramme: Definition, Eigenschaftsgraphen als relationale Instanzen Thema 2: Abfragen von Graphen - Definitionen von CQs, UCQs, 2RPQs, C2RPQs- Vergleich der Abfragesprachen, Aussagekraft - Syntaktische Varianten zur Darstellung von Abfragen 2.1 Beantwortung von Anfragen - Abfrageantworten: Definition, bestimmte Antworten, Entscheidungsprobleme - Grundlagen der Abfrageauswertung über eine GSD-Instanz2.2 Komplexität der Anfragebeantwortung- Definition von Daten und kombinierter Komplexität- Komplexitätsgrenzen Thema 3: Abfragen von RDF-Grafiken - RDF-Dreifache und Diagramme- GSD vs. RDF-Grafiken, RDF-ABoxen- BGPs und CQ-BGPs, syntaktische Darstellungen- Bewertung von CQ-BGP über RDF-ABoxen: Regeln für den Abschluss - Kombiniert und Datenkomplexität bei der Bewertung von CQ-BGPs über RDF-ABoxenTeil 2: Ontologien und Wissensgraphen Thema 4: Abfragen mit Wissen - RDF-S-Ontologien, abstrakte Syntax, Wissensgraphen (KGs)- Definition von Modellen für KGs- Abfrageauswertung mit RDF-S-Ontologien, Vervollständigungsregeln - Komplexität der Abfrageauswertung 3.1 Inkonsistenz - Behauptungen zur Uneinheitlichkeit in RDF- Datenkonsistenz w.r.t. einer Ontologie - Konsistenzprüfung: Definition, Algorithmen und Komplexität Thema 5: OWL-Ontologien - DL-ähnliche Syntax für OWL QL, OWL EL, OWL 1 Lite, OWL 2 - Formale Semantik von OWL: Definition von Interpretationen, Modellhaftigkeit - Begründungsaufgaben: Klassenerfüllbarkeit, Klassensubsumtion, - Schreiben von OWL-Ontologien - Profile vergleichen - Anfragebeantwortung in LQ: Algorithmen und Komplexität- Anfragebeantwortung in EL: Algorithmen und Komplexität- Jenseits der Leichtbauprofile: Ausdruckskraft und Komplexität Teil 3: VariationenThema 6: SHACL - SHACL-Schemata, abstrakte Syntax- SHACL-Validierung - Vergleich von OWL und SHACLThema 7: Ontologie-basierte Datenintegration und virtuelle KGs- OBDI und VKGs: Ziele und Grundsätze- OBDI-Spezifikationen und OBDI-Instanzen, Modelle - Bestimmte Antworten: Definition- Abfrageauswertungspipeline, grundlegende Algorithmen
Der Vorlesung hat verschiedene Komponenten.
(1) *Vorlesungsvideos* (asynchron)Videopräsentationen der Vortragsmaterialien werden jede Woche online gestellt und können asynchron angesehen werden.
(2)*Online-Diskussion* (Teilnahme optional; synchron - vorläufiger Zeitplan Di 9:00-10:00)In einer wöchentlichen Zoom-Sitzung werde ich die in der Vorwoche eingestellten Materialien kommentieren, Fragen beantworten, und Übungen diskutieren. In einigen dieser Treffen wird es optionale Online-Quizzes geben (ich werde sie eine Woche vorher ankündigen), die als Alternative zur Prüfung gelten.
(3) *Übungen* Es werden optionale Übungen ausgeschrieben, die unabhängig zu lösen sind. Ich werde zu den Lösungen, die ich erhalte, Feedback geben. Korrekte Lösungen können als Alternative zur Prüfung ebenfalls zur Note beitragen.
*Noten*Sie können zwischen zwei Formen der Benotung wählen: (A) Sie können Ihre Note während des Semesters erhalten, indem Sie anhand von Übungen und Quizfragen zeigen, dass Sie den Stoff aller Lerneinheiten beherrschen. (B) Eine Prüfung am Ende des Semesters (schriftlich + mündlich). In Modell (A) können Sie Noten oder frühere Lerneinheiten wiederholen und verbessern.
Weitere Einzelheiten werden in der Einführungsvorlesung am Dienstag, 13.10., 9:00 Uhr auf Zoom bekannt gegeben.
ECTS breakdown: 3 ECTS = 75 Stunden
Vorlesungen: 18 Stunden (9 Vorlesungen zu je 2 Stunden)
Übungen: 30 Stunden (3 Übungsblätter, je 9 h Hausarbeit + 1 h Diskussion)Quizzes: 27 Stunden (3 Quizzes, je 9 Std. Selbstlernen + 1 Std. Quiz)
*Benotung *Sie können zwischen zwei Formen der Benotung wählen: (A) Sie können Ihre Note während des Semesters erhalten, indem Sie anhand von Übungen und Quizfragen zeigen, dass Sie den Stoff aller Lerneinheiten beherrschen. (B) Eine Prüfung am Ende des Semesters (schriftlich + mündlich). In Modell (A) können Sie Noten oder frühere Lerneinheiten wiederholen und verbessern.