Time: Monday, 4. DS (13:00 to 14:30)
Location: Zoom
Quantity: 2V/2Ü/0P SWS
Language: German (English on request)
Modules: INF-04-FG-AVS, INF-B-510, INF-B-520, INF-B-530, INF-B-540, INF-BAS4, INF-BI-2, INF-VERT4, MINF-04-FG-IAS

Inhalt der Vorlesung

“Data is the new Oil” – mit diesem Satz wird die Relevanz strukturierter Daten und damit implizit natürlich auch die Relevanz skalierbarer Datenbanksysteme als grundlegende Technik der analytischen und transaktionalen Verarbeitung üblicherweise großer Datenbestände sichtbar. Im Rahmen dieser Vorlesung werden dazu Konzepte und Methoden besprochen, die es ermöglichen, verteilte Datenverarbeitung mit Blick auf zwei wesentliche Eigenschaften zu realisieren: zum einen wird der Aspekt der „Performance“ adressiert und damit Fragen der Skalierbarkeit im Fall von Scale-Out-Architekturen am Beispiel von Systemen wie Apache Spark besprochen. Zum anderen wird der Aspekt der „Konsistenz“ diskutiert, wobei unterschiedliche Methoden zur Synchronisation nebenläufiger Lese- und Schreibaktivitäten auf den gleichen Datenbestand vorgestellt werden.
Ziel der Vorlesung ist es, einen Einblick in skalierbare Techniken und Methoden der Datenbanktechnik zu geben. Die Vorlesung erfordert Grundkenntnisse der Datenbanken. Ein Besuch einer anderen weiterführenden Lehrveranstaltung ist nicht notwendig, in manchen Themenbereichen jedoch hilfreich. Die Übungen setzen sich zusammen aus Aufgaben, die in den Vorlesungsbetrieb integriert werden und praktischen Übungen im Umgang mit „echten“ Systemen.

Hinweise

Zur Teilnahme an der Vorlesung ist eine Einschreibung in OPAL notwendig. Über OPAL erhalten Sie auch den Zoom-Zugang.

Es sei den Teilnehmern bewusst, dass die Vorlesung aufgezeichnet wird; den Studierenden ist es somit freigestellt, die Kamera einzuschalten oder einen virtuellen Hintergrund zu verwenden. Wichtig ist, dass sich die Studierenden mit dem vollständigen Namen (keine Nicknames) in Zoom erkennbar machen – dies erleichtert ggf. Rückfragen sehr.

Die Aufzeichnungen bleiben für 7 Tage (bis zur nächsten Vorlesungsstunde) verfügbar, um auch den Studierenden, die aus pandemiebedingten Gründen nicht an der Live-Vorlesung teilnehmen können die Möglichkeit zu geben, der Vorlesung trotzdem zu folgen. Für Rückfragen sich bitte per Email an Prof. Lehner wenden und ggf. einen Termin für ein Gespräch zu vereinbaren.

Skripte

Teil Inhalt PDF
0 Organisatorisches PDF
1 Big Data Overview PDF
2 Data Models Overview PDF
3 Scale-Out Query Processing PDF
4 Shared-Nothing Synchronization PDF
5 Shared-Disk Synchronization PDF
6 CAP-Theorem PDF
7 Replication Control PDF
SAP HANA Cloud Data Lake PDF
8 Use Case Amazon Dynamo PDF
9 Delta Propagation PDF
10 Scale-In Methods PDF

Vorlesungsaufzeichnungen

1 Big Data Overview

2 Data Models Overview


3 Scale-Out Query Processing


3 Scale-Out Query Processing

4 Shared-Nothing Synchronization


5 Shared-Disk Synchronization


6 CAP-Theorem

7 Replication Control


8 Use Case Amazon Dynamo

9 Delta Propagation


10 Scale-in Methods