Scalable Data Management | Database Research Group

Prof. Dr.-Ing. Wolfgang Lehner

Time:	Monday, 4. DS (13:00 to 14:30)
Location:	Zoom
Quantity:	2V/2Ü/0P SWS
Language:	German (English on request)
Modules:	INF-04-FG-AVS, INF-B-510, INF-B-520, INF-B-530, INF-B-540, INF-BAS4, INF-BI-2, INF-VERT4, MINF-04-FG-IAS

Inhalt der Vorlesung

“Data is the new Oil” – mit diesem Satz wird die Relevanz strukturierter Daten und damit implizit natürlich auch die Relevanz skalierbarer Datenbanksysteme als grundlegende Technik der analytischen und transaktionalen Verarbeitung üblicherweise großer Datenbestände sichtbar. Im Rahmen dieser Vorlesung werden dazu Konzepte und Methoden besprochen, die es ermöglichen, verteilte Datenverarbeitung mit Blick auf zwei wesentliche Eigenschaften zu realisieren: zum einen wird der Aspekt der „Performance“ adressiert und damit Fragen der Skalierbarkeit im Fall von Scale-Out-Architekturen am Beispiel von Systemen wie Apache Spark besprochen. Zum anderen wird der Aspekt der „Konsistenz“ diskutiert, wobei unterschiedliche Methoden zur Synchronisation nebenläufiger Lese- und Schreibaktivitäten auf den gleichen Datenbestand vorgestellt werden.
Ziel der Vorlesung ist es, einen Einblick in skalierbare Techniken und Methoden der Datenbanktechnik zu geben. Die Vorlesung erfordert Grundkenntnisse der Datenbanken. Ein Besuch einer anderen weiterführenden Lehrveranstaltung ist nicht notwendig, in manchen Themenbereichen jedoch hilfreich. Die Übungen setzen sich zusammen aus Aufgaben, die in den Vorlesungsbetrieb integriert werden und praktischen Übungen im Umgang mit „echten“ Systemen.

Hinweise

Zur Teilnahme an der Vorlesung ist eine Einschreibung in OPAL notwendig. Über OPAL erhalten Sie auch den Zoom-Zugang.

Es sei den Teilnehmern bewusst, dass die Vorlesung aufgezeichnet wird; den Studierenden ist es somit freigestellt, die Kamera einzuschalten oder einen virtuellen Hintergrund zu verwenden. Wichtig ist, dass sich die Studierenden mit dem vollständigen Namen (keine Nicknames) in Zoom erkennbar machen – dies erleichtert ggf. Rückfragen sehr.

Die Aufzeichnungen bleiben für 7 Tage (bis zur nächsten Vorlesungsstunde) verfügbar, um auch den Studierenden, die aus pandemiebedingten Gründen nicht an der Live-Vorlesung teilnehmen können die Möglichkeit zu geben, der Vorlesung trotzdem zu folgen. Für Rückfragen sich bitte per Email an Prof. Lehner wenden und ggf. einen Termin für ein Gespräch zu vereinbaren.

Skripte

Teil	Inhalt	PDF
0	Organisatorisches	PDF
1	Big Data Overview	PDF
2	Data Models Overview	PDF
3	Scale-Out Query Processing	PDF
4	Shared-Nothing Synchronization	PDF
5	Shared-Disk Synchronization	PDF
6	CAP-Theorem	PDF
7	Replication Control	PDF
	SAP HANA Cloud Data Lake	PDF
8	Use Case Amazon Dynamo	PDF
9	Delta Propagation	PDF
10	Scale-In Methods	PDF