Time: | Monday, 4. DS (13:00 to 14:30) |
Location: | Zoom |
Quantity: | 2V/2Ü/0P SWS |
Language: | German (English on request) |
Modules: | INF-04-FG-AVS, INF-B-510, INF-B-520, INF-B-530, INF-B-540, INF-BAS4, INF-BI-2, INF-VERT4, MINF-04-FG-IAS |
“Data is the new Oil” – mit diesem Satz wird die Relevanz strukturierter Daten und damit implizit natürlich auch die Relevanz skalierbarer Datenbanksysteme als grundlegende Technik der analytischen und transaktionalen Verarbeitung üblicherweise großer Datenbestände sichtbar. Im Rahmen dieser Vorlesung werden dazu Konzepte und Methoden besprochen, die es ermöglichen, verteilte Datenverarbeitung mit Blick auf zwei wesentliche Eigenschaften zu realisieren: zum einen wird der Aspekt der „Performance“ adressiert und damit Fragen der Skalierbarkeit im Fall von Scale-Out-Architekturen am Beispiel von Systemen wie Apache Spark besprochen. Zum anderen wird der Aspekt der „Konsistenz“ diskutiert, wobei unterschiedliche Methoden zur Synchronisation nebenläufiger Lese- und Schreibaktivitäten auf den gleichen Datenbestand vorgestellt werden.
Ziel der Vorlesung ist es, einen Einblick in skalierbare Techniken und Methoden der Datenbanktechnik zu geben. Die Vorlesung erfordert Grundkenntnisse der Datenbanken. Ein Besuch einer anderen weiterführenden Lehrveranstaltung ist nicht notwendig, in manchen Themenbereichen jedoch hilfreich. Die Übungen setzen sich zusammen aus Aufgaben, die in den Vorlesungsbetrieb integriert werden und praktischen Übungen im Umgang mit „echten“ Systemen.
Zur Teilnahme an der Vorlesung ist eine Einschreibung in OPAL notwendig. Über OPAL erhalten Sie auch den Zoom-Zugang.
Es sei den Teilnehmern bewusst, dass die Vorlesung aufgezeichnet wird; den Studierenden ist es somit freigestellt, die Kamera einzuschalten oder einen virtuellen Hintergrund zu verwenden. Wichtig ist, dass sich die Studierenden mit dem vollständigen Namen (keine Nicknames) in Zoom erkennbar machen – dies erleichtert ggf. Rückfragen sehr.
Die Aufzeichnungen bleiben für 7 Tage (bis zur nächsten Vorlesungsstunde) verfügbar, um auch den Studierenden, die aus pandemiebedingten Gründen nicht an der Live-Vorlesung teilnehmen können die Möglichkeit zu geben, der Vorlesung trotzdem zu folgen. Für Rückfragen sich bitte per Email an Prof. Lehner wenden und ggf. einen Termin für ein Gespräch zu vereinbaren.
Teil | Inhalt | |
---|---|---|
0 | Organisatorisches | |
1 | Big Data Overview | |
2 | Data Models Overview | |
3 | Scale-Out Query Processing | |
4 | Shared-Nothing Synchronization | |
5 | Shared-Disk Synchronization | |
6 | CAP-Theorem | |
7 | Replication Control | |
SAP HANA Cloud Data Lake | ||
8 | Use Case Amazon Dynamo | |
9 | Delta Propagation | |
10 | Scale-In Methods |