Time: | Monday, 4. DS (13:00 to 14:30) |
Location: | APB 3105 |
Quantity: | 2V/2Ü/0P SWS |
Language: | German (English on request) |
Modules: | INF-04-FG-AVS, INF-B-510, INF-B-520, INF-B-530, INF-B-540, INF-BAS4, INF-BI-2, INF-VERT4, MINF-04-FG-IAS |
“Data is the new Oil” – mit diesem Satz wird die Relevanz strukturierter Daten und damit implizit natürlich auch die Relevanz skalierbarer Datenbanksysteme als grundlegende Technik der analytischen und transaktionalen Verarbeitung üblicherweise großer Datenbestände sichtbar. Im Rahmen dieser Vorlesung werden dazu Konzepte und Methoden besprochen, die es ermöglichen, verteilte Datenverarbeitung mit Blick auf zwei wesentliche Eigenschaften zu realisieren: zum einen wird der Aspekt der „Performance“ adressiert und damit Fragen der Skalierbarkeit im Fall von Scale-Out-Architekturen am Beispiel von Systemen wie Apache Spark besprochen. Zum anderen wird der Aspekt der „Konsistenz“ diskutiert, wobei unterschiedliche Methoden zur Synchronisation nebenläufiger Lese- und Schreibaktivitäten auf den gleichen Datenbestand vorgestellt werden.
Ziel der Vorlesung ist es, einen Einblick in skalierbare Techniken und Methoden der Datenbanktechnik zu geben. Die Vorlesung erfordert Grundkenntnisse der Datenbanken. Ein Besuch einer anderen weiterführenden Lehrveranstaltung ist nicht notwendig, in manchen Themenbereichen jedoch hilfreich. Die Übungen setzen sich zusammen aus Aufgaben, die in den Vorlesungsbetrieb integriert werden und praktischen Übungen im Umgang mit „echten“ Systemen.
Teil | Inhalt | |
---|---|---|
0 | Organisatorisches | |
1 | Big Data Overview | |
2 | Data Models Overview | |
3 | Scale-Out Query Processing | |
4 | Shared-Nothing Synchronization | |
5 | Shared-Disk Synchronization | |
6 | CAP Theorem | |
7 | Replication Control | |
8 | Use Case: Amazon Dynamo | |
9 | Delta Propagation | |
10 | Scale-in Methods |