Time: Monday, 4. DS (13:00 to 14:30)
Location: APB 3105
Quantity: 2V/2Ü/0P SWS
Language: German (English on request)
Modules: INF-04-FG-AVS, INF-B-510, INF-B-520, INF-B-530, INF-B-540, INF-BAS4, INF-BI-2, INF-VERT4, MINF-04-FG-IAS

News

  • In der Pfingstwoche vom 01. bis 07.06. findet keine Scalable Data Management (SDM) Vorlesung und Übung statt. Die nächste Vorlesung findet am 08.06. und die Übung wieder am Mittwoch, den 10. Juni, statt.
  • Die nächste Vorlesung „Scalable Data Management“ kann leider wegen der gleichzeitigen Sitzung des Fakultätsrates nicht am 15.4. in der 5. DS stattfinden und muss somit in der Osterwoche doch ausfallen. Die nächste Vorlesung findet dann wieder – wie gewohnt – am 20.4. um 13Uhr per Zoom statt.
  • Die Vorlesung wird, so lange das Verbot von Präsenzveranstaltungen gilt, unter Verwendung von Zoom abgehalten. Laden Sie sich bitte einen, für ihr Endgerät passenden, Client herunter. Es existieren auch gute Zoom-Apps für Android und iOS. Die Vorlesungszeiten bleiben gleich: Montag 13:00 Uhr, beginnend am 6. April. Zur Einwahl verwenden Sie bitte den folgenden Link oder die Meeting-ID 715 849 575. Ein Aufzeichnung des Streams wird auch mit Verzögerung online gestellt. Bitte nehmen Sie aber so weit es geht an der Live-Veranstaltung teil und stellen Sie dort ihre Frage.
  • Für die mündliche Prüfung wird angeraten die Prüfungsbegleitende Ausarbeitung zu den NoSQL Systemen Redis, MongoDB und Spark anzufertigen. Eine Abgabe wird bei der Prüfung positiv berücksichtig.

Inhalt der Vorlesung

“Data is the new Oil” – mit diesem Satz wird die Relevanz strukturierter Daten und damit implizit natürlich auch die Relevanz skalierbarer Datenbanksysteme als grundlegende Technik der analytischen und transaktionalen Verarbeitung üblicherweise großer Datenbestände sichtbar. Im Rahmen dieser Vorlesung werden dazu Konzepte und Methoden besprochen, die es ermöglichen, verteilte Datenverarbeitung mit Blick auf zwei wesentliche Eigenschaften zu realisieren: zum einen wird der Aspekt der „Performance“ adressiert und damit Fragen der Skalierbarkeit im Fall von Scale-Out-Architekturen am Beispiel von Systemen wie Apache Spark besprochen. Zum anderen wird der Aspekt der „Konsistenz“ diskutiert, wobei unterschiedliche Methoden zur Synchronisation nebenläufiger Lese- und Schreibaktivitäten auf den gleichen Datenbestand vorgestellt werden.
Ziel der Vorlesung ist es, einen Einblick in skalierbare Techniken und Methoden der Datenbanktechnik zu geben. Die Vorlesung erfordert Grundkenntnisse der Datenbanken. Ein Besuch einer anderen weiterführenden Lehrveranstaltung ist nicht notwendig, in manchen Themenbereichen jedoch hilfreich. Die Übungen setzen sich zusammen aus Aufgaben, die in den Vorlesungsbetrieb integriert werden und praktischen Übungen im Umgang mit „echten“ Systemen.

Teil Inhalt PDF
0 Organisatorisches PDF
1 Big Data Overview PDF
2 Data Models Overview PDF
3 Scale-Out Query Processing PDF
4 Shared-Nothing Synchronization PDF
5 Shared-Disk Synchronization PDF
6 CAP Theorem PDF
7 Replication Control PDF
8 Use Case: Amazon Dynamo PDF
9 Delta Propagation PDF
10 Scale-in Methods PDF

Vorlesungsaufzeichnungen

1 Big Data Overview

2 Data Models Overview

3 Scale-out Query Processing



4 Shared-Nothing Synchronization

5 Shared-Disk Synchronization

6 CAP Theorem

7 Replication Control



8 Use Case: Amazon Dynamo

9 Delta Propagation

10 Scale-in Methods