Time: Dienstag, 5.DS (13:00 bis 14:30)
Location: APB 3105
Quantity: 0V/2Ü/0P SWS
Language: German (English on request)
Modules: INF-AQUA, INF-VERT4, INF-04-HS, MINF-04-HS, INF-D-940

Data Analytics in Databases

About

Im Bereich des Data Mining werden rechenintensive Verfahren wie z.B. Clustering, Klassifikation und Optimierung eingesetzt, um verschiedene Eigenschaften von Datensätzen zu analysieren. Dabei ist der Auswertungsprozess für gewöhnlich zweigeteilt: Zunächst werden die Daten aus einer Datenbank geladen und anschließend mit Hilfe einer externen Software analysiert. Diese Teilung macht die Verarbeitung komplex, ineffizient und fehleranfällig. Die Integrationsansätze für Machine-Learning-Verfahren in Datenbanksysteme sind vielfältig und erstrecken sich von der Erstellung nutzerdefinierter Funktionen bis hin zur nahtlosen Systemintegration mit eigenen SQL-Erweiterungen, Datentypen, Hilfsstrukturen etc. Darüber hinaus gibt es auch für verteilte Systeme Lösungen, um die Verfahren effizient auszuführen.
Das Seminar bietet einen Überblick über verschiedene theoretische und praktische Ansätze der Integration von Machine-Learning-Verfahren in Datenbanken an. Aufgabe des Seminarteilnehmers ist es, sich mit einem Ansatz vertraut zu machen und ihn im Rahmen eines mündlichen Vortrags und einer schriftlichen Ausarbeitung zu präsentieren, einzuordnen und sich kritisch damit auseinanderzusetzen.

Themen

Thema Papier(e) Student Präsentation
SystemML: Declarative machine learning on MapReduce [1]
[2]
Bettina 27.06.17 13.30 Uhr
MLbase: A Distributed Machine-learning System [1]
[2]
[3]
Axel 27.06.17 14.00 Uhr
MAD Skills: New Analysis Practices for Big Data [1]
[2]
Dominik 04.07.17 13.00 Uhr
BISMARCK: Towards a unified architecture for in-RDBMS analytics [1]
[2]
Zoltán
SciDB: Large Scale Array Storage, Processing and Analysis [1]
[2]
[3]
Anna 04.07.17 14.00 Uhr
Naiad: A Timely Dataflow System [1]
[2]
Maik
Vergleich von Zeitreihendatenbanken [OpenTSDB]
[InfluxDB]
[1]
Johannes 11.07.17 14.00 Uhr
The Design and Implementation of a Sequence Database System [1]
[2]
[3]
Rodion

Kick-off-Meeting

Das Kick-Off-Meeting des Seminars ist am Dienstag, dem 11.04.2017, zur 4. DS (13 Uhr – 14.30 Uhr) im Raum APB/3105.
Die Folien vom Kick-Off-Meeting können Sie hier herunterladen.
Die Themen werden mit dem jeweiligen Betreuer an individuell vereinbarten Terminen besprochen. Die Präsentation erfolgt dann zum Ende des Semesters üblicherweise Dienstags, 12:30-14:00 Uhr, im Raum APB 3105. Zur Vorbereitung der schriftlichen Ausarbeitung verwenden sie bitte die Vorlage “ACM proceedings template (standard)” von dieser Seite (sample-sigconf.tex bzw. ACM_SigConf.docx).

Ziele

Ein Hauptseminar soll die Fähigkeit vermitteln,

  • sich anhand von wissenschaftlicher Fachliteratur über ein Problem selbständig zu informieren,
  • eine Zusammenfassung des Standes der Wissenschaft in einem mündlichen Vortrag von 20 Minuten zu präsentieren,
  • seine Auffassung in einer Diskussion zu vertreten und
  • sich mit wissenschaftlichen Texten kritisch ausseinanderzusetzen

Kontakt

Schreiben Sie uns eine E-Mail an: sya-db-hsdb@groups.tu-dresden.de