Time: Dienstag, 4.DS (13:00 bis 14:30)
Location: APB 3105
Quantity: 0V/2Ü/0P SWS
Language: German (English on request)
Modules: Informatik (Bachelor): INF-B-510, INF-B-520, INF-B-610; Medieninformatik (Bachelor): INF-B-530, INF-B-540, INF-B-610; Weitere Studiengänge: WI-BA-08

Data Analytics in Databases

About

Im Bereich des Data Mining werden rechenintensive Verfahren wie z.B. Clustering, Klassifikation und Optimierung eingesetzt, um verschiedene Eigenschaften von Datensätzen zu analysieren. Dabei ist der Auswertungsprozess für gewöhnlich zweigeteilt: Zunächst werden die Daten aus einer Datenbank geladen und anschließend mit Hilfe einer externen Software analysiert. Diese Teilung macht die Verarbeitung komplex, ineffizient und fehleranfällig. Die Integrationsansätze für Machine-Learning-Verfahren in Datenbanksysteme sind vielfältig und erstrecken sich von der Erstellung nutzerdefinierter Funktionen bis hin zur nahtlosen Systemintegration mit eigenen SQL-Erweiterungen, Datentypen, Hilfsstrukturen etc. Darüber hinaus gibt es auch für verteilte Systeme Lösungen, um die Verfahren effizient auszuführen.
Das Seminar bietet einen Überblick über verschiedene theoretische und praktische Ansätze der Integration von Machine-Learning-Verfahren in Datenbanken an. Aufgabe des Seminarteilnehmers ist es, sich mit einem Ansatz vertraut zu machen und ihn im Rahmen eines mündlichen Vortrags und einer schriftlichen Ausarbeitung zu präsentieren, einzuordnen und sich kritisch damit auseinanderzusetzen.

Themen

Thema Papier(e) Student Präsentation
Statistical Model Computation with UDFs [1]
SolveDB: Integrating Optimization Problem Solvers Into SQL Databases [1]
Ricardo: Integrating R and Hadoop [1] Matthias 04.07.17 13.30 Uhr
Project Adam: Building an Efficient and Scalable Deep Learning Training System [1] Lucas 11.07.17 13.00 Uhr
SPOOF: Sum-Product Optimization and Operator Fusion for Large-Scale Machine Learning [1]
TensorFlow: Large-Scale Machine Learning on Heterogeneous Distributed Systems [1] Alexander 27.06.17 13.00 Uhr
COLUMBUS: Materialization Optimizations for Feature Selection Workloads [1] Tabita 11.07.17 13.30 Uhr

Kick-off-Meeting

Das Kick-Off-Meeting des Seminars ist am Dienstag, dem 11.04.2017, zur 4. DS (13 Uhr – 14.30 Uhr) im Raum APB/3105.
Die Folien vom Kick-Off-Meeting können Sie hier herunterladen.
Die Themen werden mit dem jeweiligen Betreuer an individuell vereinbarten Terminen besprochen. Die Präsentation erfolgt dann zum Ende des Semesters üblicherweise Dienstags, 12:30-14:00 Uhr, im Raum APB 3105. Zur Vorbereitung der schriftlichen Ausarbeitung verwenden sie bitte die Vorlage “ACM proceedings template (standard)” von dieser Seite (sample-sigconf.tex bzw. ACM_SigConf.docx).

Ziele

Ein Proseminar soll die Fähigkeit vermitteln,

  • sich anhand von wissenschaftlicher Fachliteratur über ein Problem selbständig zu informieren,
  • eine Zusammenfassung des Standes der Wissenschaft in einem mündlichen Vortrag von 20 Minuten zu präsentieren,
  • seine Auffassung in einer Diskussion zu vertreten und
  • sich mit wissenschaftlichen Texten kritisch auseinanderzusetzen

Kontakt

Schreiben Sie uns eine E-Mail an: sya-db-psdb@groups.tu-dresden.de