Location: APB 3105
Quantity: 0V/2Ü/0P SWS
Language: German (English on request)
Modules: Informatik (Bachelor): INF-B-510, INF-B-520, INF-B-610; Medieninformatik (Bachelor): INF-B-530, INF-B-540, INF-B-610; Weitere Studiengänge: WI-BA-08

Hot Research Topics in Modern Data Management

Einschreibung

Die Einschreibung ist über OPAL bis zum 12.04. möglich und ist für die Teilnahme am Proseminar verpflichtend. Da die Anzahl der Themen jedoch begrenzt ist besteht kein Anspruch auf eine Teilnahme am Proseminar. Die Themenzuordnung wird im Kick-off-Meeting festgelegt.

Themen

Achtung: Für einige Papier ist der Zugriff nur aus dem Uni-VPN möglich.

Concurrency Control in really large database systems (Wolfgang Lehner)

  • Tiemo Bang, Ismail Oukid, Norman May, Ilia Petrov, Carsten Binnig: Robust Performance of Main Memory Data Structures by Configuration. SIGMOD Conference 2020: 1651-1666 (PDF)
  • T. Bang, N. May, I. Petrov, and C. Binnig. The tale of 1000 Cores: An evaluation of concurrency control on real(ly) large multi-socket hardware. Proceedings of the 16th International Workshop on Data Management on New Hardware, DaMoN 2020 (PDF)

Compiling PL/SQL (Wolfgang Lehner)

  • http://cidrdb.org/cidr2020/papers/p1-duta-cidr20.pdf
  • https://dl.acm.org/doi/10.1145/3318464.3384678

Memory Efficient Hash Joins (Lukas Landgraf)

  • R. Barber, G. Lohman, I. Pandis, V. Raman, R. Sidle, G. Attaluri, N. Chainani, S. Lightstone, and D. Sharpe. Memory-efficient hash joins. VLDB, 8(4), 2014 (PDF)

Organizing Data Lakes for Navigation (Michael Günther)

  • F. Nargesian, Q. Pu, E. Zhu, B. Ghadiri Bashardoost, R. J. Miller. Organizing Data Lakes for Navigation. SIGMOD 2020, pp. 1939-1950 (PDF)

ML-based DBMS Tuning (Maik Thiele)

  • Dana Van Aken, Dongsheng Yang, Sebastien Brillard, Ari Fiorino, Bohan Zhang, Christian Billian, Andrew Pavlo: An Inquiry into Machine Learning-based Automatic Configuration Tuning Services on Real-World Database Management Systems . PVLDB 2021, Issue 7 of Volume 14 (PDF)

Semi-supervised classification of chest radiographs (Julius Gonsior)

  • Eduardo H. P. Pooch, Pedro Ballester, and Rodrigo C. Barros: “Semi-supervised classification of chest radiographs”, MICCAI ’20 (PDF)

Query Optimization (Axel Hertzschuch)

  • Yesdaulet Izenov, Asoke Datta, Florin Rusu, Jun Hyung Shin: COMPASS: Online Sketch-based Query Optimization for In-Memory Databases. SIGMOD’21 (PDF)
  • Extended version arxiv (PDF)

A Study of the Fundamental Performance Characteristics of GPUs and CPUs for Database Analytics (Johannes Fett)

  • Anil Shanbhag, Samuel Madden, and Xiangyao Yu. 2020. A Study of the Fundamental Performance Characteristics of GPUs and CPUs for Database Analytics. (PDF)

Forecasting of Particulate Matter Air Pollution (Claudio Hartmann)

  • Bhakta, R., Khillare, P. S., & Jyethi, D. S. (2019). Atmospheric Particulate Matter Variations and Comparison of Two Forecasting Models for Two Indian Megacities. Aerosol Science and Engineering, (PDF)
  • Doreswamy, Harishkumar, K. S., Km, Y., & Gad, I. (2020). Forecasting Air Pollution Particulate Matter (PM2.5) Using Machine Learning Regression Models. Procedia Computer Science, (PDF)

Everything is a Transaction (Dirk Habich)

  • Ling Zhang et al. 2021. Everything is a Transaction: Unifying Logical Concurrency Control and Physical Data Structure Maintenance in Database Management Systems(PDF)

A General SIMD-Based Approach to Accelerating Compression Algorithms (Juliana Hildebrandt)

  • Whyne Xin Zhao et al. 2015. A General SIMD-Based Approach to Accelerating Compression Algorithms(PDF)

SIMD vectorized analytical query execution (Mikhail Zarubin)

  • Orestis Polychroniou et al. 2020. VIP: A SIMD vectorized analytical query engine(Link)

Distributed Graph Processing (Alexander Krause)

  • C. Buragohain et al. 2020: A1: A Distributed In-Memory Graph Database (PDF)
  • Dongxu Yang et al.: EDGES: An Efficient Distributed Graph Embedding System on GPU Clusters (PDF)

OLAP Query Optimization (Johannes Pietrzyk)

  • Parallel Prefix Sum with SIMD. (PDF)
  • Interleaved multi-vectorizing. (PDF)

Kick-off-Meeting

Das Kick-off-Meeting findet am 13.04. um 13:00 Uhr mittels Zoom statt. Der Zoom-Raum wird über OPAL am 12.4. bekanntgegeben.
Zum Termin wird die Themenzuteilung festgehalten und die jeweiligen Betreuer zugeordnet.  Die Themen werden mit dem jeweiligen Betreuer an individuell vereinbarten Terminen besprochen. Die Präsentation erfolgt dann zu Terminen, beginnend sechs Wochen nach dem Kick-off. Die Vorträge werden üblicherweise Dienstags, 13:00-14:30 Uhr über Zoom stattfinden. Zur Vorbereitung der schriftlichen Ausarbeitung verwenden sie bitte die Vorlage “ACM proceedings template (standard)” von dieser Seite (acmart-master.zip bzw. Interim layout.docx). Bitte nutzen Sie das zweispaltige Layout.

Zuordnung

Thema Studierender Betreuer
Concurrency Control in really large database systems Bojer Wolfgang Lehner (wolfgang.lehner@tu-dresden.de)
ML-based DBMS Tuning Hainke Maik Thiele (Maik.thiele@tu-dresden.de)
BERT-based Models for Information Retrieval Kip Anja Reusch (anja.reusch@tu-dresden.de)
Distributed Graph Processing Wellert / Zimmermann Alex Krause (alexander.krause@tu-dresden.de)
SIMD-Based Approach to Accelerating Compression Algorithms Behrens Juliana Hildebrandt (juliana.Hildebrandt@tu-dresden.de)
SIMD vectorized analytical query execution Bergmann Mikhail Zarubin (mikhail.zarubin@tu-dresden.de)
Forecasting of Particulate Matter Air Pollution Trung Claudio Hartmann (claudio.hartmann@tu-dresden.de)
ML support for production Looschen Lucas Woltmann (lucas.woltmann@tu-dresden.de)
Performance Characteristics of GPUs and CPUs Hugk Johannes Fett (Johannes.fett@mailbox.org)
Organizing Data Lakes for Navigation Moudallal Michael Günther (michael.guenther@tu-dresden.de)
Query Optimization Kegel Axel Hertzschuch (axel.hertzschuch@tu-dresden.de)
Semi-supervised classification of chest radiographs Pöhlmann Julius Gonsor (julius.gonsior@tu-dresden.de)
Everything is a Transaction Kaever Dirk Habich (dirk.habich@tu-dresden.de)
Computational Storage Kantelberg Eric Mier (eric.mier@tu-dresden.de)
Memory Efficient Hash Joins Lüttig Lukas Landgraf (lukas.landgraf@tu-dresden.de)
Compiling PL/SQL Yenong Wolfgang Lehner (wolfgang.lehner@tu-dresden.de)
Interleaved Multi-Vectorization Schwark Johannes Pietrzyk (johannes.pietrzyk)

Ziele

Ein Proseminar soll die Fähigkeit vermitteln,

  • sich anhand von wissenschaftlicher Fachliteratur über ein Problem selbständig zu informieren,
  • eine Zusammenfassung des Standes der Wissenschaft in einem mündlichen Vortrag von 20 Minuten zu präsentieren,
  • seine Auffassung in einer Diskussion zu vertreten und
  • sich mit wissenschaftlichen Texten kritisch auseinanderzusetzen

Kontakt

Schreiben Sie uns eine E-Mail an: sya-db-hsdb@groups.tu-dresden.de