Ausgangssituation

Im Rahmen der Forschungsprojekte ReEF und GOFLEX wurde die Benchmark-Plattform ECAST entwickelt. ECAST vergleicht Prognosemethoden für Zeitreihendatensätze hinsichtlich ihrer Genauigkeit und ihrer Kosten. Für die Vorauswahl an Methoden nutzt ECAST eine Fallbasis vergangener Benchmarks. Diese Vorauswahl hängt u. a. von der Domäne des Datensatzes bzw. der Zeitreihe ab, die automatisch ermittelt werden soll.

Aufgabenstellung

Aufbauend auf Arbeiten mit statistischen Features ist eine Klassifikation von Zeitreihen mithilfe des maschinellen Lernens zu entwickeln. Features, die für die Klassifikation geeignet sind, soll der Klassifikator erlernen. Darüber hinaus soll ein Konzept vorgestellt werden, mit dem erlernte Features visualisiert werden können, um die Entscheidungen des Klassifikators interpretierbar und verständlich zu machen.

Wesentliche Anforderungen sind dabei:

  • Einarbeitung in die Literatur zu maschinellem Lernen für sequenzielle Daten, insbesondere zu rekurrenten neuronalen Netzen (RNN).
  • Einarbeitung in die Literatur zu Zeitreihenklassifikation.
  • Konzeption eines RNN zur Klassifikation von Zeitreihendatensätzen.
  • Visualisierung von Features, die das RNN für die Klassifikation erlernt in Analogie zur Visualisierung von Features für visuelle und sequenzielle Daten. Zusätzlich sollen diese Features mit Rücksicht auf den Datensatz interpretiert werden.
  • Evaluation der Klassifikation und der Visualisierung anhand ausgewählter synthetischer und reeller Datensätze, zum Beispiel aus den Bereichen Energie, Predictive Maintenance und aus dem UCR-Benchmark. Hierbei soll neben der hohen Klassifikationsgenauigkeit auch der Vergleich mit Klassifikatoren basierend auf statistischen Features berücksichtigt werden.
  • Implementierung des trainierten Modells in ECAST zur automatischen Bestimmung der Domäne einer Zeitreihe.