Kurzfassung

Im Rahmen des Forschungsprojekts Renewable Energy Forecasting (ReEF) werden Features, eine reduzierte Darstellung von Zeitreihen als skalare Werte, für die Auswahl und Klassifikation von Prognosemethoden genutzt. In dieser Bachelorarbeit ist zu untersuchen, welcher Zusammenhang zwischen den Features und der Klasse einer Zeitreihe besteht. Dafür ist zunächst ein Überblick über die dafür in Frage kommenden Zeitreihen-Features zu entwickeln. Mithilfe von Standard-Verfahren der Feature-Selection ist diese auf eine geeignete Auswahl zu reduzieren. Anhand eines geeigneten Datensatzes ist zu evaluieren, wie akkurat Zeitreihen mithilfe der ausgewählten Features hinsichtlich verschiedener Klassenlabels klassifiziert werden können.

Ausgangssituation

Die Feature-Extraktion ist eine wichtige Technik der Zeitreihenanalyse und wird in einer Vielzahl von Anwendungsgebieten eingesetzt. Diese Technik extrahiert Eigenschaften einer Zeitreihe als skalare Werte, sog. Features, um eine lange Reihe von Messwerten auf eine kurze Darstellung von Features zu reduzieren. Sie soll im Rahmen des Forschungsprojekts Renewable Energy Forecasting (ReEF) für die Klassifikation von Zeitreihen eingesetzt werden.

ReEF integriert und evaluiert Prognosetechniken von Energie-Zeitreihen, insbesondere von erneuerbaren Energien. In diesem Kontext wurde die Online-Benchmarking-Plattform ECAST entwickelt, welche Prognosemethoden auf ihre Verwendung für einen gegebenen Zeitreihen-Datensatz vergleicht und Empfehlungen an den Anwender gibt, welche Prognosemethoden für seinen Datensatz als geeignet erscheinen. In einer vorangegangenen Arbeit wurde ECAST um eine Komponente der Methodenauswahl ergänzt. Sie untersuchte den Zusammenhang zwischen Zeitreihen-Features und geeigneten Prognosemethoden mit dem Ziel, die Anzahl der in Frage kommenden Prognosemethoden einzuschränken.

Im Rahmen dieser Arbeit soll untersucht werden, welcher Zusammenhang zwischen den Features und der Klasse einer Zeitreihe besteht. Dies erfordert zunächst die Auswahl geeigneter Features für die Klassifikation. Weiterhin ist anhand eines dafür aufzubauenden Datensatzes zu untersuchen, wie akkurat Zeitreihen damit klassifiziert werden können.

Aufgabenstellung

Ziel dieser Bachelorarbeit ist die Untersuchung von Features für die Klassifikation von Zeitreihen. Dies umfasst folgende Teilaufgaben:

  • Aufbau einer Sammlung von in Frage kommenden Features für die Klassifikation von Zeitreihen. Diese Auswahl soll durch Literatur-Recherche und unter Einbeziehung vorangegangener Arbeiten erfolgen. Darüber hinaus ist eine Übersicht über Verfahren zur Feature-Auswahl, insbesondere korrelationsbasierter, zu erstellen.
  • Aufbau eines Zeitreihen-Datensatzes. Hierbei sind Zeitreihen unterschiedlicher Quellen mit ihren Klassenlabels zu erfassen und in einem gemeinsamen Schema zu integrieren. Der Fokus liegt hierbei auf Zeitreihen aus dem Energiesektor (z.B. Energieverbrauchs-, Preis- oder Produktionszeitreihen).
  • Implementierung der Feature-Auswahl in einem Prototyp (Umsetzung in Java oder R). Dieser Prototyp ist unabhängig von ECAST als Stand-alone-Lösung zu entwickeln.
  • Evaluierung der Feature-Auswahl mithilfe einer Klassifikation durch Entscheidungsbäume. Es ist zu untersuchen, welche Features für diese Klassifikationsmethode geeignet sind. Ziel ist eine möglichst akkurate Bestimmung der Klassenlabels. Darüber hinaus ist auf die Laufzeiten von Feature-Auswahl und Klassifikationsmethode zu achten.
  • Abgrenzung der gewählten Features von Zeitreihen aus anderen Anwendungsbereichen, bspw. Verkaufszeitreihen.