Zusammenfassung

In dieser Arbeit wurde die methodische Unterstützung der Modellauswahl für Prognoseprozesse am Beispiel von Energiezeitreihen in heterogenen Datensätzen analysiert. Dabei hat sich gezeigt, dass klassische Distanzmaße, wie die euklidische Distanz, unter bestimmten Voraussetzungen als qualitativ hochwertiges Verfahren bei der Modellklassifikation auf Basis einer Ähnlichkeitssuche angesehen werden können. Diese Rahmenbedingungen können jedoch nicht ausnahmslos garantiert werden. Des Weiteren gelten die Berechnungszeiten dieser Verfahren allgemein als ausreichend unpraktikabel, weshalb die Verwendung solcher Ansätze im operativen Betrieb keine gangbare Lösung darstellt.

Eigenschaftsbasierte Verfahren, wie der 1-Nearest-Neighbor-Klassifikator in Eigenschaftsräumen und der Klassifikationsbaum, erreichen eine vergleichbar gute und teilweise sogar bessere Leistung und sind darüber hinaus robust gegenüber den Beschränkungen von Distanzmaßen. Im Gegensatz zu letztgenannten, können bei der Verwendung eigenschaftsbasierter Verfahren berechnete
Zwischenergebnisse persistiert werden. Dadurch lassen sich reale Berechnungszeiten der Ähnlichkeitsbeziehung und Modellklassifikation teilweise auf ein stabiles Minimum reduzieren. Im Regelfall wird die Problemkomplexität durch den Eigenschaftsansatz signifikant verringert. Es zeigte sich ebenfalls, dass eine Repräsentation durch charakteristische Eigenschaften in Verbindung
mit der Ausführung gängiger Ähnlichkeitsverfahren und Klassifikationsmethodiken ein sinnvolles Unterfangen darstellt. Dies begründete sich nicht allein durch die Reduktion von Problemkomplexität und Ausführungszeit. Ein Vergleich gegen naive Greedy-Verfahren – wie die
ständige Verwendung eines spezifischen Modells oder die ständige Verwendung des häufigsten Modells – offenbarte ebenfalls eine häufige Verbesserung der erzielten Ergebnisse und in jedem Fall eine Erhöhung der Dynamik des zugrunde gelegten Ansatzes.

Im Hinblick auf die Suche nach einem optimalen Klassifikator ist zu bemerken, dass kein robuster, global anwendbarer Klassifikator aus der Menge der untersuchten Eigenschaften isoliert werden konnte. Stattdessen variieren die Klassifikatoren domänen- und damit kontextabhängig in ihrer Ausprägung und teilweise auch in ihrer Art. Für die vorliegenden Testdaten konnten sowohl domänenspezifisch als auch über der gesamten Datenbasis Klassifikatoren identifiziert werden, welche hinreichend gute Ergebnisse in der Klassifikation und damit in der Modellempfehlung erzielen.

Mehr