Kurzfassung

Im Datenbankenbereich ist es unerlässlich die Integrität der verwalteten Daten sicherzustellen. Dafür müssen sowohl Primär-, Sekundär- und Tertiärdaten vor ungewollten und zufälligen Änderungen geschützt werden. In immer mehr Bereichen der Informatik wird sich mit dem Thema „Resilience“ auseinandergesetzt, welches unter anderem untersucht, wie Dienste unter Auftreten von unvorhergesehenen Ereignissen eine gewisse Dienstqualtiät erfüllen können. Für bestimmte Fälle wurde dies auch im Datenbankenumfeld betrachtet und es fehlt an einer umfassenden Aufarbeitung der erfolgten Arbeiten und Trends im Bereich Resilience im Kontext von Datenbanken.

Ausgangssituation

Datenbanksysteme (DBS) modellieren einen Ausschnitt der realen Welt, die sogenannte Miniwelt, um ihren Zustand maschinell weiterverarbeiten zu können und riesige Datenmengen überhaupt handhabbar zu machen. Eine vorrangige Eigenschaft von DBS ist dabei, dass die gespeicherten Daten jederzeit (möglichst) konsistent gehalten werden und immer „korrekt“ sind. Korrekt bedeutet in diesem Zusammenhang, dass darauf vertraut wird, dass das DBS sich darum kümmert, dass sämtliche Daten weder mutwillig noch zufällig verfälscht werden. Dies betrifft sämtliche Bereiche des DBS, von End- und Zwischenergebnissen der Anfrageverarbeitung über ausgeführte Berechnungen bis hin zu den verwalteten Daten selbst. Außerdem können sämtliche Datenstrukturen betroffen sein, die zur effizienten Anfrageverarbeitung genutzt werden, wie z.B. Indexstrukturen.

Bereits in den 80er Jahren wurden sich im Bereich Datenbanken Gedanken darum gemacht, was für „Fehler“ auftreten können. Beispiele dafür sind Fehler beim Schreiben auf Festplatten – z.B. wenn Sektoren nur teilweise geschrieben werden oder der Strom während des Schreibens ausfällt – oder sogar geflippte Bits im Arbeitsspeicher. Die Ursachen dafür sind divers – zu große Hitze, zu hohe Strahlenbelastung oder Ungenauigkeiten beim Herstellungsprozess können die Transistoren in integrierten Schaltkreisen negativ beeinflussen, was wiederum zu ungewollten Zustandsänderungen führen kann.

Freilich ist der Bereich Datenbanken nicht das einzige Gebiet in dem derartige Fehler erkannt und behoben werden müssen. Gemeinhin ist dieses Thema unter dem Begriff „Resilience“ zusammengefasst, der eine weitläufigere, schwammigere Bedeutung hat. Dabei wird eher von der Einhaltung bestimmter Servicequalitäten gesprochen, es gibt jedoch keine einheitliche Definition dieses Begriffs.

Aufgabenstellung

Ziel dieser Analysearbeit ist es, den derzeitigen Stand der Wissenschaft im Bereich Fehlererkennung und –behebung vor allem im Umfeld Datenbanken zu ergründen. Dabei soll auch auf die nichteindeutige Bedeutung des Begriffs „Resilience“ eingegangen werden, der dieses Themengebiet umfasst. Weiterhin sollen Trends herausgearbeitet werden, die derzeit in diesem Forschungszweig vorherrschen. Soweit möglich sind die gefundenen wissenschaftlichen Arbeiten zu kategorisieren.

Mehr