Semantische Netze können auf vielfältige Weise benutzt werden, um Texte, Suchanfragen oder andere Daten mit zusätzlichen Informationen anzureichern. Diese können anschließend benutzt werden, um bei der Verarbeitung der solcher Daten nicht nur auf die reine offensichtliche Syntax angewiesen zu sein. Damit werden qualifiziertere Entscheidungen auf Basis der tatsächlichen Bedeutung möglich. Allerdings sind derartige semantische Netze manuell aufwändig zu erstellen. Gerade für die Abbildung domänenübergreifender Ontologien muss deshalb zumeist auf automatisierte und damit fehleranfällige Verfahren zurückgegriffen werden.

Diese Arbeit stellt die Anforderungen an derartige Algorithmen zur Generierung solcher Wissensbasen heraus und präsentiert Verfahren, die aus unterschiedlichen Datenquellen, wie Webtexten, -tabellen oder Ontologien, zunächst semantische Relationen extrahieren und diese anschließend zu einem gemeinsamen Schema integrieren. Dieses Schema adressiert die grundlegenden Probleme, wie Homonymie und Synonymie, bei der Zusammenführung dieser Zusammenhänge. Es ist außerdem flexibel genug, auch auf andere, nicht betrachte Relationen, sowohl auf semantischer als auch syntaktischer Ebene, erweitert zu werden.

Neben den vergleichsweise offensichtlichen Hyponym- können aber etwa auch Synonymrelationen aus dem generierten semantischen Netz abgeleitet werden. Darüber hinaus wird im Zuge der Integration von Webtabellen ein Algorithmus vorgestellt, der für eine Gruppe von syntaktischen Einheiten einen möglichst präzisen Überbegriff bestimmt, der als gemeinsames Hyperonym dieser Ausdrücke verwendet werden kann. Dies kann beispielsweise eingesetzt werden, um die Semantik von Tabellen für die weitere Verarbeitung sichtbar zu machen.

Mehr