Lectures :: Information Retrieval

News

Einordnung

Wahlpflichtfach im Fachgebiet Architektur verteilter Systeme oder im Fachgebiet Informations- und Anwendungssysteme oder im Vertiefungsgebiet Datenbanken.
(3 V / 1 Ü / 0 P)

Ziele

In der heutigen digitalen Informationswelt werden zunehmend immer mehr Daten in den unterschiedlichsten Datenbanken bzw. Dateisystems gespeichert. In diesem Sinne kann davon gesprochen werden, dass in naher Zukunft keine Daten in jeglichen Anwendungsbereichen mehr verloren gehen können. Durch diesen Umstand gewinnt der Bereich des Information Retrievals immer mehr an Bedeutung. Dieser Bereich widmet sich in erster Linie, wie in derartig großen und überwiegend unstrukturierten Datenbeständen überhaupt noch effizient gesucht werden kann. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.

Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten notwendig. Das Ziel der Vorlesung besteht darin, einen Einblick in diesen Themenkomplex zu geben. Insbesondere werden die folgenden Gebiete genauer betrachtet:

  • Basiskonzepte (Informationskreislauf, Evaluierung)
  • Repräsentation von Inhalten
  • Modelle (Boolesches Modell, Vektorraum Modell, etc.)
  • Optimierung (Visualisierung und interaktives Retrieval)
  • Implementierung von IR-Systemen (Schichtenmodell, Zugriffspfade, Algorithmen)
  • IR-Aufgaben (Retrieval, Filterung, Kategorisierung, cross language retrieval, summarization)
  • Anwendungsbereiche (WWW-Suchmaschinen, Bild- und Musik-Retrieval, Digital Bibliotheken)

Vorlesung

WochentagStundeZeitRaumLesender
Montag 5.DS 14:50-16:20 INF E007 Dr. Dirk Habich
Dienstag 5.DS 14:50-16:20 INF E001 Dr. Dirk Habich

Übung

WochentagStundeZeitRaumLesender
Dienstag (aller 14 Tage) 5.DS 14:50-16:20 INF E001 Dr. Dirk Habich

Vorlesungsskripte

Teil Inhalt Anz. Seiten

Acrobat/PDF

Kapitel 1 Organisatorisches 6 hier
Kapitel 2 Einführung 32 hier
Kapitel 3 Evaluierung 55 hier
Kapitel 4 Wissensrepräsentation für Texte 75 hier
Kapitel 5 Einfache IR Modelle und ihre Implementierung 32 hier
Kapitel 6 Erweiterte IR Modelle und ihre Implementierung 37, 13 Teil 1, Teil 2
Kapitel 7 Alternativen zur Suche 41 hier
Kapitel 8 Binary Independence Model 21 hier
Kapitel 9 Bild Information Retrieval 42 hier
Kapitel 10 Optimierung 23 hier
Kapitel 11 Einführung Web Information Retrieval 52 hier
Kapitel 12 Web Crawler und Page Rank 36 hier
Kapitel 13 Multimedia Retrieval 36 hier
Kapitel 14 Musik Feature Extraktion 44 hier
Kapitel 15 Lucene und Solr 12 hier
Vortrag Enterprise Search (T-Systems MMS) 45 hier

Übungsblätter

Übung Inhalt Acrobat/PDF
Übung 1 Einführung hier
Übung 2 Wissensrepräsentation hier
Übung 3 Vektorraummodell Aufgabenstellung, Datensatz
Übung 4 Bild Information Retrieval PDF, Ergebnis
Übung 5 Musik Information Retrieval PDF, Eclipse-Projekt
Übung 6 Solr und Lucene Aufgabenstellung

Contact

 

Last Update: February 16, 2012 13:17 UTC
Author Database Technology Group, Technische Universität Dresden

Contact
Head
Prof. Dr.-Ing.
Wolfgang Lehner


Tel.: +49 351 463-38383
Fax: +49 351 463-38259


Visiting Address (View)
Nöthnitzer Str. 46
Room 3109
01187 Dresden

Postal Address
Technische Universität Dresden
Dep. of Computer Science
Institute for System Architecture
Database Technology Group
01062 Dresden
Germany