Time: Monday, 5. DS (14:50 to 16:20)
Location: INF E007
Quantity: 2V/2Ü/0P SWS
Language: German
Modules: INF-B-510, INF-B-520, INF-B-530, INF-B-540, INF-BAS4, INF-LE-WW, INF-VERT4, MINF-04-FG-IAS, WI-BA-08, D-WW-INF-3421, D-WW-INF-3422, D-WW-INF-3423, INF-04-FG-AVS

Ziele

In der heutigen digitalen Informationswelt werden zunehmend immer mehr Daten in den unterschiedlichsten Datenbanken bzw. Dateisystems gespeichert. In diesem Sinne kann davon gesprochen werden, dass in naher Zukunft keine Daten in jeglichen Anwendungsbereichen mehr verloren gehen können. Durch diesen Umstand gewinnt der Bereich des Information Retrievals immer mehr an Bedeutung. Dieser Bereich widmet sich in erster Linie, wie in derartig großen und überwiegend unstrukturierten Datenbeständen überhaupt noch effizient gesucht werden kann. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.

Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten und multimedialen Objekten notwendig. Das Ziel der Vorlesung besteht darin, einen Einblick in diesen Themenkomplex zu geben.

Vorlesungsskripte

Teil Inhalt Anz. Seiten Acrobat/PDF
Chapter 0 Organizational Issues 7 PDF
Chapter 1 Introduction 41 PDF
Chapter 2 Boolean Retrieval, Phrase Queries and Positional Indexes 41 PDF
Chapter 3 Term vocabulary and Normalization 43 PDF
Chapter 4 Dictionaries and tolerant retrieval 42 PDF
Chapter 5 Scoring, term weighting and the vector space model 66 PDF
Chapter 6 Implementing IR-System I: Index compression 43 PDF
Chapter 7 Implementing IR-System II: Index construction 86 PDF
Chapter 8 Evaluation in information retrieval 52 PDF
Chapter 9 Relevance feedback and query expansion 51 PDF
Chapter 10 XML IR
49 PDF
Chapter 11 Probabilistic information retrieval 59 PDF
Chapter 12 Language models for information retrieval 38 PDF
Chapter 13 Web search basics – Web Size, Crawling, SPAM und Duplicate Detection 82 PDF
Chapter 14 PageRank and HITS 43 PDF
Chapter 15 Text Classification – Intro 33 PDF
Chapter 16 Rule-based Text Classification 52 PDF
Chapter 17 Naive Bayes Text Classification 57 PDF
Chapter 18 Vector Space Text Classification 33 PDF
Chapter 19 SVM Text Classification 44 PDF