Time: Monday, 5. DS (14:50 to 16:20)
Location: Zoom
Quantity: 2V/2Ü/0P SWS
Language: German
Modules: D-WW-INF-3421, D-WW-INF-3422, D-WW-INF-3423, INF-04-FG-AVS, INF-B-510, INF-B-520, INF-B-530, INF-B-540, INF-BAS2, INF-BAS4, INF-LE-WW, INF-PM-FOR, INF-VERT2, INF-VERT4, MINF-04-FG-IAS, WI-BA-08

Prüfung

Es werden mündliche Prüfungen stattfinden, Corona-bedingt jedoch virtuell. Folgende Prüfungstermine werden angeboten:

  • 15.02.
  • 16.02.
  • 01.03.

Senden Sie bitte ihre Terminwünsche und Prüfungsunterlagen an Ulrike Schöbel.

News

Die erste Vorlesung findet nicht live statt sondern wurde aufgezeichnet. Das Video finden Sie unter Vorlesungsskripte. Die Zugangsdaten bekommen Sie per Email sofern Sie über OPAL eingeschrieben sind.

Ziele

In der heutigen digitalen Informationswelt werden zunehmend immer mehr Daten in den unterschiedlichsten Datenbanken bzw. Dateisystems gespeichert. In diesem Sinne kann davon gesprochen werden, dass in naher Zukunft keine Daten in jeglichen Anwendungsbereichen mehr verloren gehen können. Durch diesen Umstand gewinnt der Bereich des Information Retrievals immer mehr an Bedeutung. Dieser Bereich widmet sich in erster Linie, wie in derartig großen und überwiegend unstrukturierten Datenbeständen überhaupt noch effizient gesucht werden kann. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.

Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten notwendig. Das Ziel der Vorlesung besteht darin, einen Einblick in diesen Themenkomplex zu geben.

Vorlesungsskripte

Teil Inhalt Skript Video
0 Organisatorisches PDF MP4
1 Einführung PDF MP4
2 Boolean Retrieval, Phrase Queries and Positional Indexes PDF MP4, Shakespeare Complete Text, shakespeare.ipynb
3 Term vocabulary and Normalization PDF MP4,
Porter Stemmer, stemming.ipynb, part_of_speech.ipynb, porter.ipynb
4 Dictionaries and tolerant retrieval PDF MP4,
Levenshtein Demo,
spelling.ipynb,
soundex.ipynb,
levenshtein.ipynb,
big.txt
5 Scoring, term weighting and the vector space model PDF MP4,
vectorspace.ipynb,
wikipedia_vectorspace.ipynb
6 Implementing IR-System I: Index compression PDF MP4,
Zipf’s Law Notebook and Example Data
7 Implementing IR-System II: Index construction PDF MP4
8 Query Processing and Optimization PDF MP4,
Query Evaluation: Strategies and Optimizations
9 Evaluation in information retrieval PDF MP4, precision-recall-curve.ipynb
10 Relevance feedback and query expansion PDF MP4 siehe Vorlesung 9
11 Language models for information retrieval PDF MP4
12 PageRank and HITS PDF pagerank.ipynb
13 Text Classification – Intro PDF MP4
14 Rule-based Text Classification PDF