Time: Monday, 5. DS (14:50 to 16:20)
Location: INF E023
Quantity: 2V/2Ü/0P SWS
Language: German
Modules: D-WW-INF-3421, D-WW-INF-3422, D-WW-INF-3423, INF-04-FG-AVS, INF-B-510, INF-B-520, INF-B-530, INF-B-540, INF-BAS2, INF-BAS4, INF-LE-WW, INF-PM-FOR, INF-VERT2, INF-VERT4, MINF-04-FG-IAS, WI-BA-08

News

Die Vorlesung am Montag, den 29.01.2018 muss leider kurzfristig ausfallen.
Die Übung am Dienstag, den 30.01.2018 findet aber wie gewohnt statt.

Achtung Raumänderung: Montags findet die Lehrveranstaltung ab dem 16.10. immer im Raum APB E023 statt!

Ziele

In der heutigen digitalen Informationswelt werden zunehmend immer mehr Daten in den unterschiedlichsten Datenbanken bzw. Dateisystems gespeichert. In diesem Sinne kann davon gesprochen werden, dass in naher Zukunft keine Daten in jeglichen Anwendungsbereichen mehr verloren gehen können. Durch diesen Umstand gewinnt der Bereich des Information Retrievals immer mehr an Bedeutung. Dieser Bereich widmet sich in erster Linie, wie in derartig großen und überwiegend unstrukturierten Datenbeständen überhaupt noch effizient gesucht werden kann. Populäre Anwendungen sind WWW-Suchmaschinen, Digitale Bibliotheken und Multimedia-Archive wie z.B. Bilddatenbanken.

Aufgrund der Vagheit des Informationsbedürfnisses und der unsicheren Repräsentation des Inhaltes der gespeicherten Objekte sind Standard-Datenbankmethoden wenig brauchbar, sondern müssen um die Konzepte Vagheit bzw. Unsicherheit erweitert werden. Da die inhaltsorientierte Suche im Vordergrund steht, sind zudem spezielle Verfahren zur Repräsentation des Inhaltes von Texten notwendig. Das Ziel der Vorlesung besteht darin, einen Einblick in diesen Themenkomplex zu geben.

Vorlesungsskripte

14Building Watson: An Overview of the DeepQA Project47PDF

Teil Inhalt #Seiten Skript Material
0 Organizational Issues 7 PDF
1 Introduction 41 PDF
2 Boolean Retrieval, Phrase Queries and Positional Indexes 41 PDF Shakespeare Complete Text, shakespeare.ipynb
3 Term vocabulary and Normalization 43 PDF Porter Stemmer, stemming.ipynb, part_of_speech.ipynb, porter.ipynb
4 Dictionaries and tolerant retrieval 42 PDF spelling.ipynb,
soundex.ipynb,
levenshtein.ipynb,
big.txt
5 Scoring, term weighting and the vector space model 67 PDF vectorspace.ipynb,
wikipedia_vectorspace.ipynb
6 Implementing IR-System I: Index compression 43 PDF
7 Implementing IR-System II: Index construction 86 PDF
8 Evaluation in information retrieval 52 PDF
9 Relevance feedback and query expansion 51 PDF
10 Probabilistic information retrieval 59 PDF
11 Language models for information retrieval 38 PDF
12 Web search basics – Web Size, Crawling, SPAM und Duplicate Detection 82 PDF
13 PageRank and HITS 43 PDF
15 Text Classification – Intro 60 PDF
16 Rule-based Text Classification 52 PDF
17 Naive Bayes Text Classification 41 PDF
18 Vector Space Text Classification 33 PDF
19 SVM Text Classification 44 PDF