[IATM] - [de] - [Advanced Topics in Text Mining]


Advanced Topics in Text Mining [2017 Sommer]
Code
IATM
Name
Advanced Topics in Text Mining
Leistungspunkte
4 LP
Dauer
ein Semester
Turnus
unregelmäßig
Lehrform
Vorlesung + Übung
Arbeitsaufwand
120 h; davon
30 h Präsenzstudium
20 h Prüfungsvorbereitung
70h Selbststudium und Hausaufgabenbearbeitung
Verwendbarkeit
B.Sc. Angewandte Informatik,
M.Sc. Angewandte Informatik,
M.Sc. Scientific Computing
Lernziel Die Studierenden sollen:
- ?Methoden der Datenvorbereitung strategisch anwenden und bewerten können
- ?Vor- und Nachteile verschiedener Datenrepräsentationen kennen?
- Ausgewählte Methoden des Text Mining anwenden und bewerten können?
- Die theoretischen Grundlagen der Methoden des Maschinellen Lernens so weit verstehen, dass Parameter geeignet gewählt werden können, um einen Algorithmus auf das konkrete Problem anpassen zu können?
- Modelle und Muster bewerten und vergleichen können
Inhalt In der Vorlesung werden Grundlagen sowie ausgewählte Schwerpunktthemen aus dem Bereich Text Mining vorgestellt.
- Grundlagen zur Datenmodellierung und Datenvorbereitung insbesondere für Textdaten
- Statistische und algorithmische Grundlagen der Analyseverfahren
- Grundlagen aus der Computerlinguistik zur Verarbeitung von Texten (bspw. Morphologische Analyse, Part-of-Speech Tagging)
- Ausgewählte und aktuelle Schwerpunktthemen wie Klassifikation, Clusteranalyse, Sequenzanalyse, Assoziationsanalyse, Topic Modeling mit Fokus auf der Anwendung auf Textdaten
Voraussetzungen empfohlen werden: Algorithmen und Datenstrukturen (IAD), Knowledge Discovery in Databases (IKDD)
Prüfungs
modalitäten
Erfolgreiche Teilnahme an den Übungen (mehr als 50% der Punkte müssen erreicht werden) und erfolgreiche Teilnahme an einer schriftlichen Prüfung
Literatur - Aggarwal, Charu C., and ChengXiang Zhai. Mining text data. Springer, 2012.
- Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press. 2008.
- Jerome H. Friedman, Robert Tibshirani und Trevor Hastie: The Elements of Statistical Learning, 2001
- Bing Liu (2011). Web Data Mining. Springer. Second Edition.