Diese Website verwendet nur technisch notwendige Cookies. In der Datenschutzerklärung können Sie mehr dazu erfahren.

Zum Hauptinhalt springen
Logo, Startseite der Hochschule der Medien
Veranstaltungsbeschreibung

332578a Text Mining

Zuletzt geändert:24.01.2024 / Pfeffer
EDV-Nr:332578a
Studiengänge: Informationswissenschaften (Bachelor, 7 Semester) , Prüfungsleistung im Modul Text Mining in Semester 3 4 6 7
Häufigkeit: unregelmäßig
Dozent:
Sprache: Deutsch
Art: -
Umfang: 4 SWS
ECTS-Punkte: 5
Prüfungsform:
Beschreibung: Das Modul umfasst die grundlegenden Techniken der textuellen Sprachverarbeitung. Dies reicht von der Vorverarbeitung (z.B. Textsegmentierung, Part of Speech Tagging und Parsing von Sätzen) bis zu konkreten Anwendungen wie Entity Recognition oder Summarization. Dabei werden sowohl klassische deterministische Verfahren als auch auf maschinelles Lernen basierte Verfahren betrachtet.
Alle Verfahren werden sowohl theoretisch vorgestellt als auch in der praktischen Umsetzung mit Standardmodulen oder -tools erprobt.
Im Ausblick werden die Möglichkeiten von LLMs für das Text Mining vorgestellt und diskutiert.
Prüfung: In einer kontrollierten Umgebung (PC-Pools) werden Programmieraufgaben gelöst. Die Studierenden haben Zugang zu der Arbeitsumgebung, wie sie in der Vorlesung etabliert wurde, und können auf eigene Materialien und eine Auswahl von Webseiten zugreifen. Die Prüfung dauert ca. 3 Stunden.
Literatur: Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python– Analyzing Text with the Natural Language Toolkit. 2019. Kostenlos online unter https://www.nltk.org/book/

Weitere Literatur finden Sie in der HdM-Bibliothek.
Internet: https://www.nltk.org/