332578a Text Mining
Zuletzt geändert: | 24.01.2024 / Pfeffer |
EDV-Nr: | 332578a |
Studiengänge: |
Informationswissenschaften (Bachelor, 7 Semester) , Prüfungsleistung im Modul Text Mining
in Semester
3 4 6 7
Häufigkeit: unregelmäßig |
Dozent: | |
Sprache: | Deutsch |
Art: | - |
Umfang: | 4 SWS |
ECTS-Punkte: | 5 |
Prüfungsform: | |
Beschreibung: |
Das Modul umfasst die grundlegenden Techniken der textuellen Sprachverarbeitung. Dies reicht von der Vorverarbeitung (z.B. Textsegmentierung, Part of Speech Tagging und Parsing von Sätzen) bis zu konkreten Anwendungen wie Entity Recognition oder Summarization. Dabei werden sowohl klassische deterministische Verfahren als auch auf maschinelles Lernen basierte Verfahren betrachtet.
Alle Verfahren werden sowohl theoretisch vorgestellt als auch in der praktischen Umsetzung mit Standardmodulen oder -tools erprobt. Im Ausblick werden die Möglichkeiten von LLMs für das Text Mining vorgestellt und diskutiert. Prüfung: In einer kontrollierten Umgebung (PC-Pools) werden Programmieraufgaben gelöst. Die Studierenden haben Zugang zu der Arbeitsumgebung, wie sie in der Vorlesung etabliert wurde, und können auf eigene Materialien und eine Auswahl von Webseiten zugreifen. Die Prüfung dauert ca. 3 Stunden. |
Literatur: |
Steven Bird, Ewan Klein, and Edward Loper: Natural Language Processing with Python– Analyzing Text with the Natural Language Toolkit. 2019. Kostenlos online unter https://www.nltk.org/book/
Weitere Literatur finden Sie in der HdM-Bibliothek. |
Internet: | https://www.nltk.org/ |