332609a Datenanalyse, Datenintegration, Data Mining
Zuletzt geändert: | 24.01.2024 / Pfeffer |
EDV-Nr: | 332609a |
Studiengänge: |
Informationswissenschaften (Bachelor, 7 Semester) , Prüfungsleistung im Modul Datenanlyse, Datenintegration, Data Mining
in Semester
3 4 6 7
Häufigkeit: unregelmäßig |
Dozent: | |
Sprache: | Deutsch |
Art: | - |
Umfang: | 6 SWS |
ECTS-Punkte: | 10 |
Prüfungsform: | |
Beschreibung: |
Im Datenanalyse-Teil der Veranstaltung werden ausgehend von einer Wiederholung der typischen Datenverarbeitungs-Schritten wie regelbasiertes Filtern, Sortieren und Gruppieren komplexere Aufgaben bearbeitet. Dabei werden die bereits bekannten Datenstrukturen wie Listen und Dictionaries um Vektoren, Matrizen und mehrdimensionale Arrays erweitert. Zum Einsatz kommen Python-Bibliotheken wie pandas und numpy.
Ein weiterer Schwerpunkt ist die gezielte Auswahl von Daten aus großen Datensammlungen und das Zusammenführen von Daten aus unterschiedlichen Quellen. Da in typischen Anwendungsszenarien für diese Fragestellung oft sehr große Datenmengen bearbeitet werden, geht es hier auch um eine möglichst speicher- und ressourcensparenden Umsetzung in den eigenen Programmen. Die Veranstaltung wird zum größten Teil als "flipped classroom" durchgeführt, d.h. die Studierenden erhalten zu jedem Kontakttermin Materialien und Aufgaben, die sie in eigener Verantwortung durcharbeiten und vorbereiten. In der Kontaktzeit kann so vertieft auf die dabei aufgetretenen Probleme und Verständnisschwierigkeiten eingegangen werden. Prüfung: In einer kontrollierten Umgebung (PC-Pools) werden Programmieraufgaben gelöst. Die Studierenden haben Zugang zu der Arbeitsumgebung, wie sie in der Vorlesung etabliert wurde, und können auf eigene Materialien und eine Auswahl von Webseiten zugreifen. Die Prüfung dauert ca. 3 Stunden. |
Literatur: |
Armando Fandango, Ivan Idris: Python Data Analysis - Data manipulation and complex data analysis with Python, Second Edition. Packt Publishing. 2017
Wes McKinney: Datenanalyse mit Python. O'Reilly. 2023 Weitere Literatur finden Sie in der HdM-Bibliothek. |
Internet: |
https://pandas.pydata.org/docs/user_guide/index.html
https://betterprogramming.pub/numpy-illustrated-the-visual-guide-to-numpy-3b1d4976de1d |