Diese Website verwendet nur technisch notwendige Cookies. In der Datenschutzerklärung können Sie mehr dazu erfahren.

Zum Hauptinhalt springen
Logo, Startseite der Hochschule der Medien
Veranstaltungsbeschreibung

332609a Datenanalyse, Datenintegration, Data Mining

Zuletzt geändert:24.01.2024 / Pfeffer
EDV-Nr:332609a
Studiengänge: Informationswissenschaften (Bachelor, 7 Semester) , Prüfungsleistung im Modul Datenanlyse, Datenintegration, Data Mining in Semester 3 4 6 7
Häufigkeit: unregelmäßig
Dozent:
Sprache: Deutsch
Art: -
Umfang: 6 SWS
ECTS-Punkte: 10
Prüfungsform:
Beschreibung: Im Datenanalyse-Teil der Veranstaltung werden ausgehend von einer Wiederholung der typischen Datenverarbeitungs-Schritten wie regelbasiertes Filtern, Sortieren und Gruppieren komplexere Aufgaben bearbeitet. Dabei werden die bereits bekannten Datenstrukturen wie Listen und Dictionaries um Vektoren, Matrizen und mehrdimensionale Arrays erweitert. Zum Einsatz kommen Python-Bibliotheken wie pandas und numpy.
Ein weiterer Schwerpunkt ist die gezielte Auswahl von Daten aus großen Datensammlungen und das Zusammenführen von Daten aus unterschiedlichen Quellen. Da in typischen Anwendungsszenarien für diese Fragestellung oft sehr große Datenmengen bearbeitet werden, geht es hier auch um eine möglichst speicher- und ressourcensparenden Umsetzung in den eigenen Programmen.
Die Veranstaltung wird zum größten Teil als "flipped classroom" durchgeführt, d.h. die Studierenden erhalten zu jedem Kontakttermin Materialien und Aufgaben, die sie in eigener Verantwortung durcharbeiten und vorbereiten. In der Kontaktzeit kann so vertieft auf die dabei aufgetretenen Probleme und Verständnisschwierigkeiten eingegangen werden.

Prüfung:
In einer kontrollierten Umgebung (PC-Pools) werden Programmieraufgaben gelöst. Die Studierenden haben Zugang zu der Arbeitsumgebung, wie sie in der Vorlesung etabliert wurde, und können auf eigene Materialien und eine Auswahl von Webseiten zugreifen. Die Prüfung dauert ca. 3 Stunden.
Literatur: Armando Fandango, Ivan Idris: Python Data Analysis - Data manipulation and complex data analysis with Python, Second Edition. Packt Publishing. 2017

Wes McKinney: Datenanalyse mit Python. O'Reilly. 2023



Weitere Literatur finden Sie in der HdM-Bibliothek.
Internet: https://pandas.pydata.org/docs/user_guide/index.html

https://betterprogramming.pub/numpy-illustrated-the-visual-guide-to-numpy-3b1d4976de1d