Veranstaltungsbeschreibung

143902a R for Machine Learning

Zuletzt geändert:14.12.2022 / von Carlsburg
EDV-Nr:143902a
Studiengänge: Computer Science and Media (Master), Prüfungsleistung im Modul R for Machine Learning in Semester 1 2 3
Häufigkeit: nur WS
Dozent: Prof. Dr.-Ing. Oliver Kretzschmar
Sprache: Deutsch
Art: -
Umfang: 3 SWS
ECTS-Punkte: 5
Workload: Veranstaltung:
15 Termine zu je 3 SWS = 33,75 Zeitstunden
Vor- bzw. Nachbereitung:
15 Termine zu je 10,33 SWS = 116,25 Zeitstunden
Gesamter Zeitaufwand (Workload) = 150 Zeitstunden

Die Teilnehmerzahl ist begrenzt
Inhaltliche Verbindung zu anderen Lehrveranstaltungen im Modul: Die Veranstaltung baut auf die mathematischen Konzepte der Veranstaltung "143104 Machine Learning" auf.
Prüfungsform:
Bemerkung zur Veranstaltung: Das bestandene Modul 143104 wird vorausgesetzt.
Beschreibung: ****** Wichtiger Hinweis zum Wintersemester 2021 *****
Die Veranstaltung wird während der SARS-CoV-2-bedingten Beschränkungen entweder als Präsens- oder als synchroner Distance-Learning-Kurs angeboten. Dies wird noch bekannt gegeben. Der Online-Zugang wird voraussichtlich über Zoom erfolgen und ebenfalls noch genauer bekannt gegeben. Es gilt der Stundenplan laut Starplan. Falls oder wenn wir uns wieder in Hörsälen treffen dürfen, gilt der jeweils in Starplan angegebene Raum.
**********************************************************************
Die Studierenden müssen anhand konkreter Fallbeispiele Aufgaben im Kontext der Inhalte der Lehrveranstaltung lösen (als Jupyter Notebooks), welche dann in der Vorlesung besprochen werden (ähnlich der PIA-Lehrveranstaltung von Johannes Maucher). Die dann abgegebenen Notebooks bilden die wesentliche Grundlage der Prüfungsleistung (weitere Abstimmung dann in der Vorlesung selbst). Ergänzend werden die wichtigsten theoretischen Konzepte der Use-Cases (siehe nachfolgend) in der Lehrveranstaltung erklärt.

Schwerpunkt liegt in der Anwendung maschineller Verfahren mit Hilfe von R an konkreten Use-Cases aus meinen Bereichen IT-Product- und IT-Project-Management, sowie Digital Analytics. Die Übertragung der erlernten Konzepte und Vorgehensweisen auf andere Domänen-Bereiche ist natürlich gegeben.

Einführung in R
  • Datentypen
  • Import/Export
  • Visualisierungsmöglichkeiten
  • Programmierungskonzepte
  • Datenmanipulation
  • Statistische Basisfunktionen

Maschinelles Lernen
  • Systematischer Prozess
  • Modell Evaluation

Feature Engineering

Verfahren des Maschinellen Lernens
  • Lineare und Nicht-lineare Regressionsverfahren
  • Gradient Descent Verfahren
  • Logistische Regression und LDA/QDA-Verfahren
  • Resampling- und Regularisierungstechniken
  • Tree Verfahren inkl. Bagging und Boosting
  • Vergleich und Tuning von Modellen
  • Clustering Verfahren
  • Faktorenanalysen zur Dimensionsreduktion
  • Choice-Based-Conjoint-Analyse
  • Deep-Learning Konzepte
  • (Support Vector Machine)

Literatur:
  • Allaire J., Chollet F.: Deep Learning with R, Manning, 2018
  • Backhaus K., Erichson B.E., Plinke W., Weiber R.: Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, Springer-Verlag, 13.Auflage, 2010
  • Backhaus K., Erichson B.E., Weiber R.: Fortgeschrittene Multivariate Analysemethoden: Eine anwendungsorientierte Einführung, Springer-Gabler, 2.Auflage, 2013
  • Bärtl M.: Statistik Schritt für Schritt, Independently published, 2017, Online Youtube: https://www.youtube.com/channel/UCtBEklAtHHji2V1TsaTzZXw
  • Chapman C.N., McDonnell Feit E.: R for Marketing Research and Analytics, Springer, 2015
  • Goodfellow I., Bengio Y., Courville A.: Deep Learning, The MIT Press, 2017
  • Hastie T., James G., Witten D., Tibshirani R.: An Introduction to Statistical Learning, Springer, 2017, Online: http://www-bcf.usc.edu/~gareth/ISL/index.html
  • Hastie T., Tibshirani R., Friedman J.: The Elements of Statistical Learning, Springer, 2017, Online: https://web.stanford.edu/~hastie/ElemStatLearn/
  • Kuhn M., Johnson K.: Applied Predictive Modeling, Springer, 1st ed. 2013, 2st ed. 2018
  • Wickham H.: Advanced R, CRC Press Inc, 2019, Online: http://adv-r.had.co.nz
  • Wickham H., Grolemund G.: R for Data Science, O'Reilly, 2017, Online: https://r4ds.had.co.nz
  • Wollschläger D.: Grundlagen der Datenanalyse mit R, Springer Spektrum, 2017
  • Zheng A., Casari A.: Feature Engineering for Machine Learning Models: Principles and Techniques for Data Scientists, O'Reilly, 2018

... weitere siehe Vorlesungsskript

Weitere Literatur finden Sie in der HdM-Bibliothek.