ESSENTIALS - Relationale Datenbanken und SQL for DATA SCIENCE
Während Python sich für die meisten von uns zu einer wichtigen Programmiersprache entwickelt hat, wurde aber auch die Datenbanksprache SQL in den letzten Jahren für die Nutzung von Datenbanken für Business Analytics und Data Science stark erweitert. Ziel des Kurses ist es, ausgewählte und hoffentlich für Sie neue oder längst vergessene Konzepte der Datenbanksprache SQL zu erlernen. Dabei geht es weniger um klassische Konzepte wie Insert, Update oder Delete sondern um sehr mächtige SQL-Sprachbefehle zur Verarbeitung und Analyse von (großen) strukturierten Datensätzen.
INHALTE
► Tools für den Zugriff auf relationale Datenbanken. Hierbei geht es um die Auswahl und Installation eines Werkzeuges, um SQL-Sprachbefehle an eine Datenbank zu senden.
► Architekturebenen von Datenbanken. Es ist wichtig, die Architektur von relationalen Datenbanken zu verstehen, da sie eine effiziente Organisation, Verwaltung und Sicherung von Daten ermöglichen und gleichzeitig die Skalierbarkeit und Performance der Systeme sicherstellen.
► Datenmodellierung. Verschiedene Modelle ermöglichen es, von den Benutzeranforderungen bis hin zur Datenbereitstellung methodische Übergänge zu schaffen und somit eine stabile und verlässliche Datenplattform bereitzustellen.
► Tables, Views, Joins und Unions. Für das Erstellen von Datenmodellen ist es unerlässlich, diese 4 Konzepte im Detail zu kennen, um Fehler zu vermeiden und eine möglichst hohe Datenqualität zu erreichen.
► Laden von Datenl Wie lädt man eigentlich 1.000.000 Datensätze in eine Datenbank? Wir schauen uns einige wenig bekannte, aber sehr mächtige Werkzeuge dazu an. Insbesondere die Microsoft PowerShell, die auf Windows, MacOS und Linux verfügbar ist, bietet sehr interessante und einfache Möglichkeiten.
► Stored Functions and Stored Procedures: SQL umfasst prozedurale Sprachkonzept wie Variablen, Schleifen und if-then-else Konstrukte. Da diese sehr tief im Kernel einer Datenbank ablaufen, können wir sehr effiziente Datenmanipulation durchführen.
► Data Preparation mit T-SQL. Über Stored Procedures und Stored Functions gelingt das Data Cleaning sehr einfach und schnell. Wir schauen uns einige gängie SQL-Befehle dazu an.
► SQL und Python als Stored Procedure. Sehr effizient ist die Ausführung von Python-Scripts in SQL. Also nicht: Ausführung von SQL innerhalb von Python, sondern genau umgekehrt. Da es sich bei SQL um Mengeoperationen handelt, bietet Python eine exzellente Ergänzung zu SQL. Wir zeigen dies an einem KI-Beispiel.
WAS UNS ERWARTET
Als Datenbank wird der SQL Server von Microsoft benutzt. Der SQL Server ist sehr weit verbreitet. Man findet ihn in allen Großunternehmen und im gehobenen Mittelstand. Die Konzepte lassen sich aber auf andere Datenbanksysteme, z.B. von Oracle oder IBM übertragen.
Als Voraussetzung genügt ein sicherer Umgang mit Excel Spreadsheets.
ABLAUF UND ANMELDUNG
Die Teilnahme ist kostenlos.
Bitte beachten Sie, dass die Plätze begrenzt sind.
Wir freuen uns auf Ihre Teilnahme, Ihre Fragen und anregende Gespräche.
LINKS
Teilnahmebescheinigung
Nach Abschluss eines Essential-Kurses erhalten Sie eine Teilnahmebestätigung.