Big Data
Programm
Data Science
Abschluss
Einzelzertifikat
Modulnummer
30100
Themenbereich
Data Management, Vertiefungsstudium
Leistungpunkte
5
Sprache
deutsch/englisch
Dozent
Prof. Dr. Thomas Eppler
Gebühren
1005 €
Dauer
6 Wochen
Onlineanteil
100%
Modulbeginn
1. Termin: 20.01.2025 - 02.03.2025
2. Termin: 19.01.2026 - 01.03.2026
Modulinhalte
Im Modul Big Data werden folgende Inhalte vermittelt.
Vorlesung:
- Überblick zu NO-SQL-Datenbanken
- Überblick zu Graphendatenbanken
- Architekturen für verteiltes und paralleles Datenmanagement und Datenverteilung
- Verteilte Anfragebearbeitung
- Clustering, Map Reduce, YARN, Tez
- Verteilte Datenbanken
- Vertikale/horizontale Fragmentierung
- Fragmentierungstransparenz
- Transaktionskontrolle
- Frameworks für Skalierung und Parallelisierung der Datenzugriffe am Beispiel von Apache Hadoop, Spark und verteilten RDBMS
Praktikum:
- Arbeiten mit Apache Hadoop, Spark Clustern, IBM Cloud, Azure, IBM Data Warehouse
- Arbeiten mit MongoDB, Apache Cassandra, Neo4J
- Arbeiten mit Injectiontools wie Apache Nifi, Talend, IBM NodeRed
Lernergebnisse, Kompetenzen
Die Studierenden
- kennen Systeme und Techniken für die parallele Datenverarbeitung.
- kennen die Aufgabenstellungen aus dem Themengebiet von Big Data.
Die Studierenden
- sind in der Lage die Problem- und Aufgabenstellungen mit Bezug auf das Themengebiet Big Data zu erkennen, diese, basierend auf eigenem Wissen und durch die gezielte Recherche zu beschreiben, Lösungsansätze zu entwickeln und diese allein oder im Team umzusetzen.
- sind in der Lage, eine anwendungsbezogene Evaluation von Daten, –Zugriffs- und – Verwaltungstechniken sowie von den diese Techniken implementierenden Systemen auszuführen, und darauf basierend eine zielgerechte Auswahl zu treffen. - sind in der Lage wissenschaftliche Beiträge im Themenbereich Big Data eigenständig zu lesen und qualitative Vergleiche der gelesenen Beiträge systematisch zu präsentieren.
Die Studierenden können im Rahmen einer eigenständigen Arbeit neue Ansätze für einen Big Data Prozess mit komplexer Aufgabenstellung entwickeln.
Die Studierenden erarbeiten sich den Inhalt selbständig anhand von Studienbriefen.
Teilnahmevoraussetzung
Für die Teilnahme an unseren Zertifikatsmodulen bestehen keine verpflichtenden Teilnahmevoraussetzungen, wir empfehlen jedoch grundlegende Kenntnisse von relationalen Datenbanken bzw. vorab das Modul 20100: Databases zu belegen.
Prüfungsform
Hausarbeit
Anmeldung zu den berufsbegleitenden Zertifikatsprogrammen
Melden Sie sich jetzt an!
Melden Sie sich jetzt zu einem Einzel- oder Gesamtzertifikat unserer Zertifikatsprogramme an. Damit wir sicherstellen können, dass Sie Ihre Zugangsdaten auch rechtzeitig erhalten, muss die Anmeldung spätestens zwei Wochen vor Beginn des (ersten) Moduls erfolgen.
Hinweis: Die Teilnehmerzahl ist im Interesse der Teilnehmer begrenzt, so dass wir eine frühzeitige, verbindliche Anmeldung empfehlen.
Sollten Sie noch Fragen haben, können Sie gerne jederzeit Kontakt mit uns aufnehmen.