Module guide

Angewandte Künstliche Intelligenz (AKI)

Data Engineering

Empfohlene Vorkenntnisse

Datenbanken

Lehrform Vorlesung/Labor
Lernziele / Kompetenzen

Ein umfangreicher Anteil eines datengetriebenen Analysesystems wird durch die Bereitstellung einer Dateninfrastruktur bestimmt. Dieses Modul vermittelt grundlegende Inhalte zu Datenverwaltungsaufgaben wie denen der Datenerfassung, Datenaufbereitung, Datentransformation und Datenvalidierung. Die Studierenden kennen Architekturen, Methoden und Frameworks zum Aufbau von Datenpipelines und der verteilten, parallelen Verarbeitung und Speicherung von Daten mit Big Data Technologien. Sie können die wesentlichen Architekturansätze und Methoden charakterisieren und bewerten. Sie können die Methoden und Architekturen für gegebene Problemstellungen systematisch aufgrund von Randbedingungen (z.B. Datencharakteristik, Systemarchitektur) auswählen und implementieren.

Dauer 1
SWS 4.0
Aufwand
Lehrveranstaltung 60
Selbststudium / Gruppenarbeit: 120
Workload 180
ECTS 6.0
Voraussetzungen für die Vergabe von LP

Modulprüfung für "Data Engineering" (K60) "Praktikum Data Engineering" muss "m.E." attestiert sein.

Modulverantwortlicher

Prof. Dr. Stephan Trahasch

Max. Teilnehmer 41
Empf. Semester 3
Haeufigkeit jedes Jahr (SS)
Verwendbarkeit

Bachelor-Studiengang AKI

Veranstaltungen

Data Engineering

Art Vorlesung
Nr. EMI927
SWS 2.0
Lerninhalt

Die LV umfasst folgende Lerninhalte:

  • ETL-Prozesse
  • Datenqualität
  • Messaging-Architekturen und Systeme
  • Stream Processing
  • NoSQL-Datenbanken
  • Hadoop DFS und MapReduce
  • Verteile Analyse großer Datenmengen mit verteilten Systemen wie Apache Spark, Flink
  • Cloud-Dienste zur Verarbeitung und Speicherung von großen Datenmengen
Literatur
  • Kleppmann, Martin (2018): Designing data-intensive applications. The big ideas behind reliable, scalable, and maintainable systems. Fifth release. Beijing, Boston, Farnham, Sebastopol, Tokyo: O'Reilly.
  • White, Tom (2015): Hadoop. The definitive guide. 4. edition: O'Reilly & Associates.
  • Chambers, Bill; Zaharia, Matei (2018): Spark. The definitive guide: big data processing made simple. First edition. Sebastapol, CA: O'Reilly Media.
  • Apel, Detlef (2015): Datenqualität erfolgreich steuern. Praxislösungen für Business Intelligence Projekte. 3., überarbeitete und erweiterte Auflage. Heidelberg [Germany]: dpunkt.verlag (Edition TDWI).

Praktikum Data Engineering

Art Praktikum
Nr. EMI928
SWS 2.0
Lerninhalt

Vertiefung der Lerninhalte aus der Vorlesung durch individuelle praktische Übungen in den Bereichen

  • ETL-Prozesse
  • NoSQL-Datenbanken
  • HDFS und MapReduce
  • Spark
Literatur

Géron, Aurélien (2019): Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow. Concepts, tools, and techniques to build intelligent systems. Second edition. Sebastopol, CA: O'Reilly Media, Inc.