Modulhandbuch

Mechatronik und Robotik (MMR)

Big Data und Data Mining

Empfohlene Vorkenntnisse

Programmierkenntnisse in einer Hochsprache

Lineare Algebra

Lehrform Vorlesung/Praktikum
Lernziele / Kompetenzen

Erfolgreiche Teilnehmer*innen kennen Konzepte sowie Technologien zur Speicherung und verteilten Verarbeitung von Big Data. Sie kennen Algorithmen zur Analyse von Big Data und können diese anwenden.
Die Studierenden erwerben darüber hinaus Kenntnisse über die Techniken, Möglichkeiten und Anwendungen des Data Mining, insbesondere im Zeitreihenanalyse. Erfolgreiche Teilnehmer*innen sind in der Lage, Möglichkeiten zur Anwendung von Data Mining in einer Unternehmensumgebung zu erkennen, geeignete Techniken auszuwählen und anzuwenden und die Ergebnisse zu interpretieren.

Dauer 2
SWS 6.0
Aufwand
Lehrveranstaltung 90
Selbststudium / Gruppenarbeit: 120
Workload 210
ECTS 7.0
Voraussetzungen für die Vergabe von LP

Big Data Analytics: K60 (1/2), Praktikum Big Data Analytics: LA (unbenotet), Data Mining: K60 (1/2)

Leistungspunkte Noten

7 CP

Modulverantwortlicher

Prof. Dr. Stephan Trahasch

Empf. Semester 1+2
Haeufigkeit jedes 2. Semester
Verwendbarkeit

Master-Studiengang MMR

Veranstaltungen

Big Data Analytics

Art Vorlesung
Nr. EMI2121
SWS 2.0
Lerninhalt

Speicherung, Abfrage und Analyse von großen Datenmengen ist ein anspruchsvolles Thema, das erhebliche Auswirkungen in verschiedenen Bereichen der Industrie und der Wissenschaft hat. Die Vorlesung behandelt Konzepte, Algorithmen und Technologien für Big Data sowie Beispiele für typische Anwendungen, die davon profitieren können. 

Neben Ansätzen und Technologien zur Speicherung von großen Datenmengen wie bspw. auf Basis von Hadoop File System und NoSQL-Datenbanken werden insbesondere Konzepte zur Analyse von großen Datenmengen vorgestellt und diskutiert. Neben der Batch-Verarbeitung auf Basis von MapReduce oder SQL-ähnlichen Anfragesprachen sind auch Technologien zum Stream-Processing von besonderem Interesse. Es werden verschiedene Algorithmen und Technologien zum Machine Learning für Big Data Anwendungen wie beispielsweise Outlier Detection oder Page Rank und deren skalierbare Ausführung behandelt. Mögliche Big Data Anwendungen werden auch immer unter ethischen Aspekten diskutiert und bewertet.


Literatur

Rajaraman, A., Ullman, J. D., Mining of massive datasets, New York, N.Y., Cambridge, Cambridge University Press, 2012
White, T., Hadoop, The definitive guide, 4. edition: O'Reilly & Associates, 2015
Marz, N., Warren, J., Big data: Principles and best practices of scalable realtime data systems, O'Reilly Media, 2013
Aggarwal, Charu C., Data Mining, The Textbook, Cham, Springer International Publishing, 2015

Praktikum Big Data Analytics

Art Praktikum
Nr. EMI2122
SWS 2.0
Lerninhalt

Praktische Umsetzung von Konzepten, Methoden und Big Data Technologien in Übungen.

Bearbeitung von Fallstudien.


Data Mining

Art Vorlesung
Nr. EMI2117
SWS 2.0
Lerninhalt

Data Mining wird allgemein als Ansatz zur Aufdeckung neuartiger Muster oder Zusammenhänge in großen Datenbeständen aufgefasst. Die betrieblichen Anwendungsmöglichkeiten von Data Mining sowie deren methodische Grundlagen werden in dem Modul vorgestellt, diskutiert und angewandt. Neben den einzelnen Methoden des Data Minings wird der Gesamtprozess von der Datenvorbereitung bis hin zur Evaluation nach dem CRISP-Standard behandelt. Themen sind u.a.

  • Zeitreiehenanalyse
  • Random Forest
  • Gradient Boosting
  • Support Vector Machines
Literatur

Hastie, Trevor; Tibshirani, Robert; Friedman, J. H. (2017): The elements of statistical learning. Data mining, inference, and prediction. 12th ed. New York: Springer (Springer series in statistics).
Hyndman, Rob J. (2018): Forecasting. Principles and practice ; [a comprehensive indtroduction to the latest forecasting methods using R ; learn to improve your forecast accuracy using dozenss of real data examples.]. second print edition. Lexington, Ky.: Otexts.
Han, J., Kamber, M., Pei, J., Data Mining: Concepts and Techniques, 3rd ed. Burlington, Elsevier Science, 2011
Hand, D. J., Mannila, H., Smyth, P., Principles of data mining, Cambridge, Mass, MIT Press, 2001