Data Mining (praktisch)

5 ECTS Deutsch B.Sc.

Letzte Aktualisierung: 06.03.2025

Grunddaten
Kürzel DMP
Dauer des Moduls 1 Semester
Angeboten im Sommersemester
Veranstaltungsort Gummersbach
Verantwortliche
Prüfung
Prüfungsformen

Mündlicher Beitrag (50 %)

Projektarbeit (50 %)

Prüfungsphasen

Außerhalb der Prüfungswochen

Prüfende
1. Dietlind Zühlke
2. Boris Naujoks
Workload
Vorlesung 60 h
Übung 0 h
Seminar 0 h
Praktikum 0 h
Projektbetreuung 0 h
Projektarbeit 0 h
Selbststudium 90 h
Gesamt 150 h
Studiengänge
Pflichtmodul

Keine Zuordnung

Wahlmodul
Informatik PO-2
Sem. 6
IT-Management (Informatik) PO-2
Sem. 6
Medieninformatik PO-5
Sem. 6
Wirtschaftsinformatik PO-5
Sem. 6
Voraussetzungen
Zwingend

Keine Angabe

Empfohlen
Mathematische Grundkenntnisse (insbes. Rechnen mit Matrizen), Algorithmen und Programmierung sind Voraussetzung für eine erfolgreiche Teilnahme.

Angestrebte Lernergebnisse

Keine Angabe

Modulinhalte

Kann man mit Twitter Daten den Ausgang der Bundestagswahl vorhersagen? Wie deckt man in sozialen Netzwerken oder anhand von Verbindungsdaten Gruppen von Individuen auf, die zusammen gehören? Wie erzeugt man Profile von Internetnutzern, um deren Verhalten vorherzusagen oder Werbemaßnahmen zielgerecht zu platzieren? Wie betreibt man Meinungsforschung im Internet, also z.B. ob ein bestimmter Text einem Produkt positiv oder negativ gegenübersteht? Mit solchen Fragen, die von großem ökonomischen und politischen Interesse sind und gegenwärtig stark beforscht werden, wird sich das WPF Data Mining beschäftigen. Ausgangspunkt für die behandelten Verfahren ist die Lineare Algebra. Der Kurs gliedert sich in drei Teile:

Im ersten Teil (Vorlesung) werden theoretische Grundlagen für das Vorgehen ins Data Science Projekten sowie zur Modellierung gelegt, die sich jeweils auf die später zu bearbeitende Projektarbeit beziehen (also z.B. nur unsupervised Methoden).

Im zweiten Teil (Übung) kommen praktische Umsetzungskenntnisse vorrangig mit Python hinzu. Diese werden zum Teil auch als Online-Kurse in der Lernplattform DataCamp absolvierbar sein. Zu Beginn wird es einen Python-Einführungskurs geben.

Die Teilnehmerinnen und Teilnehmer sollen im dritten Teil des Kurses eine praxisrelevante Data Mining Aufgabe selbstständig bearbeiten, z.B. im Rahmen eines Data Mining Wettbewerbs (Data Mining Cup) oder durch die Analyse aktueller Daten eines Industriepartners.

Lehr- und Lernmethoden (Medienformen)

Keine Angabe

Empfohlene Literatur

  • Jan, H., Kamber, M., Peo, J.: Data Mining: Concepts and Techniques: Concepts and Techniques, Morgan-Kaufman, 2011.
  • Pang-Ning Tan, Michael Steinbach und Vipin Kumar: Introduction to Data Mining, Pearson, 2013.
  • Witten I.H., Eibe, F., Data Mining, Practical Machine Learning Tools and Techniques, Morgan Kaufmann, 2011.
  • James, G., Witten, D., Hastie, T., and Tibshirani, R. An Introduction to Statistical Learning with Applications in R, 4th ed. Springer, 2014.

Besonderheiten

Keine Angabe