PTI01831 – Data Science III, Überwachtes und Unüberwachtes Lernen

Modul
Data Science III, Überwachtes und Unüberwachtes Lernen
Data Science III, Supervised and Unsupervised Learning
Modulnummer
PTI01831
Version: 1
Fakultät
Physikalische Technik / Informatik
Niveau
Bachelor
Dauer
1 Semester
Turnus
Wintersemester
Modulverantwortliche/-r

Prof. Dr. Jens Flemming
Jens.Flemming(at)fh-zwickau.de

Dozent/-in(nen)

Prof. Dr. Mike Espig
mike.espig(at)fh-zwickau.de
Dozent/-in in: "Data Science III, Überwachtes und Unüberwachtes Lernen "

Prof. Dr. Jens Flemming
Jens.Flemming(at)fh-zwickau.de
Dozent/-in in: "Data Science III, Überwachtes und Unüberwachtes Lernen "

Lehrsprache(n)

Deutsch - 80.00%
in "Data Science III, Überwachtes und Unüberwachtes Lernen "

Englisch - 20.00%
in "Data Science III, Überwachtes und Unüberwachtes Lernen "

ECTS-Credits

10.00 Credits

Workload

300 Stunden

Lehrveranstaltungen

8.00 SWS (2.00 SWS Praktikum | 6.00 SWS Vorlesung mit integr. Übung / seminaristische Vorlesung)

Selbststudienzeit

180.00 Stunden
180.00 Stunden Selbststudium - Data Science III, Überwachtes und Unüberwachtes Lernen

Prüfungsvorleistung(en)

Softwareprojekt
in "Data Science III, Überwachtes und Unüberwachtes Lernen "

Prüfungsleistung(en)

mündliche Prüfungsleistung
Modulprüfung | Prüfungsdauer: 30 min | Wichtung: 100%
in "Data Science III, Überwachtes und Unüberwachtes Lernen "

Medienform
Keine Angabe
Lehrinhalte/Gliederung

Im Modul werden konkrete Verfahren des überwachten maschinellen Lernens vorgestellt. Aus dem Bereich des unüberwachten Lernens werden Clustering, generatives Lernen und nichtlineare Techniken zur Dimensionsreduktion behandelt.

Im Gegensatz zum überwachten Lernen (Lernen anhand von Beispielen) zielen Verfahren des unüberwachten Lernens auf das automatische Auffinden und Ausnutzen von Strukturen in großen Datenmengen, die dem menschlichen Auge verborgen sind.

Im Kontext konkreter Anwendungsszenarien wird auch auf ethische und gesellschaftliche Aspekte Algorithmen-gestützten Entscheidens eingegangen.

Die praktische Umsetzung der behandelten Verfahren erfolgt im Wesentlichen mit den Python-Paketen Scikit-Learn, Tensorflow und Keras.

Verfahren des überwachten Lernens:

  • Entscheidungsbäume für Regression und Klassifikation
  • Bagging, insbesondere Random-Forests
  • Boosting
  • k-Nearest-Neighbors-Verfahren
  • logistische Regression
  • Support-Vector-Maschinen (SVMs)
  • Naive-Bayes-Klassifizierer
  • Grundlagen der Textklassifikation

Clustering:

  • Clustering-Arten und Qualitätsmaße
  • k-Means-Clustering
  • agglomeratives Clustering, Dendrogramme
  • DBSCAN und OPTICS
  • Gaussian-Mixture-Models

Nichtlineare Dimensionsreduktion:

  • Autoencoder
  • Kernel-PCA
  • Multidimensional Scaling, insbesondere Isomap
  • Locally Linear Embedding (LLE)
  • Stochastic Neighbor Embedding (SNE)
  • Self-Organizing Maps (SOMs)
Qualifikationsziele

Die Studierenden verfügen über umfangreiche Methodenkenntnis im Bereich des überwachten maschinellen Lernens. Sie können für konkrete Aufgabenstellungen geeignete Konzepte und Verfahren auswählen, diese praktisch umsetzen sowie deren Möglichkeiten und Grenzen einschätzen.

Auf dem Gebiet des unüberwachten Lernens besitzen die Studierenden einen Überblick über typische Aufgabenstellungen und geeignete Lösungsansätze. Sie verfügen über weitreichende Kenntnisse sowohl klassischer als auch moderner Methoden des unüberwachten Lernens.

Die Studierenden sind in der Lage, ihre Methodenkenntnis durch eigenständiges Literaturstudium zu erweitern und zu vertiefen. Darüber hinaus können Sie ethische Aspekte algorithmischer Entscheidungsfindung erkennen, beurteilen und in den gesellschaftlichen Kontext einordnen.

Besondere Zulassungsvoraussetzung

keine

Empfohlene Voraussetzungen
  • PTI11820 - Data Science II, Datenvisualisierung & Überwachtes Lernen 
  • PTI01710 - Mathematische Grundlagen I
  • PTI01720 - Mathematische Grundlagen II
Fortsetzungsmöglichkeiten

PTI01841, PTI01850, PTI01860, PTI01870

Literatur
  • Vorlesungsskript
  • Géron: Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow, O'Reilly Media
  • Chollet: Deep Learning with Python, Manning
  • Mohri, Rostamizadeh, Talwalkar: Foundations of Machine Learning, MIT Press
  • Shalev-Shwartz, Ben-David: Understanding Machine Learning From Theory to Algorithms,  Cambridge University Press
  • Bishop: Pattern Recognition and Machine Learning, Springer 
  • Vapnik: Statistical Learning Theory, Springer
  • Vapnik: The Nature of Statistical Learning Theory, Springer
  • Györfi, Kohler, Krzyzak, Walk: A Distribution-Free Theory of Nonparametric Regression, Springer
  • Cucker, Zhou: Learning Theory An Approximation Theory Viewpoint, Cambridge Monographs
  • Barber: Bayesian Reasoning and Machine Learning, Cambridge University Press
  • Murphy: Machine Learning A Probabilistic Perspective, MIT Press
Hinweise
Keine Angabe