PTI01850 – Statistical Learning Theory

Module

Statistical Learning Theory
Statistische Lerntheorie

Module number

PTI01850
Version: 2

Faculty

Physikalische Technik / Informatik

Level

Bachelor

Duration

1 Semester

Semester

Summer semester

Module supervisor

Prof. Dr. Mike Espig
mike.espig(at)fh-zwickau.de

Lecturer(s)

Prof. Dr. Mike Espig
mike.espig(at)fh-zwickau.de

Course language(s)

German - 80.00%
in "Statistische Lerntheorie"

English - 20.00%
in "Statistische Lerntheorie"

ECTS credits

5.00 credits

Workload

150 hours

Courses

4.00 SCH (4.00 SCH Lecture with integrated exercise / seminar-lecture)

Self-study time

90.00 hours
90.00 hours Self-study - Statistische Lerntheorie

Pre-examination(s)

in "Statistische Lerntheorie"

Examination(s)

schriftliche Prüfungsleistung
Module examination | Examination time: 60 min | Weighting: 100%
in "Statistische Lerntheorie"

Media type

No information

Instruction content/structure

Die Lerntheorie befasst sich mit der Extraktion von Gesetzmäßigkeiten aus Beobachtungen. Das Grundproblem hierbei ist die "Generalisierung:" die extrahierten Gesetzmäßigkeiten sollen nicht nur die bereits vorliegenden Beobachtungen (die "Trainingsmenge") korrekt erklären, sondern auch für neue Beobachtungen zutreffend sein. Dieses Problem der Induktion berührt Grundsatzfragen nicht nur der Statistik, sondern der empirischen Wissenschaften im Allgemeinen. Dazu gehören die Repräsentation von Daten und von Vorwissen, sowie die Komplexität oder Kapazität von Erklärungen bzw. Modellen.

Die anschauliche Bedeutung dieser Theorie lässt sich wie folgt fassen: Schafft man es, die Trainingsdaten mit einem einfachen Modell (d.h. einer Funktionsklasse, deren VC-Dimension im Vergleich zur Anzahl der Trainingsbeispiele niedrig ist) zu erklären (d.h. das empirische Risiko gering zu halten), so besteht Grund zu der Annahme, dass der wirkliche funktionale Zusammenhang gefunden wurde. Kann man die Daten nur mit einer Lernmaschine (bzw. Funktionsklasse) von vergleichsweise hoher VC-Dimension erklären, so ist dies nicht der Fall: Die Maschine kann ihre Kapazität (VC-Dimension) dazu verwendet haben, die Beispiele einzeln zu memorisieren (Overfitting), anstatt eine kompaktere zugrunde liegende Regularität zu lernen — dementsprechend ist nicht zu erwarten, dass neue Beispiele zuverlässig klassifiziert werden können. Das Prinzip der strukturellen Risikominimierung verwendet probabilistische Schranken, um das erwartete Risiko durch Kontrolle von empirischem Risiko und VC-Dimension zu minimieren, d.h. um eine Funktion zu finden, die möglichst gut auf neue Beispiele generalisiert. Strukturelle Risikominimierung passt also in diesem Sinne die Komplexität der Lernmaschine dem zu lösenden Problem an, und stellt somit eine Basis für moderne Lernalgorithmen dar.

Insbesondere werden folgende Themen einstudiert:

Theoretischer Rahmen der Statistischen Lerntheorie
Prinzip der empirischen Risikominimierung
Generalisierungsfähigkeit
Hoeffding-Ungleichung
VC-Dimension
Memorisierung (Overfitting)
Erwartetes Risiko

Qualification objectives

Die Studierenden verstehen die grundsätzlichen Aussagen der von Vapnik und Chervonenkis entwickelte Lerntheorie zum Induktionsprinzip. Sie können die theoretischen Erkenntnisse praxisgerecht beim Überwachten Lernen anwenden sowie die entwickelten Strategien beim Overfitting entsprechend einordnen. Ferner kennen sie a priori die quantitativen Grenzen des Überwachten Lernen bei konkreten Problemstellungen.

Special admission requirements

keine

Recommended prerequisites

PTI182
PTI183
PTI171 - Mathematische Grundlagen I
PTI172 - Mathematische Grundlagen II

Continuation options

PTI186, PTI187

Literature

Vorlesungsskript
Mohri, Rostamizadeh, Talwalkar: Foundations of Machine Learning, MIT Press
Shalev-Shwartz, Ben-David: Understanding Machine Learning From Theory to Algorithms, Cambridge University Press
Bishop: Pattern Recognition and Machine Learning, Springer
Vapnik: Statistical Learning Theory, Springer
Vapnik: The Nature of Statistical Learning Theory, Springer
Györfi, Kohler, Krzyzak, Walk: A Distribution-Free Theory of Nonparametric Regression, Springer
Cucker, Zhou: Learning Theory An Approximation Theory Viewpoint, Cambridge Monographs
Barber: Bayesian Reasoning and Machine Learning, Cambridge University Press
Murphy: Machine Learning A Probabilistic Perspective, MIT Press

Notes

No information

Assignment to curriculum

250 Data Science - Bachelor 2019 Vollzeit

250 Data Science - Bachelor 2019 Teilzeit

250 Data Science - Bachelor 2022 Vollzeit

250 Data Science - Bachelor 2022 Teilzeit

290 Studienangebot der Fakultät Physikalische Technik/Informatik (PTI) für Austauschstudierende für das Studienjahr 2023/2024 - Abschluss im Ausland 2023 Vollzeit

250 Data Science - Bachelor 2023 Vollzeit

250 Data Science - Bachelor 2023 Teilzeit

250 Data Science - Bachelor 2023 Vollzeit

250 Data Science - Bachelor 2023 Teilzeit

Close detail view