Vorlesung Einführung in Maschinelles Lernen
Termine und Informationen
Es handelt sich um eine integrierte Vorlesung mit Übung. Dieser Kurs ist eine Basisveranstaltung. Siehe auch den Eintrag im Vorlesungsverzeichnis
Vorlesung |
Donnerstags, 10 - 12 (ab 15.10.2009) |
Raum |
FR 7039 |
Übung |
Donnerstags, 12 - 14 (ab 15.10.2009) |
Raum |
FR 7039 |
Dozenten |
|
Sprechzeiten |
Prof. Dr. Klaus-Robert Müller: nach Vereinbarung |
Dr. Mikio Braun: nach Vereinbarung |
Es gibt eine Google group, in der aktuelle Ankündigungen zur Vorlesung zu finden sind. Dort können auch Fragen gestellt werden (z.B. Fehler auf dem Aufgabenblatt). Man muß angemeldet sein, um die Inhalte lesen zu können, der Zugang ist jedoch jedem offen.
Themen
Die Vorlesung behandelt einführende Themen im Bereich des maschinellen Lernens.
Im Einzelnen wird sich die Vorlesung mit den folgenden Themen beschäftigen:
- Grundlagen Wahrscheinlichkeitstheorie
- Maximum Likelihood Schätzer und Bayes'sche Inferenz
- Hauptkomponentenanalyse
- Faktoranalyse
- K-means Clustering
- Lineare Diskriminanzanalyse
- K-nächste Nachbarklassifikation
- Least Mean Squares Klassifikation
- Fisher Diskriminanten
- Regression
- Modellselektion
- Supportvektormaschinen
- Radialbasisfunktionsnetze
- Gauss'sche Prozesse
Im Anschluss an die Vorlesung findet die Übung statt, in der die erlernten Methoden vertieft werden.
Vorkenntnisse
Kenntnisse in Linearer Algebra und Grundkenntnisse in Wahrscheinlichkeitsrechnungsind werden vorausgesetzt. Zur Lösung eines Teils der Hausaufgaben werden Kenntnisse in einer mathematischen/statistischen Software benötigt. Wir empfehlen die Benutzung von matlab bzw. octave. Letzteres ist unter www.octave.org frei erhältlich. Matlab ist auf dem vom irb verwalteten System installiert und kann mit /home/ml/ml/bin/matlab gestartet werden.
Übungen
Die Übungsleistung geht in die Gesamtbenotung ein. Mindestens 50% der Übungen müssen bearbeitet werden, um zur abschließenden mündlichen Prüfung zugelassen zu werden.
Einige Hinweise zu den Abgaben:
Die Lösungen zu theoretischen Aufgaben sind handschriftlich abzugeben.
- Die praktischen Aufgaben werden über ein Webinterface abgegeben (wird jeweils bekanntgegeben).
Die Übungsblätter dürfen in Zweiergruppen bearbeitet und abgegeben werden, die Zusammensetzung sollte sich jedoch nicht ändern.
Darüber hinaus beachtet bitte folgende Hinweise:
- Die Lösungen sollten gut erklärt und strukturiert sein. Insbesondere sollte Programmcode auch ausreichend dokumentiert und den üblichen Konventionen entsprechend formatiert sein (z.B. Einrückungen).
- Natürlich müssen die Lösungen selbst erarbeitet und niedergeschrieben werden. Selbst wenn man sich "Anregungen" besorgt hat, muß der Lösungsweg selbst verstanden und unabhängig niedergeschrieben werden. Wörtliche Kopien anderer Lösungen oder aus dem Internet sind ein Vergehen, für das entsprechende Konsequenzen vorgesehen sind.
- Es kommt immer wieder vor, dass Studenten die Übungsaufgaben bearbeiten wollen, aber aus terminlichen Gründen nicht an der Übung selbst teilnehmen können. Bitte klärt das mit Eurem Übungsleiter ab und holt Eure Lösungen regelmäßig ab, um den Lernerfolg sicherzustellen.
Literatur und Links
Folgene Bücher geben eine umfassende Einführung in den Bereich des Maschinellen Lernens.
Christopher M. Bishop (2006) Pattern Recognition And Machine Learning , Springer.
Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern Classification , Wiley (2. Auflage).
- Trevor Hastie, Robert Tibshirani, Jerome Friedman (2001) The Elements of Statistical Learning, Springer.
Folgende Bücher geben eine umfassende Einführung in die Wahrscheinlichkeitstheorie und in die Statistik.
G. Bamberg, F. Baur (2006) Statistik, Oldenbourg-Verlag, 12. Auflage
L. Fahrmeir, R. Künstler, I. Pigeot, G. Tutz (2004) Statistik , Springer, 5. Auflage
L. Wasserman (2004) All of Statistics, Springer
Die wichtigsten Gleichungen für das Rechnen mit Matrizen und insbesondere die Ableitungsregeln für höherdimensionale Funktionen findet man hier:
K. B. Petersen, M. S. Pedersen (2007) The Matrix Cookbook. Technical University of Denmark [ externer link ]
Terminplan
Datum |
Thema |
Material |
15. 10. 2009 |
Einführung und die Bayesregel |
|
22. 10. 2009 |
Diskriminanzfunktionen und Maximum-Likelihood |
|
29. 10. 2009 |
Principal Component Analysis |
|
5. 11. 2009 |
Independent Component Analysis |
|
12. 11. 2009 |
Clustering |
|
19. 11. 2009 |
Klassifizierung, Fisher-Diskriminanzanalyse |
|
26. 11. 2009 |
k-nächste Nachbarregel, Regression |
|
3. 12. 2009 |
Modellselektion und Verlustfunktion |
|
10. 12. 2009 |
Statistisches Testen |
|
17. 12. 2009 |
Statistische Lerntheorie |
|
7. 1. 2009 |
Kerntrick und Support-Vektor-Machines, Kernel-PCA, Kernel-FDA |
|
14. 1. 2009 |
Neuronale Netze und Radialbasisfunktionsnetze |
|
21. 1. 2009 |
Gausssche Prozesse |
Paper "Gaussian Processes in Machine Learning", Online Buch "Gaussian Processes for Machine Learning" |
28. 1. 2009 |
Graphische Modelle |
|
4. 2. 2009 |
Expectation-Maximization-Algorithmus und Mixturmodelle |
|
11. 2. 2009 |
Zusammenfassung und Ausblick |
|
Übungsblatter
Blatt 1 Ein bißchen was zur Bayesformel und mehrdimensionalen Gaussverteilung
Blatt 2 Maximum-Likelihood Schätzer
Blatt 3 Hauptkomponentenanalyse
Blatt 4 Programmskelett Independent-Component-Analyse
Blatt 5 Programmskelett K-Means Clustering
Blatt 6 Programmskelett Fisher's Diskriminanzanalyse
Blatt 7 Programmskelett k-nächster Nachbarregel
Blatt 8 Programmskelett Bias-Varianz-Zerlegung
Blatt 9 Programmskelett Statistische Tests
Blatt 10 Mercerkerne
Blatt 11 Programmskelett Daten Support-Vektor-Maschinen
Blatt 12 Kernel-Fisher's-Diskriminanzanalyse
Blatt 13 Gausssche Prozesse
Blatt 14 Graphische Modelle
Blatt 15 Der EM-Algorithmus