Maschinelles Lernen - Theorie und Anwendung
Integrierte Vorlesung mit Übung
Termine und Dozenten
Termin: |
Vorlesung: Dienstag, 10:00 - 12:00 Uhr, Beginn 13.04.2010 |
Übung: Dienstag, 12.00 - 14.00 Uhr, Beginn 13.04.2010 |
|
Raum: |
FR 1002 |
Dozent: |
|
Ansprechpartner: |
Themen
In dieser Vorlesungen werden weiterführende Themen des Maschinellen Lernens behandelt. Ein besonderer Schwerpunkt wird auf die Anwendung gelegt werden. Mehrere erfolgreiche Anwendungen des Maschinellen Lernens werden besprochen, und auf die jeweiligen Besonderheiten wird eingegangen. Unter anderem werden folgende Themen behabdelt:
- halbüberwachtes Lernen
- Boosting-Verfahren
- Optimierungstheorie
- Kernmethoden für strukturierte Daten
- Lernen auf strukturierten Daten
- Graphische Modelle
Beispiele für erfolgreiche Anwendungen sind unter anderem
- Bioinformatik
- Erkennen von Angriffen in Computernetzwerken
- Textmining
Voraussetzungen
Vorausgesetzt werden Kenntnisse des Maschinellen Lernens (etwa im Rahmen der Veranstaltung Maschinelles Lernen I) und gute Mathematikkenntnisse, insbesondere Wahrscheinlichkeitsrechnung, Statistik, Linear Algebra. Zur Bearbeitung der Übngsaufgaben sind Programmierkenntnisse in Matlab erforderlich, die im Kurs Einführung in die computergestützte Datenanalyse mit Matlab vermittelt werden.
Weitere Informationen
Für die Lehre wurde eine Google-Group eingerichtet. Man muß sich registrieren, um die Beiträge lesen zu können, aber jeder kann sich registrieren.
Vorlesungsplan
Vorläufige Planung der Vorlesungen
Termin |
Thema |
Materialien |
20. April 2010 |
Non-linear maps |
|
27. April 2010 |
Non-linear maps, non-metric data, empirical kernel map |
Siehe auch "Introduction to Machine Learning", "Concepts of Probability for Machine Learning" hier. Link zu t-SNE |
4. Mai 2010 |
Stationary Subspace Analysis |
|
11. Mai 2010 |
Canonical Correlation Analysis and Extensions |
|
18. Mai 2010 |
Kerne für strukturierte Daten |
|
25. Mai 2010 |
Maschinelles Lernen für Intrusion Detection |
|
1. Juni 2010 |
Relevante Dimension im Kernelfeaturespace |
|
8. Juni 2010 |
Text Mining |
|
15. Juni 2010 |
Maschinelles Lernen in der Bioinformatik |
|
22. Juni 2010 |
Maschinelles Lernen in der Bioinformatik |
|
29. Juni 2010 |
Hidden-Markov-Modelle |
|
6. Juli 2010 |
Optimierungstheorie |
|
13. Juli 2010 |
Large Scale Learning |
|
Übungen
Die Vorlesung wird in einer mündlichen Prüfung abgeprüft. Voraussetzung hierfür ist die erfolgreiche Teilnahme an der Übung. Dies bedeutet, dass 50% der Übungsaufgaben erfolgreich bearbeitet werden müssen und mindestens eine Aufgabe an der Tafel erklärt werden muß.
Blatt 1: full_sheet01.pdf LLE
Blatt 2: full_sheet02.pdf t-SNE. Weitere Dateien: sheet02.m mnist_train.mat
Blatt 3: full_sheet03.pdf Stationary Subspace Analysis SSA Toolbox ssa_data.mat
Blatt 4: full_sheet04.pdf Temporal Kernel Canonical Correlation Analysis tkcca_example.m tkcca_simple.m tkcca_toy_data.mat
Blatt 5: full_sheet05.pdf Kerne und Kernel PCA sheet05.m
Blatt 6: full_sheet06.pdf Kerne für strukturierte Daten
Blatt 7: full_sheet07.pdf Intrusion Detection sheet07.m stud-data.mat.gz
Blatt 8: full_sheet08.pdf Relevant Dimensionality Estimate sheet08.m
Blatt 9: full_sheet09.pdf TextMining sheet09.py sheet09.m data.tar.gz
Blatt 10: full_sheet10.pdf Bioinformatik
Blatt 11: full_sheet11.pdf Bioinformatik sheet11.m splice-train-data.txt splice-train-label.txt splice-test-data.txt splice-test-label.txt
Blatt 12: full_sheet12.pdf Hidden-Markov-Modelle
Blatt 13: full_sheet13.pdf Optimierungstheorie.