Praktikum Maschinelles Lernen und Datenanalyse
Termin: |
Montag 10:00 - 12:00 Uhr (Vorlesung), Mittwoch 10:00 - 12:00 Uhr (Gemeinsame Sprechstunde) |
Raum: |
FR 3001 (Montag 10:00 - 12:00 Uhr) und FR 6043 (Mittwoch 10:00 - 12:00 Uhr) |
Dozent: |
Prof. Dr. Klaus-Robert Müller |
Ansprechpartner: |
Dr. Mikio Braun und Paul von Bünau (buenau@cs.tu-berlin.de) |
Im Praktikum Maschinelles Lernen und Datenanalyse soll der Prozess der explorativen Datenanalyse geübt werden. Der Schwerpunkt liegt auf den Themengebieten Visualisierung und Dimensionsreduktion, Klassifikation mit Neuronalen Netzen, Hidden-Markov-Modelle auf Genomdaten und Support-Vektor-Maschinen. Die Aufgaben sind kombinierte Programmier- und Simulationsaufgaben in Matlab.
Der Besuch des Kurses Einführung in die computergestützte Datenanalyse mit Matlab wird empfohlen. Grundlegende Kentnisse des Maschinellen Lernen sind sehr hilfreich, bei grossem Interesse und Engagement aber keine zwingende Voraussetzung.
Die Veranstaltung gliedert sich in zwei Teile: Eine Vorlesung, in der Methoden und Theorie der Aufgaben vermittelt werden (Montags 10:00 - 12:00 Uhr) und eine gemeinsame Sprechstunde (Mittwochs 10:00 - 12:00 Uhr), in der wir Fragen und Probleme besprechen, die bei der Bearbeitung der Aufgaben auftauchen.
Weitere Information findet Ihr im Informationsblatt.
Termine
Datum |
Uhrzeit |
Raum |
Beschreibung |
Montag, 14.04. |
10:00 Uhr |
FR 3001 |
Vorbesprechung, Ausgabe Übungsblatt 1 |
Mittwoch, 16.04. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 1 und Matlab Crash-Kurs |
Mittwoch, 23.04. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 1 |
Montag, 28.04. |
10:00 Uhr |
|
Abgabeschluss Übungsblatt 1 |
Montag, 28.04. |
10:00 Uhr |
FR 3001 |
Vorlesung zu Übungsblatt 2 |
Mittwoch, 30.04. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 2 |
Mittwoch, 7.05. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 2 |
Mittwoch, 14.05. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 2 |
Montag, 19.05. |
10:00 Uhr |
|
Abgabeschluss Übungsblatt 2 |
Montag, 19.05. |
10:00 Uhr |
FR 3001 |
Vorlesung zu Übungsblatt 3 |
Mittwoch, 21.05. |
10:00 Uhr |
FR 6043 |
Besprechung der Lösung von Übungsblatt 2 (Haymo, Pascal), Gemeinsame Sprechstunde zu Übungsblatt 3 |
Mittwoch, 28.05. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 3 |
Montag, 2.06. |
10:00 Uhr |
|
Abgabeschluss Übungsblatt 3 |
Montag, 2.06. |
10:00 Uhr |
FR 3001 |
Vorlesung zu Übungsblatt 4 |
Mittwoch, 4.06. |
10:00 Uhr |
FR 6043 |
Besprechung der Lösung von Übungsblatt 3 (Anna, Nico), Gemeinsame Sprechstunde zu Übungsblatt 4 |
Mittwoch, 11.06. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 4 |
Mittwoch, 18.06. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 4 |
Montag, 23.06. |
10:00 Uhr |
|
Abgabeschluss Übungsblatt 4 |
Montag, 23.06. |
10:00 Uhr |
FR 3001 |
Vorlesung zu Übungsblatt 5 |
Mittwoch, 25.06. |
10:00 Uhr |
FR 6043 |
Besprechung der Lösung von Übungsblatt 4 (Ruben, Nikolay), Gemeinsame Sprechstunde zu Übungsblatt 5 |
Mittwoch, 2.07. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 5 |
Montag, 7.07. |
10:00 Uhr |
|
Abgabeschluss Übungsblatt 5 |
Montag, 7.07. |
10:00 Uhr |
FR 3001 |
Vorlesung zu Übungsblatt 6 |
Mittwoch, 9.07. |
10:00 Uhr |
FR 6043 |
Besprechung der Lösung von Übungsblatt 5 (David, Fabian), Gemeinsame Sprechstunde zu Übungsblatt 6 |
Mittwoch, 16.07. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 6 |
Mittwoch, 23.07. |
10:00 Uhr |
FR 6043 |
Gemeinsame Sprechstunde zu Übungsblatt 6 |
Freitag, 1.8. |
10:00 Uhr |
|
Abgabeschluss Übungsblatt 6 |
Montag, 11.8. |
10:00 Uhr |
FR 6043 |
Besprechung der Lösung von Übungsblatt 6 (Tilman, Mathias) |
Material
Übungsblätter
Übungsblatt 1: Matlab (Abgabe via PASS)
Übungsblatt 2: Dimensionsreduktion (Abgabe via PASS)
Übungsblatt 3: Clustering (Abgabe via PASS)
Übungsblatt 4: Grundlagen der Klassifikation (Abgabe via PASS) *(Abgabe verlängert bis Donnerstag, 26. 6. 2008)*
Übungsblatt 5: Support-Vector-Maschinen (Abgabe via PASS)
Übungsblatt 6: Belief Propagation in Markov Random Fields (Abgabe via PASS)
Datensätze
Für Übungsblatt 2: flatroll, swissroll, fishbowl Hinweis: Die in den Datensätzen eingebettete Struktur ist jeweils 1/2/2 dimensional. Die beigefügte true_embedding ist jedoch immer nur eindimensional und verläuft für gewöhnlich einer "interessanten Richtung" entlang. Am besten läßt sich true_embedding visualisieren, wenn sie als Farbe der Datenpunkte plottet, zum Beispiel mit scatter/scatter3.
Für Übungsblatt 3: 2gaussians, 5gaussians
Für Übungsblatt 4: Datensätze *(korrigierte Version)*
Für Übungsblatt 5: Datensätze
Für Übungsblatt 6: Datensätze
Tests
Für Übungsblatt 6: Test für bp.m und simple_marg.m
Allgemeine Literaturempfehlungen zum Machine Learning
Als allgemeine Einführung in Theorie und Methoden des Maschinellen Lernens empfehlen wir die folgenden Lehrbücher.
Duda, Hart, Stork. Pattern Classification.
Bishop. Pattern recognition and machine learning.
MacKay. Information theory, inference, and learning algorithms.
Skript
Skript zur Vorlesung (wird laufend aktualisiert)
Ergebnisse
Matrikel-Nr. |
*Übungsblatt 1* |
*Übungsblatt 2* |
*Übungsblatt 3* |
*Übungsblatt 4* |
*Übungsblatt 5* |
*Übungsblatt 6* |
Summe |
Prozentual |
727745 |
50 |
20 |
47 |
19 |
25 |
50 |
%CALC{"$SUM(R2:C2..R2:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R2:C2..R2:C7)/310))"}%% |
197818 |
37 |
10 |
6 |
17 |
28 |
39 |
%CALC{"$SUM(R3:C3..R3:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R3:C2..R3:C7)/310))"}%% |
3903518 |
43 |
13 |
35 |
27 |
28 |
0 |
%CALC{"$SUM(R4:C2..R4:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R4:C2..R4:C7)/310))"}%% |
201744 |
46 |
43 |
44 |
51 |
50 |
21 |
%CALC{"$SUM(R5:C2..R5:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R5:C2..R5:C7)/310))"}%% |
199928 |
46 |
43 |
44 |
51 |
50 |
21 |
%CALC{"$SUM(R6:C2..R6:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R6:C2..R6:C7)/310))"}%% |
223816 |
42 |
50 |
30 |
45 |
50 |
>=38 |
%CALC{"$SUM(R7:C2..R7:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R7:C2..R7:C7)/310))"}%% |
307066 |
33 |
20 |
41 |
47 |
28 |
50 |
%CALC{"$SUM(R8:C2..R8:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R8:C2..R8:C7)/310))"}%% |
222481 |
35 |
45 |
36 |
36 |
44 |
50 |
%CALC{"$SUM(R9:C2..R9:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R9:C2..R9:C7)/310))"}%% |
206111 |
35 |
45 |
40 |
36 |
33 |
0 |
%CALC{"$SUM(R10:C2..R10:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R10:C2..R10:C7)/310))"}%% |
195524 |
26 |
4 |
18 |
0 |
0 |
0 |
%CALC{"$SUM(R11:C2..R11:C7)"}% |
%CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R11:C2..R11:C7)/310))"}%% |