== Praktikum Maschinelles Lernen und Datenanalyse == || '''Termin:''' || Montag 10:00 - 12:00 Uhr (Vorlesung), Mittwoch 10:00 - 12:00 Uhr (Gemeinsame Sprechstunde) || || '''Raum:''' || FR 3001 (Montag 10:00 - 12:00 Uhr) und FR 6043 (Mittwoch 10:00 - 12:00 Uhr) || || '''Dozent:''' || Prof. Dr. Klaus-Robert Müller || || '''Ansprechpartner:''' || [[http://ml.cs.tu-berlin.de/~mikio|Dr. Mikio Braun]] und Paul von Bünau (buenau@cs.tu-berlin.de) || Im Praktikum Maschinelles Lernen und Datenanalyse soll der Prozess der explorativen Datenanalyse geübt werden. Der Schwerpunkt liegt auf den Themengebieten Visualisierung und Dimensionsreduktion, Klassifikation mit Neuronalen Netzen, Hidden-Markov-Modelle auf Genomdaten und Support-Vektor-Maschinen. Die Aufgaben sind kombinierte Programmier- und Simulationsaufgaben in Matlab. Der Besuch des Kurses [[Main/SS08_Matlab_Course|Einführung in die computergestützte Datenanalyse mit Matlab]] wird empfohlen. Grundlegende Kentnisse des Maschinellen Lernen sind sehr hilfreich, bei grossem Interesse und Engagement aber keine zwingende Voraussetzung. Die Veranstaltung gliedert sich in zwei Teile: Eine Vorlesung, in der Methoden und Theorie der Aufgaben vermittelt werden (Montags 10:00 - 12:00 Uhr) und eine gemeinsame Sprechstunde (Mittwochs 10:00 - 12:00 Uhr), in der wir Fragen und Probleme besprechen, die bei der Bearbeitung der Aufgaben auftauchen. Weitere Information findet Ihr im [[Main/#InfoBlatt|Informationsblatt]]. === Termine === || '''Datum''' || '''Uhrzeit''' || '''Raum''' || '''Beschreibung''' || || Montag, 14.04. || 10:00 Uhr || FR 3001 || Vorbesprechung, Ausgabe Übungsblatt 1 || || Mittwoch, 16.04. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 1 und Matlab Crash-Kurs || || Mittwoch, 23.04. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 1 || || Montag, 28.04. || 10:00 Uhr || || ''Abgabeschluss Übungsblatt 1'' || || Montag, 28.04. || 10:00 Uhr || FR 3001 || Vorlesung zu Übungsblatt 2 || || Mittwoch, 30.04. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 2 || || Mittwoch, 7.05. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 2 || || Mittwoch, 14.05. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 2 || || Montag, 19.05. || 10:00 Uhr || || ''Abgabeschluss Übungsblatt 2'' || || Montag, 19.05. || 10:00 Uhr || FR 3001 || Vorlesung zu Übungsblatt 3 || || Mittwoch, 21.05. || 10:00 Uhr || FR 6043 || Besprechung der Lösung von Übungsblatt 2 ('''Haymo, Pascal'''), Gemeinsame Sprechstunde zu Übungsblatt 3 || || Mittwoch, 28.05. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 3 || || Montag, 2.06. || 10:00 Uhr || || ''Abgabeschluss Übungsblatt 3'' || || Montag, 2.06. || 10:00 Uhr || FR 3001 || Vorlesung zu Übungsblatt 4 || || Mittwoch, 4.06. || 10:00 Uhr || FR 6043 || Besprechung der Lösung von Übungsblatt 3 ('''Anna, Nico'''), Gemeinsame Sprechstunde zu Übungsblatt 4 || || Mittwoch, 11.06. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 4 || || Mittwoch, 18.06. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 4 || || Montag, 23.06. || 10:00 Uhr || || ''Abgabeschluss Übungsblatt 4'' || || Montag, 23.06. || 10:00 Uhr || FR 3001 || Vorlesung zu Übungsblatt 5 || || Mittwoch, 25.06. || 10:00 Uhr || FR 6043 || Besprechung der Lösung von Übungsblatt 4 ('''Ruben''', '''Nikolay'''), Gemeinsame Sprechstunde zu Übungsblatt 5 || || Mittwoch, 2.07. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 5 || || Montag, 7.07. || 10:00 Uhr || || ''Abgabeschluss Übungsblatt 5'' || || Montag, 7.07. || 10:00 Uhr || FR 3001 || Vorlesung zu Übungsblatt 6 || || Mittwoch, 9.07. || 10:00 Uhr || FR 6043 || Besprechung der Lösung von Übungsblatt 5 ('''David''', '''Fabian'''), Gemeinsame Sprechstunde zu Übungsblatt 6 || || Mittwoch, 16.07. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 6 || || Mittwoch, 23.07. || 10:00 Uhr || FR 6043 || Gemeinsame Sprechstunde zu Übungsblatt 6 || || Freitag, 1.8. || 10:00 Uhr || || ''Abgabeschluss Übungsblatt 6'' || || Montag, 11.8. || 10:00 Uhr || FR 6043 || Besprechung der Lösung von Übungsblatt 6 ('''Tilman''', '''Mathias''') || === Material === #InfoBlatt * [[attachment:Praktikum_ML_Info.pdf|Informationsblatt zum Praktikum Maschinelles Lernen und Datenanalyse]] * [[attachment:logfile.txt|Mitschnitt der Matlab Vorfuehrung]], [[attachment:func1.m|func1.m]], [[attachment:myprod.m|myprod.m]] * [[attachment:lle_talk.pdf|Slides zu LLE]] ==== Übungsblätter ==== * [[attachment:ML_Praktikum_U01.pdf|Übungsblatt 1]]: Matlab ([[https://ml01.zrz.tu-berlin.de/~paul/pass.pl?conf=ss08_prak01.conf|Abgabe via PASS]]) * [[attachment:ML_Praktikum_U02.pdf|Übungsblatt 2]]: Dimensionsreduktion ([[https://ml01.zrz.tu-berlin.de/~paul/pass.pl?conf=ss08_prak02.conf|Abgabe via PASS]]) * [[attachment:ML_Praktikum_U03.pdf|Übungsblatt 3]]: Clustering ([[https://ml01.zrz.tu-berlin.de/~paul/pass.pl?conf=ss08_prak03.conf|Abgabe via PASS]]) * [[attachment:ML_Praktikum_U04.pdf|Übungsblatt 4]]: Grundlagen der Klassifikation ([[https://ml01.zrz.tu-berlin.de/~paul/pass.pl?conf=ss08_prak04.conf|Abgabe via PASS]]) *(Abgabe verlängert bis Donnerstag, 26. 6. 2008)* * [[attachment:ML_Praktikum_U05.pdf|Übungsblatt 5]]: Support-Vector-Maschinen ([[https://ml01.zrz.tu-berlin.de/~paul/pass.pl?conf=ss08_prak05.conf|Abgabe via PASS]]) * [[attachment:ML_Praktikum_U06.pdf|Übungsblatt 6]]: Belief Propagation in Markov Random Fields ([[https://ml01.zrz.tu-berlin.de/~paul/pass.pl?conf=ss08_prak06.conf|Abgabe via PASS]]) ==== Datensätze ==== * [[attachment:U01_usps.mat|USPS Datensatz]] * Für Übungsblatt 2: [[attachment:flatroll.mat|flatroll]], [[attachment:swissroll.mat|swissroll]], [[attachment:fishbowl.mat|fishbowl]] '''Hinweis:''' Die in den Datensätzen eingebettete Struktur ist jeweils 1/2/2 dimensional. Die beigefügte `true_embedding` ist jedoch immer nur eindimensional und verläuft für gewöhnlich einer "interessanten Richtung" entlang. Am besten läßt sich `true_embedding` visualisieren, wenn sie als Farbe der Datenpunkte plottet, zum Beispiel mit `scatter/scatter3`. * Für Übungsblatt 3: [[attachment:U03_2gaussians.dat|2gaussians]], [[attachment:U03_5gaussians.dat|5gaussians]] * Für Übungsblatt 4: [[attachment:U04_datasets.tar.gz|Datensätze]] *(korrigierte Version)* * Für Übungsblatt 5: [[attachment:U05_datasets.zip|Datensätze]] * Für Übungsblatt 6: [[attachment:U06_datasets.tar.gz|Datensätze]] ==== Tests ==== * Für Übungsblatt 6: [[attachment:U06_test_margs.m|Test für bp.m und simple_marg.m]] ==== Allgemeine Literaturempfehlungen zum Machine Learning ==== Als allgemeine Einführung in Theorie und Methoden des Maschinellen Lernens empfehlen wir die folgenden Lehrbücher. * Duda, Hart, Stork. ''Pattern Classification''. * Bishop. ''Pattern recognition and machine learning''. * !MacKay. [[http://www.inference.phy.cam.ac.uk/mackay/itila/|Information theory, inference, and learning algorithms]]. ==== Skript ==== * [[attachment:guide.pdf|Skript zur Vorlesung]] ('''wird laufend aktualisiert''') ==== Ergebnisse ==== ||<)> '''Matrikel-Nr.'''||<)> *Übungsblatt 1*||<)> *Übungsblatt 2*||<)> *Übungsblatt 3*|| *Übungsblatt 4* ||<)> *Übungsblatt 5*|| *Übungsblatt 6* || '''Summe''' ||<)> '''Prozentual'''|| || 727745 || 50 || 20 || 47 || 19 || 25 || 50 || %CALC{"$SUM(R2:C2..R2:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R2:C2..R2:C7)/310))"}%% || || 197818 || 37 || 10 || 6 || 17 || 28 || 39 || %CALC{"$SUM(R3:C3..R3:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R3:C2..R3:C7)/310))"}%% || || 3903518 || 43 || 13 || 35 || 27 || 28 || 0 || %CALC{"$SUM(R4:C2..R4:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R4:C2..R4:C7)/310))"}%% || || 201744 || 46 || 43 || 44 || 51 || 50 || 21 || %CALC{"$SUM(R5:C2..R5:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R5:C2..R5:C7)/310))"}%% || || 199928 || 46 || 43 || 44 || 51 || 50 ||<)> 21|| %CALC{"$SUM(R6:C2..R6:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R6:C2..R6:C7)/310))"}%% || || 223816 || 42 || 50 || 30 || 45 || 50 || >=38 || %CALC{"$SUM(R7:C2..R7:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R7:C2..R7:C7)/310))"}%% || || 307066 || 33 || 20 || 41 || 47 || 28 || 50 || %CALC{"$SUM(R8:C2..R8:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R8:C2..R8:C7)/310))"}%% || || 222481 || 35 || 45 || 36 || 36 || 44 || 50 || %CALC{"$SUM(R9:C2..R9:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R9:C2..R9:C7)/310))"}%% || || 206111 || 35 || 45 || 40 || 36 || 33 || 0 || %CALC{"$SUM(R10:C2..R10:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R10:C2..R10:C7)/310))"}%% || || 195524 || 26 || 4 || 18 || 0 || 0 || 0 || %CALC{"$SUM(R11:C2..R11:C7)"}% || %CALC{"$FORMAT(COMMA, 1, $EVAL(100*$SUM(R11:C2..R11:C7)/310))"}%% || ---- [[Main/IDA.SS08PraktikumInternas|Interna (Mikio & Paul)]]