Size: 1556
Comment:
|
Size: 2456
Comment:
|
Deletions are marked like this. | Additions are marked like this. |
Line 5: | Line 5: |
||'''Erster Termin für Themenvergabe'''|| Mittwoch, 19.10.2011, 10:00-12:00 Uhr, Raum FR 6046 || | ||'''Erster Termin'''|| Mittwoch, 19.10.2011, 10:00-12:00 Uhr, Raum FR 6046 || |
Line 10: | Line 10: |
||'''Anrechenbarkeit''|| Modul Projekt Machine Learning (wird zur Zeit akkreditiert) || | ||'''Anrechenbarkeit''|| Modul Projekt Machine Learning (wird zur Zeit akkreditiert), bzw. im Rahmen von Diplomstudiengängen || [[attachment:ML_Project_Info.pdf|Information about the project (in English)]] |
Line 14: | Line 16: |
Ziel des Projektes ist, eine Vorhersageverfahren (Regression/Klassifikation) für eine reale Anwendung zu entwickeln, auf Basis der [[http://www.shogun-toolbox.org/|Open-Source Machine Learning toolbox shogun]]. Dazu wird ein realer Rohdatensatz gegeben. Das Projekt ist in die folgenden drei aufeinander aufbauenden Meilensteine unterteilt. | Ziel des Projektes ist es, ein Vorhersageverfahren (Regression/Klassifikation) für eine reale Anwendung zu entwickeln auf Basis der [[http://www.shogun-toolbox.org/|Open-Source Machine Learning toolbox shogun]]. Dazu wird ein realer Rohdatensatz gegeben. Das Projekt ist in die folgenden drei aufeinander aufbauenden Meilensteine unterteilt. |
Line 18: | Line 20: |
* Evaluierung und Vergleich verschiedener Vorhersagemethodiken, Entwicklung geeigneter Bewertungsan-sätze und Gütemasse. | * Evaluierung und Vergleich verschiedener Vorhersagemethodiken, Entwicklung geeigneter Bewertungsansätze und Gütemasse. |
Line 22: | Line 24: |
Im Unterschied zum Praktikum liegt der Schwerpunkt nicht auf der Implementierung von Machine Learning-Methoden, sondern auf Datenaufbereitung, Anwendung, Bewertung und Auswahl von Methoden, sowie Präsentation der Ergebnisse. | Im Unterschied zum Praktikum Machine Learning liegt der Schwerpunkt nicht auf der Implementierung von Machine Learning-Methoden, sondern auf Datenaufbereitung, Anwendung, Bewertung und Auswahl von Methoden, sowie Präsentation der Ergebnisse. |
Line 26: | Line 28: |
Der vorherige Besuch der Veranstaltungen "Machine Learning I" und "Praktikum Maschinelles Lernen" ist empfohlen, aber keine formale Voraussetzung. === Datensatz === Der Datensatz wurde von [[http://www.wissensguru.de/|Wissensguru]] (vormals SMS Guru) zur Verfügung gestellt und besteht aus SMS Nachrichten mit Fragen an den SMS Guru. Die Aufgabenstellung besteht darin, ein Verfahren zu entwickeln um die Nachrichten automatisch in Kategorien einzuteilen. === Anmeldung === Anmeldung per [[mailto:paul.buenau@tu-berlin.de.|Email]] ab dem 14.10. um 9:00 Uhr. Die Anmeldungen werde in der Reihenfolge ihres Eintreffens berücksichtigt; die Teilnehmerzahl ist auf 12 beschränkt. |
|
Line 28: | Line 40: |
* Der erste Termin ist am Mittwoch, 19.10.2011, 10:00-12:00 Uhr im Raum FR 6046 |
Projekt Machine Learning
Termine und Informationen
Erster Termin |
Mittwoch, 19.10.2011, 10:00-12:00 Uhr, Raum FR 6046 |
Verantwortlich |
|
Ansprechtpartner(in) |
|
Sprechzeiten |
Nach Vereinbarung |
Sprache |
Englisch |
Anrechenbarkeit |
Modul Projekt Machine Learning (wird zur Zeit akkreditiert), bzw. im Rahmen von Diplomstudiengängen |
Information about the project (in English)
Inhalt
Ziel des Projektes ist es, ein Vorhersageverfahren (Regression/Klassifikation) für eine reale Anwendung zu entwickeln auf Basis der Open-Source Machine Learning toolbox shogun. Dazu wird ein realer Rohdatensatz gegeben. Das Projekt ist in die folgenden drei aufeinander aufbauenden Meilensteine unterteilt.
- Extraktion von vektoriellen Merkmalsvektoren aus den Rohdaten; univariate und multivariate Bewertung dieser Merkmale.
- Evaluierung und Vergleich verschiedener Vorhersagemethodiken, Entwicklung geeigneter Bewertungsansätze und Gütemasse.
- Begründete Auswahl und abschließende Bewertung einer bestimmten Vorhersagemethodik.
Im Unterschied zum Praktikum Machine Learning liegt der Schwerpunkt nicht auf der Implementierung von Machine Learning-Methoden, sondern auf Datenaufbereitung, Anwendung, Bewertung und Auswahl von Methoden, sowie Präsentation der Ergebnisse.
Voraussetzungen
Der vorherige Besuch der Veranstaltungen "Machine Learning I" und "Praktikum Maschinelles Lernen" ist empfohlen, aber keine formale Voraussetzung.
Datensatz
Der Datensatz wurde von Wissensguru (vormals SMS Guru) zur Verfügung gestellt und besteht aus SMS Nachrichten mit Fragen an den SMS Guru. Die Aufgabenstellung besteht darin, ein Verfahren zu entwickeln um die Nachrichten automatisch in Kategorien einzuteilen.
Anmeldung
Anmeldung per Email ab dem 14.10. um 9:00 Uhr. Die Anmeldungen werde in der Reihenfolge ihres Eintreffens berücksichtigt; die Teilnehmerzahl ist auf 12 beschränkt.
Ablauf
- Der erste Termin ist am Mittwoch, 19.10.2011, 10:00-12:00 Uhr im Raum FR 6046