Size: 3995
Comment:
|
← Revision 33 as of 2011-01-26 11:49:40 ⇥
Size: 5994
Comment:
|
Deletions are marked like this. | Additions are marked like this. |
Line 6: | Line 6: |
|| || Blockseminar am 20.1.2011 von 10:00 bis 16:00 Uhr im Raum FR 6046 || || '''Verantwortlich''' || [[http://ml.cs.tu-berlin.de/~rieck/teaching.html|Dr. Konrad Rieck]], [[http://ml.cs.tu-berlin.de/en/klaus/index.html|Prof. Dr. Klaus-Robert Müller]] || |
|| || Blockseminar am 18.1.2011 von 10:00 bis 18:00 Uhr im Raum FR 6046 || || '''Verantwortlich''' || [[http://ml.cs.tu-berlin.de/~rieck/teaching.html|Dr. Konrad Rieck]], [[http://sonnenburgs.de/soeren|Dr. Soeren Sonnenburg]], [[http://ml.cs.tu-berlin.de/en/klaus/index.html|Prof. Dr. Klaus-Robert Müller]] || |
Line 13: | Line 13: |
In vielen Anwendungen des maschinellen Lernen sind die zu analysierenden Daten keine Vektoren, sondern Datenstrukturen wie Strings, Bäume und Graphen. Typische Beispiele sind DNA-Sequenzen in der Bioinformatik, Parsebäume in der Sprachverarbeitung und Graphen in der Chemoinformatik. Eine elegante Möglichkeit diese strukturierten Daten zu analysieren, bietet das Konzept des kernbasierten Lernens. Die Lernalgorithmen sind hierbei ausschließlich über Kernfunktionen definiert, so dass es genügt Kerne für strukturierte Daten zu entwerfen, um diese zu analysieren. Dieses Seminar beschäftigt sich mit solchen Kernen und es sollen Kernfunktionen für Strings, Bäume und Graphen, ihre Implementierung und entsprechende Anwendungen besprochen werden. |
In vielen Anwendungen des maschinellen Lernens sind die zu analysierenden Daten keine Vektoren, sondern Datenstrukturen wie Strings, Bäume und Graphen. Typische Beispiele sind DNA-Sequenzen in der Bioinformatik, Parsebäume in der Sprachverarbeitung und Graphen in der Chemoinformatik. Eine elegante Möglichkeit diese strukturierten Daten zu analysieren bietet das Konzept des kernbasierten Lernens. Die Lernalgorithmen sind hierbei ausschließlich über Kernfunktionen definiert, so dass es genügt Kerne für strukturierte Daten zu entwerfen, um diese zu analysieren. Das Seminar beschäftigt sich mit solchen Kernen. Es werden Kernfunktionen für Strings, Bäume und Graphen, ihre Implementierung und entsprechende Anwendungen besprochen. === Programm === Seminarplan für Dienstag, den 18. Januar 2011. Das Seminar findet in Raum FR 6046 statt. || '''Zeit''' || '''Thema''' || '''Vortragender''' || || 10:00 || ''Begrüßung'' || || || 10:15 || Text Classification using String Kernels || Max Heimel || || 11:00 || Sparse Spatial Sample Kernel || Mahmoud Mabrouk || || 11:45 || ''Kaffeepause'' || || || 12:00 || The Fisher Kernel || Felix Franke || || 12:45 || Marginalized Kernels for Biological Sequences || Arno Onken || || 13:30 || ''Mittagspause'' || || || 14:30 || Convolution Kernels for Natural Language || Priska Herger || || 15:15 || On Graph Kernels: Hardness Results and Efficient Alternatives || Vincent Froese || || 16:00 || ''Kaffeepause'' || || || 16:15 || Fast Subtree Kernels on Graphs || Andreas Orthez || || 17:00 || A Linear-Time Graph Kernel || Danny Panknin || || 17:45 || ''Verabschiedung'' || || === Voraussetzungen === Wir empfehlen den vorherigen Besuch der Vorlesung "Maschinelles Lernen 1". |
Line 20: | Line 42: |
* Die Teilnehmer legen bis spätestens 10.1.2011 einen Entwurf des Vortrages vor und besprechen diesen mit dem Betreuer. * Das Seminar findet als Blockveranstaltung am 20.1.2011 statt. |
* Die Teilnehmer legen bis spätestens 3.1.2011 einen Entwurf des Vortrages vor und besprechen diesen mit dem Betreuer. * Das Seminar findet als Blockveranstaltung am 18.1.2011 statt. |
Line 33: | Line 55: |
* '''String Kernels''' | |
Line 35: | Line 56: |
* [[http://helix-web.stanford.edu/psb02/leslie.pdf|The Spectrum Kernel: A Kernel for SVM Protein Classification]] <<BR>> Leslie et al. ''Pacific Symposium on Biocomputing'', 2002 | * '''Kernels for Strings''' |
Line 37: | Line 58: |
* [[http://jmlr.csail.mit.edu/papers/volume2/lodhi02a/lodhi02a.pdf|Text Classification using String Kernels]] <<BR>> Lohdi et al. ''Journal of Machine Learning Research'', 2002 | 1. [[http://helix-web.stanford.edu/psb02/leslie.pdf|The Spectrum Kernel: A Kernel for SVM Protein Classification]] <<BR>> Leslie et al. ''Pacific Symposium on Biocomputing'', 2002 |
Line 39: | Line 60: |
* [[http://books.nips.cc/papers/files/nips15/AA11.pdf|Fast Kernels for Strings and Trees]] <<BR>> Vishwanathan & Smola. ''Advances in Neural Information Processing Systems'', 2002 | 1. [[http://figment.cse.usf.edu/~sfefilat/data/papers/TuAT5.1.pdf|Sparse Spatial Sample Kernel]] <<BR>> Kuksa et al. 19th International Conference on Pattern Recognition, 2008 1. [[http://jmlr.csail.mit.edu/papers/volume2/lodhi02a/lodhi02a.pdf|Text Classification using String Kernels]] <<BR>> Lohdi et al. ''Journal of Machine Learning Research'', 2002 1. [[http://books.nips.cc/papers/files/nips15/AA11.pdf|Fast Kernels for Strings and Trees]] <<BR>> Vishwanathan & Smola. ''Advances in Neural Information Processing Systems'', 2002 * '''Kernels for Trees''' 1.#5 [[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.69.8830&rep=rep1&type=pdf|Convolution Kernels for Natural Language]] <<BR>> Collins & Duffy, ''Advances in Neural Information Processing Systems'', 2001 1. [[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.149.6975&rep=rep1&type=pdf|Route Kernels for Trees]] <<BR>> Aiolli et al., ''International Conference on Machine Learning'', 2009 |
Line 42: | Line 73: |
* '''Tree Kernels''' | * '''Kernels for Graphs''' |
Line 44: | Line 75: |
* [[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.69.8830&rep=rep1&type=pdf|Convolution Kernels for Natural Language]] <<BR>> Collins & Duffy, ''Advances in Neural Information Processing Systems'', 2001 | 1.#7 [[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.152.8681&rep=rep1&type=pdf|On Graph Kernels: Hardness Results and Efficient Alternatives]] <<BR>> Gärtner et al. ''Conference on Computational Learning Theory'', 2003 |
Line 46: | Line 77: |
* [[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.149.6975&rep=rep1&type=pdf|Route Kernels for Trees]] <<BR>> Aiolli et al., ''International Conference on Machine Learning'', 2009 | 1. [[http://webdav.tuebingen.mpg.de/u/karsten/Veroeffentlichungen/papers/SheBor09.pdf|Fast Subtree Kernels on Graphs]] <<BR>> Shervashidze & Borgwardt. ''Advances in Neural Information Processing Systems'', 2009 |
Line 48: | Line 79: |
* [[http://www.jmlr.org/papers/volume11/rieck10a/rieck10a.pdf|Approximate Tree Kernels]] <<BR>> Rieck et al. ''Journal of Machine Learning Research'', 2010 | 1. [[http://www.trl.ibm.com/people/hido/pdf/091209_Hido_ICDM2009.pdf|A Linear-Time Graph Kernel]] <<BR>> Hido & Kashima. ''International Conference on Data Mining'', 2009 |
Line 50: | Line 81: |
* '''Kernels from Automata and Probabilistic Models''' | |
Line 51: | Line 83: |
* '''Graph Kernels''' | 1.#10 [[http://bioinformatics.oxfordjournals.org/cgi/reprint/18/suppl_1/S268|Marginalized kernels for biological sequences]] <<BR>>Tsuda et al. ''Bioinformatics'', 2002 1. [[http://people.csail.mit.edu/tommi/papers/gendisc.ps|The Fisher Kernel: Exploiting Generative Models in Discriminative Classifiers]] <<BR>>Jaakkola & Hausler. ''Advances in Neural Information Processing Systems'', 1998 1. [[http://books.nips.cc/papers/files/nips15/AA15.pdf|Rational Kernels]] <<BR>>Cortes et al. ''Advances in Neural Information Processing Systems'', 2002 |
Line 53: | Line 87: |
* [[http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.152.8681&rep=rep1&type=pdf|On Graph Kernels: Hardness Results and Efficient Alternatives]] <<BR>> Gärtner et al. ''Conference on Computational Learning Theory'', 2003 * [[http://www.trl.ibm.com/people/hido/pdf/091209_Hido_ICDM2009.pdf|A Linear-Time Graph Kernel]] <<BR>> Hido & Kashima. ''International Conference on Data Mining'', 2009 |
Wir danken Marius Kloft für die Betreuung von Andreas Orthey. |
Block-Seminar: Kernels for Structured Data
Termine und Dozenten
Termin |
Vorbesprechung am 3.11.2010 um 11:00 Uhr im Raum FR 6046 |
|
Blockseminar am 18.1.2011 von 10:00 bis 18:00 Uhr im Raum FR 6046 |
Verantwortlich |
Dr. Konrad Rieck, Dr. Soeren Sonnenburg, Prof. Dr. Klaus-Robert Müller |
Themenvergabe |
per Email bis 10.11.2010 in Absprache mit dem Betreuer |
Anrechenbarkeit |
Wahlpflicht LV in den M.Sc. Modulen Maschinelles Lernen 1 & 2 |
Inhalt
In vielen Anwendungen des maschinellen Lernens sind die zu analysierenden Daten keine Vektoren, sondern Datenstrukturen wie Strings, Bäume und Graphen. Typische Beispiele sind DNA-Sequenzen in der Bioinformatik, Parsebäume in der Sprachverarbeitung und Graphen in der Chemoinformatik. Eine elegante Möglichkeit diese strukturierten Daten zu analysieren bietet das Konzept des kernbasierten Lernens. Die Lernalgorithmen sind hierbei ausschließlich über Kernfunktionen definiert, so dass es genügt Kerne für strukturierte Daten zu entwerfen, um diese zu analysieren. Das Seminar beschäftigt sich mit solchen Kernen. Es werden Kernfunktionen für Strings, Bäume und Graphen, ihre Implementierung und entsprechende Anwendungen besprochen.
Programm
Seminarplan für Dienstag, den 18. Januar 2011. Das Seminar findet in Raum FR 6046 statt.
Zeit |
Thema |
Vortragender |
10:00 |
Begrüßung |
|
10:15 |
Text Classification using String Kernels |
Max Heimel |
11:00 |
Sparse Spatial Sample Kernel |
Mahmoud Mabrouk |
11:45 |
Kaffeepause |
|
12:00 |
The Fisher Kernel |
Felix Franke |
12:45 |
Marginalized Kernels for Biological Sequences |
Arno Onken |
13:30 |
Mittagspause |
|
14:30 |
Convolution Kernels for Natural Language |
Priska Herger |
15:15 |
On Graph Kernels: Hardness Results and Efficient Alternatives |
Vincent Froese |
16:00 |
Kaffeepause |
|
16:15 |
Fast Subtree Kernels on Graphs |
Andreas Orthez |
17:00 |
A Linear-Time Graph Kernel |
Danny Panknin |
17:45 |
Verabschiedung |
|
Voraussetzungen
Wir empfehlen den vorherigen Besuch der Vorlesung "Maschinelles Lernen 1".
Ablauf
- Die Vorbesprechung findet am 3.11.2010 statt.
- Die Teilnehmer wählen bis spätestens 10.11.2010 ein Thema in Absprache mit dem Betreuer (siehe Themenliste).
- Die Teilnehmer legen bis spätestens 3.1.2011 einen Entwurf des Vortrages vor und besprechen diesen mit dem Betreuer.
- Das Seminar findet als Blockveranstaltung am 18.1.2011 statt.
Vorträge
Jeder Vortrag soll 35 Minuten (+ 10 Minuten Diskussion) dauern. Der Vortrag kann wahlweise auf Deutsch oder Englisch gehalten werden. Ein guter Vortrag führt kurz in das jeweilige Thema ein, stellt die Problemstellung dar und beschreibt zusammenfassend relevante Arbeiten und Lösungen.
Leistungsnachweis
Die Note wird anhand des Vortrages und der Folien festgelegt. Das Seminar ist Wahlpflichtbestandteil der Master-Module "Maschinelles Lernen 1" und "Maschinelles Lernen 2". Bachelor-Studenten können diese Master-Module auf Antrag ebenfalls belegen.
Themen
Kernels for Strings
The Spectrum Kernel: A Kernel for SVM Protein Classification
Leslie et al. Pacific Symposium on Biocomputing, 2002Sparse Spatial Sample Kernel
Kuksa et al. 19th International Conference on Pattern Recognition, 2008Text Classification using String Kernels
Lohdi et al. Journal of Machine Learning Research, 2002Fast Kernels for Strings and Trees
Vishwanathan & Smola. Advances in Neural Information Processing Systems, 2002
Kernels for Trees
Convolution Kernels for Natural Language
Collins & Duffy, Advances in Neural Information Processing Systems, 2001Route Kernels for Trees
Aiolli et al., International Conference on Machine Learning, 2009
Kernels for Graphs
On Graph Kernels: Hardness Results and Efficient Alternatives
Gärtner et al. Conference on Computational Learning Theory, 2003Fast Subtree Kernels on Graphs
Shervashidze & Borgwardt. Advances in Neural Information Processing Systems, 2009A Linear-Time Graph Kernel
Hido & Kashima. International Conference on Data Mining, 2009
Kernels from Automata and Probabilistic Models
Marginalized kernels for biological sequences
Tsuda et al. Bioinformatics, 2002The Fisher Kernel: Exploiting Generative Models in Discriminative Classifiers
Jaakkola & Hausler. Advances in Neural Information Processing Systems, 1998Rational Kernels
Cortes et al. Advances in Neural Information Processing Systems, 2002
Wir danken Marius Kloft für die Betreuung von Andreas Orthey.