Zurück 
 

A fast and scalable subspace clustering algorithm

|

Subspace Clustering ist ein maschinelles Lernverfahren aus dem Bereich des Data Mining. Prof. Dr. Amitava Datta von der University of Western Australia aus Perth hält am 27. Januar über dieses Thema eine Gastvorlesung. Da hochdimensionale Datensätze - also solche mit vielen Merkmalen - in der Praxis keine Cluster über den gesamten Merkmalraum bilden (die Datenpunkte verteilen hier sich nahezu gleichmäßig im Raum), besteht eine Möglichkeit der Klassifizierung darin, die Daten in allen Teilräumen (subspaces) auf Cluster zu untersuchen. Da die Anzahl der Teilräume exponentiell in der Zahl der Dimensionen ist, bedeutet dies einen extrem hohen Rechenaufwand. Der beste bisherige Algorithmus stößt bereits bei 5000-6000 Datenpunkten in 25 Dimensionen an seine Grenzen. Im Vortrag wird ein Algorithmus vorgestellt, der große Datensätze mit hunderten von Dimensionen relativ schnell verarbeiten kann. Experimente belegen, dass das Verfahren auch mit bis zu 4000 Dimensionen funktioniert.

Guest Lecture: Prof. Dr. Amitava Datta, University of Western Australia, Perth. Subspace clustering is an unsupervised machine learning technique. Since high-dimensional datasets are not amenable to clustering in the full-dimensional space (points tend to become almost equally spaced), one way of understanding a dataset is to cluster it in all possible subspaces. Since there are an exponential number (exponential in the dimension) of subspaces, this is very expensive computationally. In fact the best algorithm cannot handle more than 5000-6000 data points and 25 dimensions. We have designed a fast algorithm that can process large datasets of hundreds of dimensions fairly fast. We have even experimented with up to 4000 dimensions and it works.

Public Lecture by Prof. Dr. Amitava Datta
University of Western Australia, Perth.
27 January 2015, 17:30 pm,
Campus Offenburg, Building E, Room E 311

For further information please contact:
<link mail window for sending>Dr. rer. nat. Tobias Lauer