A fast and scalable subspace clustering algorithm
Transcrição
A fast and scalable subspace clustering algorithm
Campus Gengenbach Klosterstraße 14, 77723 Campus Offenburg Badstraße 24, 77652 Subspace Clustering ist ein maschinelles Lernverfahren aus dem Bereich des Data Mining. Prof. Dr. Amitava Datta von der University of Western Australia aus Perth hält am 27. Januar über dieses Thema eine Gastvorlesung. Da hochdimensionale Datensätze - also solche mit vielen Merkmalen - in der Praxis keine Cluster über den gesamten Merkmalraum bilden (die Datenpunkte verteilen hier sich nahezu gleichmäßig im Raum), besteht eine Möglichkeit der Klassifizierung darin, die Daten in allen Teilräumen (subspaces) auf Cluster zu untersuchen. Da die Anzahl der Teilräume exponentiell in der Zahl der Dimensionen ist, bedeutet dies einen extrem hohen Rechenaufwand. Der beste bisherige Algorithmus stößt bereits bei 50006000 Datenpunkten in 25 Dimensionen an seine Grenzen. Im Vortrag wird ein Algorithmus vorgestellt, der große Datensätze mit hunderten von Dimensionen relativ schnell verarbeiten kann. Experimente belegen, dass das Verfahren auch mit bis zu 4000 Dimensionen funktioniert. 07 Jan 2015 Von: cd Guest Lecture: Prof. Dr. Amitava Datta, University of Western Australia, Perth. Subspace clustering is an unsupervised machine learning technique. Since high-dimensional datasets are not amenable to clustering in the full-dimensional space (points tend to become almost equally spaced), one way of understanding a dataset is to cluster it in all possible subspaces. Since there are an exponential number (exponential in the dimension) of subspaces, this is very expensive computationally. In fact the best algorithm cannot handle more than 5000-6000 data points and 25 dimensions. We have designed a fast algorithm that can process large datasets of hundreds of dimensions fairly fast. We have even experimented with up to 4000 dimensions and it works. Public Lecture by Prof. Dr. Amitava Datta http://www.hs-offenburg.de/nc/news-detail/archive/2015/january/article/a-fast-and-scalable-subspace-clustering-algorithm/ 20 Jan 2017 23:21:36 1/2 Campus Gengenbach Klosterstraße 14, 77723 Campus Offenburg Badstraße 24, 77652 University of Western Australia, Perth. 27 January 2015, 17:30 pm, Campus Offenburg, Building E, Room E 311 For further information please contact: Dr. rer. nat. Tobias Lauer ← Zurück http://www.hs-offenburg.de/nc/news-detail/archive/2015/january/article/a-fast-and-scalable-subspace-clustering-algorithm/ 20 Jan 2017 23:21:36 2/2