Clusterstabilität Konzepte und Einflussfaktoren |
|
Author:
| Baumgart, Andreas |
Series title: | Advances in Information Systems and Management Science Ser. |
ISBN: | 978-3-8325-3603-9 |
Publication Date: | Jun 2015 |
Publisher: | Logos Verlag Berlin
|
Book Format: | Paperback |
List Price: | USD $58.00 |
Book Description:
|
Clusterverfahren erfreuen sich im Rahmen des Data Mining einer grossen Beliebtheit und werden in diesem Kontext besonders oft angewendet. Haufig wird jedoch ausser Acht gelassen, dass die dabei erzielten Ergebnisse ohne eine theoretische Fundierung nicht uber die Stichprobe hinaus auf die Grundgesamtheit verallgemeinert werden konnen. Um eine solche Verallgemeinerung aus statistischer Sicht tatigen zu konnen, ist zunachst eine Betrachtung von Clusterverfahren im Allgemeinen...
More DescriptionClusterverfahren erfreuen sich im Rahmen des Data Mining einer grossen Beliebtheit und werden in diesem Kontext besonders oft angewendet. Haufig wird jedoch ausser Acht gelassen, dass die dabei erzielten Ergebnisse ohne eine theoretische Fundierung nicht uber die Stichprobe hinaus auf die Grundgesamtheit verallgemeinert werden konnen. Um eine solche Verallgemeinerung aus statistischer Sicht tatigen zu konnen, ist zunachst eine Betrachtung von Clusterverfahren im Allgemeinen unumganglich, wobei die unterschiedlichen Ansatze der Verfahren besonders interessant sind. Aber auch eine saubere stochastische Spezifikation der Ausgangssituation, sowie die Analyse der Methoden zur Clustervalidierung sind Teil einer solchen Untersuchung. Entscheidend fur eine Verallgemeinerung ist die Veranderung der Clusterergebnisse beim statistischen Schluss von der Stichprobe auf die Population. Handelt es sich um einen stabilen Clusteralgorithmus, so kann davon ausgegangen werden, dass die Veranderungen gering sind. Neben einer formalen Definition von Stabilitat werden als Analysegrundlage die klassischen Werkzeuge der robusten Statistik benotigt. Bei der Analyse erweist sich die Datenreprasentation als ein massgeblicher Einflussfaktor. Am Beispiel der Netzwerkanalyse wird die Anwendbarkeit des entwickelten Clusterstabilitatsbegriffes gezeigt. Mit Hilfe von Wahrscheinlichkeitsnachbarschaften ist es moglich, einen verallgemeinerten Kommunitatsbegriff zu definieren. Andreas Baumgart, Jahrgang 1982, studierte Wirtschaftsinformatik an der Universitat Leipzig und der Westfalischen Wilhelms-Universitat Munster. Im Anschluss war er als wissenschaftlicher Mitarbeiter am European Research Center for Information Systems (ERCIS) in Forschung und Lehre tatig. Im November 2013 erfolgte die Promotion zum Doktor der Wirtschaftswissenschaften.