Clusteranalyse
Karten zum Thema "Clusteranalyse" für den Kurs "Methoden der Skalierung"
Karten zum Thema "Clusteranalyse" für den Kurs "Methoden der Skalierung"
Kartei Details
Karten | 52 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 10.05.2020 / 31.01.2023 |
Weblink |
https://card2brain.ch/box/20200510_clusteranalyse
|
Einbinden |
<iframe src="https://card2brain.ch/box/20200510_clusteranalyse/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was ist die Grundidee der Ward-Methode?
- Unterschied in Vorgehensweise bei der Fusionierung: Geringste Veränderung des Heterogenitätsmaßes
- Keine Berechnung von Distanzen, sondern Kennwert ist eine Veränderung der Fehlerquadratsumme (Varianzkriterium), die entsteht, wenn ein Objekt in eine Gruppe integriert wird.
- Zu Beginn einer CA hat jedes Cluster eine Fehlerquadratsumme = 0
- Die Matrix besteht nun aus hypothetischen Fehlerquadratzuwächsen für alle möglichen Paarungen.
Flora und Rama:
1. Der Zentroid dieser Gruppe ergibt sich aus den jeweiligen Mittelwerten von Kalorien (2), Preis (2) und Vitamin (1)
2. Der Anstieg der Fehlerquadratsumme ergibt sich aus allen quadrierten Abweichungen zu den entsprechenden Mittelwerten
- eRama/Flora = (1-2)2 + (3-2)² + (2-2)² + (2-2)²+(1-1)² + (1-1)² = 2
- eHoma/SB = (2-3.5)2 + (5-3.5)² + (3-3.5)² + (4-3.5)²+(3-5)² + (7-5)² = 13
Wann wird welches Verfahren angewandt? (Single Linkage, Average Linkage, WARD)
Single Linkage:
- Ausreißer fallen auf und könne eliminiert werden
- Bildet große Gruppen (Kettenbildung)
Average Linkage:
- Bildet viele kleine Gruppen mit wenig Objekten.
WARD-Verfahren:
- Bildet ungefähr gleich große Gruppen, findet meist „sehr gute“ Gruppen, ordnet die Elemente meist „richtig“ zu
Wie kann die Clusteranzahl bestimmt werden?
- Dendrogramm
- Struktogramm (vgl. Screeplot bei FA)
- Bestimmung der Clusteranzahl anhand des „Ellbow“-Kriteriums
- Sachlogische Überlegungen
Wie kann die Clusteranzahl geprüft werden?
- Berechnung mehrere Clusteranalysen an einem aufgeteilten Datensatz. Übereinstimmung mittels Kappa-Maß oder Rand-Index bestimmen.
- Aufnahme zusätzlicher Variablen → Diskriminanzanalyse berechnen
Welche Eigenschaften haben partitionierende Verfahren?
- Ausgehend von einer bestehenden Gruppierung der Objekte werden die Objekte solange ausgetauscht, bis Objekte innerhalb einer Gruppe möglichst ähnlich sind und die Gruppen möglichst unterschiedlich sind.
- Die Zuordnung einzelner Objekte ist nicht endgültig, sondern die Objekte können mehrmals verschoben werden
- Dient zur Optimierung bereits gefundener Clusterlösungen (z.B. mit hierarchischen Methoden)
Anwendungsempfehlung
1. Distanzmaß: Euklidische Distanz
2. Fusionierung mit Single Linkage: Eliminieren von Ausreißern
3. Clusterlösung mit WARD-Verfahren: Finden von sinnvollen Clustern
4. Optimierung der gefundenen Lösung mit einem partitionierenden Verfahren.