Marketingforschung Lecture 9

Marketingforschung lecture 9

Marketingforschung lecture 9


Fichier Détails

Cartes-fiches 19
Langue Deutsch
Catégorie Gestion d'entreprise
Niveau Université
Crée / Actualisé 09.12.2016 / 06.01.2023
Lien de web
https://card2brain.ch/box/20161209_marketingforschung
Intégrer
<iframe src="https://card2brain.ch/box/20161209_marketingforschung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Überblick Clusteranalyse

  • Clusteranalyse ist ein Oberbegriff für eine Reihe von unterschiedlichen Verfahren

  • Alle haben das Ziel, Elemente (z.B. Konsumenten, Unternehmen) anhand von Merkmalen zu gruppieren (Cluster zu bilden)
    Die Elemente innerhalb einer Gruppe sollen möglichst ähnlich (homogen) sein

    sich aber möglichst stark von Elementen in anderen Gruppen unterscheiden

    • Jedes Element wird genau einer Gruppe zugeordnet • → Basis sind Gemeinsamkeiten und Unterschiede 

Ziele von Clusteranalysen

1. Marktsegmentierung: homogene Gruppen von Kunden einer Marke / Produktgruppe finden (Bedürfnisse Ferien: Kultur, Erholung, Abwechslung/Stimulation, Ausgaben)

2. Spezifische Gruppen identifizieren und deren Kaufverhalten verstehen: Verhalten der verschiedenen Gruppen separat betrachten. Beispiele:
Wie beschaffen sich Interessenten für Kleinwagen, Kombis, Limousinen

Einkaufsverhalten nach sozialer Schicht (Einkommen, Bildung, Beruf, Status)
Bestimmte Interessengruppen (Lifestyle, Sportarten, Musikstil, bevorzugter Kleidungsstil) 

3. Marken und Produkte clustern: Welche Produkte sind ähnlich (Preis, Verkaufsort, Image)? Erkennen, gegen wen man als Unternehmen konkurriert. Stärken und Schwächen vergleichen.

4. Testmärkte clustern: z.B. Vergleichbare Städte finden (Anzahl Haushalte, Einzelhandelsanteil)

5. Gesellschaftliche Strukturen verstehen: Sinus Milieus 

Vorgehen Clusteranalyse

1. Variablen auswählen
2. Distanzmass auswählen
3. Cluster-Verfahren auswählen
4. Anzahl Cluster bestimmen
5. Validität der Cluster-Lösung beurteilen 

Formale Anforderungen zum Variablen auswählen bei Clusteranalysen

Variablen sollen beim Clustern möglichst gleich viel Gewicht erhalten
Diese Anforderungen werden verletzt, wenn:

  • Variablen unterschiedliche Masseinheiten haben (Unterschied CHF 1000 Einkommen hat mehr Gewicht als Einstellungsunterschied von 2 Einheiten auf einer 7er Skala)

  • Variablen korrelieren (die zusammenhängenden Aspekte werden bei der Fusionierung überbetont, da sie mehrmals verglichen werden)

    Lösungsstrategien:

    • korrelierte Variablen ausschliessen
    • Standardisierung (z.B.: z-Transformation) 

Theoretische überlegungen / beobachtbare Segmentierungsmerkmale zum Variablen auswählen

Beobachtbare Segmentierungsmerkmale

  • lassen sich objektiv bewerten

  • sind einfach zu erfassen

  • z.B. (sozio-)demografische Aspekte (Alter, Geschlecht,

    Wohnort, Einkommen, soziale Schicht)

  • Probleme: Tendieren zu klischeehaften und zu breiten Gruppen

    (z.B. konservative Senioren, jugendliche Spassgesellschaft) 

nicht beobachtbare Segmentierungsmerkmale zum Variablen auswählen

Nicht beobachtbare Segmentierungsmerkmale

  • persönliche Einstellungen (z.B. Umweltschutz), Werte (z.B. Religion, politische Orientierung), Motivationen, Interessen, sexuelle Orientierung, Risikofreude

  • haben hohe Verhaltensrelevanz

  • Erfassung solcher Merkmale ist aufwändig (z.B. Anzahl

    Fragen, Auswahl / Konstruktion guter Erhebungsinstrument) 

distanzmass: eukldische distanz

distanzmass: city block distanz

zwei arten von cluster verfahren

hierarchisch oder nicht hierarchisch - k-means

4 merkmale hierarchische clusterverfahren

  • Für metrisch, nominalskalierte oder gemischt skalierte Variablen

  • Für grosse Fallzahl nicht geeignet (>250)

  • Clusteranzahl muss nicht vorgegeben werden

  • Ein Durchgang berechnet mehrere Lösungen 

ablauf hierarchische clusteranalyse 

jedes objekt ist ein cluster

berechnung aller distanzen

Suche nach den 2 objekten mit geringster distanz

zusammenfassung der 2 ähnlichsten objekte

berechung der neuen abstände

alle objekte in 1 gruppe

distanz: single linkage = nächstgelegener nachbar

  • Die Cluster werden über den geringsten Abstand zweier Elemente (Fälle, Personen, Cluster) ermittelt.

  • Die Verbindung zweier Cluster wird brückenförmig durch je ein Objekt der beiden Cluster (‘single link’) hergestellt

  • Bildet viele kleine und einige grosse Gruppen

  • Gut geeignet, um Ausreisser zu identifizieren (die sehr kleinen Gruppen) 

distanz: complete linkage = entferntester anchbar

  • Die Cluster werden über den Maximalabstand aller Elemente (Fälle, Personen, Cluster) ermittelt

  • Fusioniert werden Elemente mit dem geringsten Maximalabstand

  • Neigt dazu, viele kleine, ähnlich grosse Gruppen zu bilden

  • Liefert überlappende Clusterstukturen 

distanz: average linkage

  • Man berechnet fur je zwei Cluster (Fälle, Personen, Cluster) den Mittelwert aller Objektdistanzen und fusioniert die Cluster mit der kleinsten Durchschnittsdistanz

  • Vom Clustereffekt her liegt diese Strategie zwischen Single Linkage und Complete Linkage (weniger starke Kettenbildung; weniger starke Tendenz zu vielen kleinen Gruppen)

  • Bias liegt zwischen single linkage und complete linkage. 

ablauf k-means

vorgabe startgruppierung

berechung mittelwerte für gruppeneigenschaften

berechung fehlerquadratsummen

was passiert bei objektverschiebung: falls alle objekte untersuch ist fertig. falls vermingerung der ferhlerquadratsumme werden die objekte verlagert und gruppenmittelwerte neu berechnet

richtlinien um anzahl cluster zu bestimmen

Theoretische oder pragmatische Gründe
z.B. Anzahl Gruppen, die in früheren Untersuchungen gefunden wurden z.B. man will Markt in x Teile aufteilen

Sprung bei Koeffizienten (Zuordnungsübersicht, Struktogramm / Ellenbogen, Dendrogramm - siehe unten)

Relative Grösse von Clustern: Clustern mit zu wenigen Personen oder deutlich weniger Personen als in anderen Clustern machen häufig keinen Sinn.

• Clusteranzahl sollte im Verhältnis zu Variablenanzahl, Wertevariation und Fallzahl stehen:
Bei geringer Variablenanzahl, Wertevariation und Fallzahl ist es schwer Cluster zu finden.

Bei sehr grosser Variablenanzahl, Wertevariation und Fallzahl wird Anzahl Cluster gross und schwer zu interpretieren. 

5 krieterien um reliabilität und validität der clusterlösung zu beurteilen

  • Verschiedene Distanzmasse ausprobieren

  • Verschiedene Clustermethoden ausprobieren

  • Split half (Datensatz halbieren und mit beiden Hälften rechnen, Lösungen vergleichen)

  • Bei nicht hierarchischen Verfahren kann Reihenfolge der Daten eine Rolle spielen

  • verschiedene Reihenfolgen ausprobieren 

clusteranalyse wird massgeblich beeinflusst durch 4 punkte

  • Wahl der Variablen

  • Wahl des Fusionierungsalgorithmus

  • Merkmale der zu clusternden Variablen (Skalierung, Einheitlichkeit ...)

  • Merkmale der zu gruppierende Elemente
    Annahme 1: Noch nicht geclusterte Daten enthalten Cluster Annahme 2: Diese Cluster machen Sinn
    → Besonders bei latenten Variablen nicht klar
    → Validierung der Cluster notwendig
    Clusteranalyse analysiert keine Cluster, sie bildet sie! 

3 punkte kritik clusteranalyse

• ist vergleichsweise ‘unwissenschaftlich’
• ist kein sinnstiftendes Verfahren, sondern ein

klassifizierendes Verfahren
• Unterschiedliche Verfahren führen meist zu anderen Lösungen