VL22


Fichier Détails

Cartes-fiches 162
Langue Deutsch
Catégorie Psychologie
Niveau Université
Crée / Actualisé 10.07.2022 / 27.07.2024
Lien de web
https://card2brain.ch/box/20220710_methoden_der_skalierung
Intégrer
<iframe src="https://card2brain.ch/box/20220710_methoden_der_skalierung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was sind struktur-entdeckende Verfahren?

  • Interdependenzanalysen
  • Entdecken von Zusammenhängen
  • keine Einteilung in AV und UV
  • Variablen
    • nominal: Clusteranalyse
    • metrisch: Clusteranalyse und Faktorenanalyse

Was sind struktur-prüfende Verfahren?

  • Dependenzanalysen
  • Überprüfen von Zusammenhängen
  • Einteilung in AV und UV

 

  1. UV & AV = nominal: logistische Regression & Kontingenzanalyse
  2. UV = nominal
    AV = metrisch: multiple Varianzanalyse
  3. UV = metrisch
    AV = nominal: Diskriminanzanalyse & logistische Regression
  4. UV & AV = metrisch: multiple Regression

Was sind Fragen der Faktorenanalyse?

  • Gibt es eine begrenzte Anzahl von Dimensionen/Faktoren, auf denen sich Objekte/Personen beschreiben lassen?
    • Abbildung der Persönlichkeit des Menschen aufgrund welcher grundlegender Eigenschaften
    • Zusammenfassung der Aspekte der allgemeinen Intelligenz (z.B. kristallin, fluid)
  • Was liegt hinter den manifesten Variablen?
    • latente Variablen (Faktoren)

Welche Funktionen erfüllt die Faktorenanalyse?

  1. Strukturierungsfunktion: Entdeckung von Beschreibungsvariablen
  2. Datenreduktion durch latente Variablen
  3. Überprüfung der Dimensionalität komplexer Merkmale (Fragebogenkonstruktion)
  4. Hypothesengenerierung

Welche Schritte durchläuft eine Faktorenanalyse?

  1. Variablenauswahl und Errechnung der Korrelationsmatrix
    • Voraussetzungen
    • Korrelationskoeffizienz, Bartlett-Test, Kaiser-Meyer-Olkin Kriterium (KMO)
  2. Extraktion der Faktoren
    • Fundamentaltheorem
    • Hauptkomponentenanalyse vs. Faktorenanalyse
  3. Bestimmung der Kommunalitäten
  4. Zahl der Faktoren
    • Kaiser-Kriterium (Eigenwert), Scree-Kriterium, Parallelanalyse nach Horn
  5. Faktoreninterpretation
    • orthogonale oder oblique Rotation
  6. Bestimmung Faktorenwerte

Was sind Voraussetzungen der Variablenauswahl?

  1. Zuverlässigkeit/Reliabilität der Ausgangsdaten beeinflussen Güte der Ergebnisse der FA
  2. Relevanz der erhobenen Merkmale für Untersuchungsgegenstand
  3. homogene Stichprobe (bzgl. Kriterium)
  4. Unabhängigkeit der Beurteilung
  5. Normalverteilung der Merkmale (Residuen)
  6. intervallskalierte Daten
  7. Stichprobengröße ausreichend

Welche AUssagen in der Literatur gibt es bzgl. der Stichprobengröße?

  1. Backhaus:
    1. Anzahl Fälle ≥ Anzahl Variablen
      Anzahl Fälle ≥ 3* Anzahl Variablen
  2. Nunally: 10-15 Fälle pro Variable
  3. Tabachnik & Fidell: mind. 300 Fälle
  4. Comrey & Lee: 
    1. 100 = armselig
    2. 300 = gut
    3. 1000 = exzellent
  5. Guadagnoli und Velicer 
    1. Abhängigkeit der Faktorladungsgröße
    2. Faktoren ≥ 4 Ladungen, die > .6 sind: Stichprobengröße egal
    3. Faktoren mit ≥ 10 Ladungen mit > .4: mind. 150 Fälle
    4. wenige, geringe Ladungen: mind. 300 Fälle
  6. MacCallum:
    1. Kommunalitäten
    2. alle Kommunalitäten > 0.6: < 100 
    3. Komunalitäten ± 0.5: 100-200 Fälle
    4. Kommunalitäten < 0.5 und viele Faktoren: > 500 Fälle

Wie wird eine Datenmatrix dargestellt?

  • Personen/Objekte in Zeilen, Merkmale in Spalten
  • Ziel: Gruppierung der Merkmale (= Variablen)
    • Frage: Welche Merkmale sind sich ähnlich?
  • Über die VP hinweg Mittelwerte bilden und so eine Objekt x Merkmale - Matrix erstellen

Wie werden nun die Variablen ausgewählt?

  • Zusammenhänge der Variablen in der Korrelationsmatrix erkennbar
  • Prüfkriterien basieren auf Korrekationsmatrix
    1. Korrelationskoeffizienzen
    2. Bartlett-Test/Test of Sphericity
    3. Kaiser-Meyer-Olkin-Kriterium (KMO)
  • wichtig: betrachten von mehr als einem Prüfkriterium

Wie entscheidet der Korrelationskoeffizient über die Auswahl der Variablen?

  • Wertebereich: -1 bis 1
  • nicht nur kleine Korrelationen (r < .2)
  • nicht zu viele große Korrelationen (r > .8), sonst Konglomerat
  • Lösung: Variablen eliminieren

Wie entscheidet der Bartlett-Test über die Auswahl der Variablen?

  • H0: Korrelationsmatrix weicht nur zufällig von der Einheitsmatrix ab
    • Stichprobe stammt aus Grundgesamtheit, wo Variablen unkorreliert sind
    • signifikant = es gibt Korrelationen zwischen den Ausgangsvariablen
  • Voraussetzng: Normalverteilung der Variablen
  • p-Wert < 0.05

Wie entscheidet das Kaiser-Meyer-Olkin Kriterium über die Auswahl der Variablen?

  • Zeigt Umfang der Varianz an, den die Variablen teilen
  • Wertebereich: 0-1
  • KMO ≥ 0.9 = erstaunlich
  • KMO ≥ 0.8 = verdienstvoll
  • ...
  • KMO ≥ 0.5 = kläglich
  • KMO < 0.5 = untragbar

Was ist das Fundamentaltheorem?

  • Beobachtete Werte der Personen/Objekte in den Variablen lassen sich als lineare Kombinationen der dahinterliegenden Faktoren beschreiben
    • Annahme: additives Modell der Messwerte

 

  • xik = ai1p1k + ai2p2k + ... + aiqpqk + (Rest)
    • mit k Personen, i Merkmalen, q Faktoren
    • Beobachtungswert: x
  • Gewichtung ist abhängig von:
    • Wie hoch Merkmale mit entsprechenden Faktoren korreliert sind (a) = Faktorladung
    • WIe hoch Faktoren bei Objekt/Person ausgeprägt sind (p) = Faktowert

Was ist die Faktorladung?

  • aiq = Korrelation Faktor und Variable
    • wie viel hat Merkmal/Item mit Faktor zu tun?

Was ist der Faktorwert?

  • pqk = Ausprägung des Faktors bei einem Objekt/Person k
  • Die Faktorwerte eines Objekts/Person sind die lineare Kombination der Variablenausprägung dieser Person/Objekt
    • pk1 = a1x1i + a2x2i + ... + (Rest)
    • Wert von Person (p) auf allen Merkmalen (i), gewichtet durch Ladungen der Merkmale auf Faktor (a)

Wie lässt sich das jetzt graphisch darstellen?

  • Korrelationen als Vektoren
    • Korrelationskoeffizienzen = Winkel zwischen Variablenvektoren (standardisierte Länge = 1)
  • Korrelation = Cos des Winkels zweier Vektoren
    • Cos(60°) = AD/AC = AD/1 = 0.5
    • Winkel: 90° = Cos/r = 0
    • Winkel: 0° = Cos/r = 1

Wie kann man nun den Faktor darstellen?

  • Faktor = Resultante (Schwerpunkt) der Variablenvektoren
  • Cos des Winkels zwischen Resultante und Vektor = Faktorladung

Welche beiden Extraktionsverfahren gibt es?

  1. Hauptkomponentenanalyse (Principal Component Analysis)
  2. Faktorenanalyse (Hauptachsenanalyse, Principal Axis Factoring)

Wie funktioniert die Hauptkomponentenanalyse?

  • Ziel:
    • Reproduktion der Datenstruktur durch möglichst wenige Faktoren (Sammelbegriff)
    • Daten gruppieren
  • Merkmale:
    • kausal zugrundeliegende Strukturen sind egal
    • keine Generalisierung der Befunde
  • Annahme: gesamte Varianz der Ausgangsvariablen werden von Fatoren erklärt

Wie funktioniert die Faktorenanalyse?

  • Ziel:
    • Erklärung der Varianz in Ausgangsvariablen durch hypothetische Größen 
      Faktoren = latente Variablen
    • Wie lässt sich Ursache für die Ladungend der Variablen auf diesem Faktor bezeichnen?
  • Merkmale
    • Korrelationen kausal interpretieren
    • Generalisierung auf Grundgesamtheit
  • Annahmen:
    • es gibt Einzelrestvarianz in Ausgangsvariablen
    • gesamte Varianz wird nicht durch Faktoren erklärt

Was sind Kommunalitäten?

  • Umfang an Varianzaufklärung, den die Faktoren gemeinsam für eine Ausgangsvariable liefern
    • nicht gesamte Varianz wird durch Faktoren bedingt: Fundamentaltheorem + Rest

Woraus ergibt sich die Gesamtvarianz?

Gemeinsame Varianz (Kommunalität = durch Faktoren erklärt) + Spezifische Varianz (unique Varianz der Variablen, unabhängig von Faktoren) + Fehler-/Zufallsvarianz

Von welcher Kommunalitätenschätzung geht die Hauptkomponentenanalyse aus?

  • Kommunalität = 1
  • Annahme, die Varianz wird komplett durch die Extraktion von Faktoren erklärt
  • es gibt keine spezifische Varianz

Von welcher Kommunalitätenschätzung geht die Faktorenanalyse aus?

  • Kommunalität < 1
  • Annahme, dass Varianz der Ausgangsvariablen aus Kommunalität und spezifischer Varianz besteht

 

Schätzung der Ausgangskommunalitäten ist unmittelbar mit Methode der Faktorenermittlung gekoppelt!

Was entspricht dem Schätzwert?

  • quadrierten multiplen Regressionskoeffizient R2 
  • Hinweise, welche Variablen ausgeschlossen werden sollten: niedrige Werte 
    • dann Items entfernen und erneute FA durchführen

Was sind Kenntwerte für die Ermittlung der Faktorenanzahl?

  1. Eigenwert (Repräsentation der Variable durch einen Faktor)
  2. Kommunalität (Repräsentation der Ausgangsvariablen durch Faktoren)
  3. Faktorladung (Korrelation Variable - Faktor)

Was ist der Eigenwert im Spezifischen?

  • Summe der quadrierten Faktorladungen eines Faktors über alle Variablen
    • durch Faktor erklärte Varianz der Beobachtungswerte
    • Wie gut repräsentiert der Faktor die Variablen
  • > 1: erklärt mehr als eine Variable (Ziel)

Wie kann man die Faktoren extrahieren?

  1. Kaiser-Kriterium
    • Faktorenzahl mit Eigenwert > 1
  2. Scree-Kriterium
    • "Geröll"
    • Anordnung der Eigenwerte in einem KOOS 
    • an Stelle, an der Differenz von zwei Eigenwerten am größten ist, entsteht "Knick"
    • Faktor links vom Knick ist der letzte, der extrahiert wird
  3. Parallelanalyse nach Horn
    • Faktoren, deren Eigenwerte > als 95%-Perzentiel der Eigenwerte von unkorrelierten normalverteilten ZUfallsvariablen (gleiche Anzahl von Variablen und Beobachtungen wie im Datensatz)

meist alle drei Überlegungen berichtet!

Wie wird am besten eine Faktoreninterpretation vorgenommen?

  • am besten, wenn "Einfachstruktur" vorliegt
    • Variablen laden auf einen Faktor hoch und auf anderem niedrig
    • wenn Struktur nicht vorliegt: extrahierte Faktoren rotieren
    • daraus entsteht Verschiebung der Ladungen mit dem Ziel eine Einfachstruktur zu erhalten

Welche Arten der Faktorenrotation gibt es?

  1. Orthogonale/rechtwinklige Rotation
    • Annahme, Faktoren sind unabhängig voneinander
    • bspw. Big 5 bei Persönlichkeit
    • rotierte Faktormatrix gibt Ladungen an
  2. Oblique/schiefwinklige Rotation
    • Annahme, dass Faktoren miteinander korreliert sein können
    • Mustermatrix gibt Ladungen an

Wie werden Ladungen interpretiert?

  • Interpretationen = subjektiv
  • Variablen eliminieren, wenn:
    1. Variable auf keinem Faktor Ladung > 0.2/0.3
    2. Variable auf mehreren Faktoren ähnlich hohe Ladung besitzt
  • nach eliminieren neue FA berechnen

Wie werden Faktorwerte bestimmt?

  • Ziel: Einschätzung der beurteilten Personen/Objekte bzgl. der extrahierten Faktoren
  • Faktorwert = Ausprägung eines Faktors bei einer Person/Objekt
    • lineare Kombinationen der z-standardisierten Ausgangswerte (Werte auf Ausgangsvariablen) und der Ladung der Ausgangsvariablen auf den jeweiligen Faktoren
  • bei Interpretation der Faktorwerte: Fälle immer im Vergleich zueinander betrachten!
  • Faktorwerte gut im Streudiagramm darstellbar

Wie wird die Lösung dann validiert?

  • bisher nur exploratives Vorgehen
  • nun konfirmatorische FA (basiert auf Strukturgleichungsmodell), sollte an neuer Stichprobe reproduziert werden
  • Re-Test Reliabilität (gleiche Stichprobe)
  • Auswahl weiterer, für Faktoren typische Objekte/Personen

Was bedeuten die Anti-Image Matrizen?

  • Korrelationen, wenn der Einfluss aller anderen Variablen herauspartialisiert wurde
  • Diagonale bildet KMO
  • Teilung der Varianz einer Variablen in "Image" und "Anti-Image"
    • Image: durch ander Variablen aufklärbarer Varianzanteil
    • Anti-Image: Teil der Variablenvarianz der unabhängig von übrigen Variablen ist
  • Anti-Image = möglichst gering (möglichst keine von den anderen Variablen komplett unabhängige Variable)
    -> Werte außerhalb der Diagoalen nahe 0

Was erzeugt die logistische Regression?

  • strukturprüfendes Verfahren
  • nominale/ordinale AV, oft dichotom
  • erzeugt b-Gewichte/Koeffizienten, die genutzt werden, um den Logit zu berechnen
  • Logit = natürlicher Logarithmus der Odds/Chance für das Eintreten eines Ereignisses
  • Ziel: wie gut wird mithilfe der UV die Gruppenzugehörigkeit vorhergesagt
    • Ermittlung der Eintrittswahrscheinlichkeit

Vergleiche t-Tests mit logistischen Regressionen

  • t-Test: zwei Gruppen, eine AV
    • unterscheiden sich Gruppen in Mittelwerten
  • log Reg: Gruppen als AV
    • Vorhersage der Gruppenzugehörigkeit durch UV
    • UV = nominal, ordinal, metrisch

Was sind Ziele der logistischen Regression?

  1. Zusammenhang identifizieren
  2. Prädiktoren identifizieren 
  3. Einflussstärke der Prädiktoren auf AV
  4. Vorhersage der Eintrittswahrscheinlichkeit einer Merkmalsausprägung für eine spezielle Person

Welche Fragen können durch die logistische Regression geklärt werden?

  1. Wodurch wird das Eintreten eines Ereignisses/Zustands bei einem Untersuchungsobjekt beeinflusst?
  2. Gewichtungsfunktion, die angibt, welche Prädiktoren das Kriterium wie stark in welche Richtung beeinflussen
  3. Wie hoch ist die Wahrscheinlichkeit für das Eintreten eines Ergeignisses/Zustands bei einem bestimmten Untersuchungsobjekt, wenn man dessen Ausprägungen bei den Prädiktoren kennt?

Was sind die Voraussetzungen für die logistische Regression?

  1. Skalenniveau
    • UV: kategorial/metrisch
    • AV: kategorial
      • dichotom = binär logistische Regression
      • multinominal = multinominale logistische Regression
  2. keine Multikollinearität
    • Toleranz: 1-R2 > 0.1/0.2
      (1- geteilte Varianz)
    • Korrelationen im Output nicht > 0.8
  3. Unabhängigkeit der Beobachtungen
  4. keine Ausreißer
  5. Linearität zwischen kontinuierlichen UVs und der Logit Transformation der AV
  6. Fallzahl
  7. alle relevanten Prädiktoren sind enthalten

Wie kann man auf Ausreißer prüfen?

  • Cooks Distanz:
    • Ordnen der neu erstellten Variablen nach Größe 
    • Ausreißer ab ca. 1