VL22
Fichier Détails
Cartes-fiches | 162 |
---|---|
Langue | Deutsch |
Catégorie | Psychologie |
Niveau | Université |
Crée / Actualisé | 10.07.2022 / 27.07.2024 |
Lien de web |
https://card2brain.ch/box/20220710_methoden_der_skalierung
|
Intégrer |
<iframe src="https://card2brain.ch/box/20220710_methoden_der_skalierung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was sind struktur-entdeckende Verfahren?
- Interdependenzanalysen
- Entdecken von Zusammenhängen
- keine Einteilung in AV und UV
- Variablen
- nominal: Clusteranalyse
- metrisch: Clusteranalyse und Faktorenanalyse
Was sind struktur-prüfende Verfahren?
- Dependenzanalysen
- Überprüfen von Zusammenhängen
- Einteilung in AV und UV
- UV & AV = nominal: logistische Regression & Kontingenzanalyse
- UV = nominal
AV = metrisch: multiple Varianzanalyse - UV = metrisch
AV = nominal: Diskriminanzanalyse & logistische Regression - UV & AV = metrisch: multiple Regression
Was sind Fragen der Faktorenanalyse?
- Gibt es eine begrenzte Anzahl von Dimensionen/Faktoren, auf denen sich Objekte/Personen beschreiben lassen?
- Abbildung der Persönlichkeit des Menschen aufgrund welcher grundlegender Eigenschaften
- Zusammenfassung der Aspekte der allgemeinen Intelligenz (z.B. kristallin, fluid)
- Was liegt hinter den manifesten Variablen?
- latente Variablen (Faktoren)
Welche Funktionen erfüllt die Faktorenanalyse?
- Strukturierungsfunktion: Entdeckung von Beschreibungsvariablen
- Datenreduktion durch latente Variablen
- Überprüfung der Dimensionalität komplexer Merkmale (Fragebogenkonstruktion)
- Hypothesengenerierung
Welche Schritte durchläuft eine Faktorenanalyse?
- Variablenauswahl und Errechnung der Korrelationsmatrix
- Voraussetzungen
- Korrelationskoeffizienz, Bartlett-Test, Kaiser-Meyer-Olkin Kriterium (KMO)
- Extraktion der Faktoren
- Fundamentaltheorem
- Hauptkomponentenanalyse vs. Faktorenanalyse
- Bestimmung der Kommunalitäten
- Zahl der Faktoren
- Kaiser-Kriterium (Eigenwert), Scree-Kriterium, Parallelanalyse nach Horn
- Faktoreninterpretation
- orthogonale oder oblique Rotation
- Bestimmung Faktorenwerte
Was sind Voraussetzungen der Variablenauswahl?
- Zuverlässigkeit/Reliabilität der Ausgangsdaten beeinflussen Güte der Ergebnisse der FA
- Relevanz der erhobenen Merkmale für Untersuchungsgegenstand
- homogene Stichprobe (bzgl. Kriterium)
- Unabhängigkeit der Beurteilung
- Normalverteilung der Merkmale (Residuen)
- intervallskalierte Daten
- Stichprobengröße ausreichend
Welche AUssagen in der Literatur gibt es bzgl. der Stichprobengröße?
- Backhaus:
- Anzahl Fälle ≥ Anzahl Variablen
Anzahl Fälle ≥ 3* Anzahl Variablen
- Anzahl Fälle ≥ Anzahl Variablen
- Nunally: 10-15 Fälle pro Variable
- Tabachnik & Fidell: mind. 300 Fälle
- Comrey & Lee:
- 100 = armselig
- 300 = gut
- 1000 = exzellent
- Guadagnoli und Velicer
- Abhängigkeit der Faktorladungsgröße
- Faktoren ≥ 4 Ladungen, die > .6 sind: Stichprobengröße egal
- Faktoren mit ≥ 10 Ladungen mit > .4: mind. 150 Fälle
- wenige, geringe Ladungen: mind. 300 Fälle
- MacCallum:
- Kommunalitäten
- alle Kommunalitäten > 0.6: < 100
- Komunalitäten ± 0.5: 100-200 Fälle
- Kommunalitäten < 0.5 und viele Faktoren: > 500 Fälle
Wie wird eine Datenmatrix dargestellt?
- Personen/Objekte in Zeilen, Merkmale in Spalten
- Ziel: Gruppierung der Merkmale (= Variablen)
- Frage: Welche Merkmale sind sich ähnlich?
- Über die VP hinweg Mittelwerte bilden und so eine Objekt x Merkmale - Matrix erstellen
Wie werden nun die Variablen ausgewählt?
- Zusammenhänge der Variablen in der Korrelationsmatrix erkennbar
- Prüfkriterien basieren auf Korrekationsmatrix
- Korrelationskoeffizienzen
- Bartlett-Test/Test of Sphericity
- Kaiser-Meyer-Olkin-Kriterium (KMO)
- wichtig: betrachten von mehr als einem Prüfkriterium
Wie entscheidet der Korrelationskoeffizient über die Auswahl der Variablen?
- Wertebereich: -1 bis 1
- nicht nur kleine Korrelationen (r < .2)
- nicht zu viele große Korrelationen (r > .8), sonst Konglomerat
- Lösung: Variablen eliminieren
Wie entscheidet der Bartlett-Test über die Auswahl der Variablen?
- H0: Korrelationsmatrix weicht nur zufällig von der Einheitsmatrix ab
- Stichprobe stammt aus Grundgesamtheit, wo Variablen unkorreliert sind
- signifikant = es gibt Korrelationen zwischen den Ausgangsvariablen
- Voraussetzng: Normalverteilung der Variablen
- p-Wert < 0.05
Wie entscheidet das Kaiser-Meyer-Olkin Kriterium über die Auswahl der Variablen?
- Zeigt Umfang der Varianz an, den die Variablen teilen
- Wertebereich: 0-1
- KMO ≥ 0.9 = erstaunlich
- KMO ≥ 0.8 = verdienstvoll
- ...
- KMO ≥ 0.5 = kläglich
- KMO < 0.5 = untragbar
Was ist das Fundamentaltheorem?
- Beobachtete Werte der Personen/Objekte in den Variablen lassen sich als lineare Kombinationen der dahinterliegenden Faktoren beschreiben
- Annahme: additives Modell der Messwerte
- xik = ai1p1k + ai2p2k + ... + aiqpqk + (Rest)
- mit k Personen, i Merkmalen, q Faktoren
- Beobachtungswert: x
- Gewichtung ist abhängig von:
- Wie hoch Merkmale mit entsprechenden Faktoren korreliert sind (a) = Faktorladung
- WIe hoch Faktoren bei Objekt/Person ausgeprägt sind (p) = Faktowert
Was ist die Faktorladung?
- aiq = Korrelation Faktor und Variable
- wie viel hat Merkmal/Item mit Faktor zu tun?
Was ist der Faktorwert?
- pqk = Ausprägung des Faktors bei einem Objekt/Person k
- Die Faktorwerte eines Objekts/Person sind die lineare Kombination der Variablenausprägung dieser Person/Objekt
- pk1 = a1x1i + a2x2i + ... + (Rest)
- Wert von Person (p) auf allen Merkmalen (i), gewichtet durch Ladungen der Merkmale auf Faktor (a)
Wie lässt sich das jetzt graphisch darstellen?
- Korrelationen als Vektoren
- Korrelationskoeffizienzen = Winkel zwischen Variablenvektoren (standardisierte Länge = 1)
- Korrelation = Cos des Winkels zweier Vektoren
- Cos(60°) = AD/AC = AD/1 = 0.5
- Winkel: 90° = Cos/r = 0
- Winkel: 0° = Cos/r = 1
Wie kann man nun den Faktor darstellen?
- Faktor = Resultante (Schwerpunkt) der Variablenvektoren
- Cos des Winkels zwischen Resultante und Vektor = Faktorladung
Welche beiden Extraktionsverfahren gibt es?
- Hauptkomponentenanalyse (Principal Component Analysis)
- Faktorenanalyse (Hauptachsenanalyse, Principal Axis Factoring)
Wie funktioniert die Hauptkomponentenanalyse?
- Ziel:
- Reproduktion der Datenstruktur durch möglichst wenige Faktoren (Sammelbegriff)
- Daten gruppieren
- Merkmale:
- kausal zugrundeliegende Strukturen sind egal
- keine Generalisierung der Befunde
- Annahme: gesamte Varianz der Ausgangsvariablen werden von Fatoren erklärt
Wie funktioniert die Faktorenanalyse?
- Ziel:
- Erklärung der Varianz in Ausgangsvariablen durch hypothetische Größen
Faktoren = latente Variablen - Wie lässt sich Ursache für die Ladungend der Variablen auf diesem Faktor bezeichnen?
- Erklärung der Varianz in Ausgangsvariablen durch hypothetische Größen
- Merkmale
- Korrelationen kausal interpretieren
- Generalisierung auf Grundgesamtheit
- Annahmen:
- es gibt Einzelrestvarianz in Ausgangsvariablen
- gesamte Varianz wird nicht durch Faktoren erklärt
Was sind Kommunalitäten?
- Umfang an Varianzaufklärung, den die Faktoren gemeinsam für eine Ausgangsvariable liefern
- nicht gesamte Varianz wird durch Faktoren bedingt: Fundamentaltheorem + Rest
Woraus ergibt sich die Gesamtvarianz?
Gemeinsame Varianz (Kommunalität = durch Faktoren erklärt) + Spezifische Varianz (unique Varianz der Variablen, unabhängig von Faktoren) + Fehler-/Zufallsvarianz
Von welcher Kommunalitätenschätzung geht die Hauptkomponentenanalyse aus?
- Kommunalität = 1
- Annahme, die Varianz wird komplett durch die Extraktion von Faktoren erklärt
- es gibt keine spezifische Varianz
Von welcher Kommunalitätenschätzung geht die Faktorenanalyse aus?
- Kommunalität < 1
- Annahme, dass Varianz der Ausgangsvariablen aus Kommunalität und spezifischer Varianz besteht
Schätzung der Ausgangskommunalitäten ist unmittelbar mit Methode der Faktorenermittlung gekoppelt!
Was entspricht dem Schätzwert?
- quadrierten multiplen Regressionskoeffizient R2
- Hinweise, welche Variablen ausgeschlossen werden sollten: niedrige Werte
- dann Items entfernen und erneute FA durchführen
Was sind Kenntwerte für die Ermittlung der Faktorenanzahl?
- Eigenwert (Repräsentation der Variable durch einen Faktor)
- Kommunalität (Repräsentation der Ausgangsvariablen durch Faktoren)
- Faktorladung (Korrelation Variable - Faktor)
Was ist der Eigenwert im Spezifischen?
- Summe der quadrierten Faktorladungen eines Faktors über alle Variablen
- durch Faktor erklärte Varianz der Beobachtungswerte
- Wie gut repräsentiert der Faktor die Variablen
- > 1: erklärt mehr als eine Variable (Ziel)
Wie kann man die Faktoren extrahieren?
- Kaiser-Kriterium
- Faktorenzahl mit Eigenwert > 1
- Scree-Kriterium
- "Geröll"
- Anordnung der Eigenwerte in einem KOOS
- an Stelle, an der Differenz von zwei Eigenwerten am größten ist, entsteht "Knick"
- Faktor links vom Knick ist der letzte, der extrahiert wird
- Parallelanalyse nach Horn
- Faktoren, deren Eigenwerte > als 95%-Perzentiel der Eigenwerte von unkorrelierten normalverteilten ZUfallsvariablen (gleiche Anzahl von Variablen und Beobachtungen wie im Datensatz)
meist alle drei Überlegungen berichtet!
Wie wird am besten eine Faktoreninterpretation vorgenommen?
- am besten, wenn "Einfachstruktur" vorliegt
- Variablen laden auf einen Faktor hoch und auf anderem niedrig
- wenn Struktur nicht vorliegt: extrahierte Faktoren rotieren
- daraus entsteht Verschiebung der Ladungen mit dem Ziel eine Einfachstruktur zu erhalten
Welche Arten der Faktorenrotation gibt es?
- Orthogonale/rechtwinklige Rotation
- Annahme, Faktoren sind unabhängig voneinander
- bspw. Big 5 bei Persönlichkeit
- rotierte Faktormatrix gibt Ladungen an
- Oblique/schiefwinklige Rotation
- Annahme, dass Faktoren miteinander korreliert sein können
- Mustermatrix gibt Ladungen an
Wie werden Ladungen interpretiert?
- Interpretationen = subjektiv
- Variablen eliminieren, wenn:
- Variable auf keinem Faktor Ladung > 0.2/0.3
- Variable auf mehreren Faktoren ähnlich hohe Ladung besitzt
- nach eliminieren neue FA berechnen
Wie werden Faktorwerte bestimmt?
- Ziel: Einschätzung der beurteilten Personen/Objekte bzgl. der extrahierten Faktoren
- Faktorwert = Ausprägung eines Faktors bei einer Person/Objekt
- lineare Kombinationen der z-standardisierten Ausgangswerte (Werte auf Ausgangsvariablen) und der Ladung der Ausgangsvariablen auf den jeweiligen Faktoren
- bei Interpretation der Faktorwerte: Fälle immer im Vergleich zueinander betrachten!
- Faktorwerte gut im Streudiagramm darstellbar
Wie wird die Lösung dann validiert?
- bisher nur exploratives Vorgehen
- nun konfirmatorische FA (basiert auf Strukturgleichungsmodell), sollte an neuer Stichprobe reproduziert werden
- Re-Test Reliabilität (gleiche Stichprobe)
- Auswahl weiterer, für Faktoren typische Objekte/Personen
Was bedeuten die Anti-Image Matrizen?
- Korrelationen, wenn der Einfluss aller anderen Variablen herauspartialisiert wurde
- Diagonale bildet KMO
- Teilung der Varianz einer Variablen in "Image" und "Anti-Image"
- Image: durch ander Variablen aufklärbarer Varianzanteil
- Anti-Image: Teil der Variablenvarianz der unabhängig von übrigen Variablen ist
- Anti-Image = möglichst gering (möglichst keine von den anderen Variablen komplett unabhängige Variable)
-> Werte außerhalb der Diagoalen nahe 0
Was erzeugt die logistische Regression?
- strukturprüfendes Verfahren
- nominale/ordinale AV, oft dichotom
- erzeugt b-Gewichte/Koeffizienten, die genutzt werden, um den Logit zu berechnen
- Logit = natürlicher Logarithmus der Odds/Chance für das Eintreten eines Ereignisses
- Ziel: wie gut wird mithilfe der UV die Gruppenzugehörigkeit vorhergesagt
- Ermittlung der Eintrittswahrscheinlichkeit
Vergleiche t-Tests mit logistischen Regressionen
- t-Test: zwei Gruppen, eine AV
- unterscheiden sich Gruppen in Mittelwerten
- log Reg: Gruppen als AV
- Vorhersage der Gruppenzugehörigkeit durch UV
- UV = nominal, ordinal, metrisch
Was sind Ziele der logistischen Regression?
- Zusammenhang identifizieren
- Prädiktoren identifizieren
- Einflussstärke der Prädiktoren auf AV
- Vorhersage der Eintrittswahrscheinlichkeit einer Merkmalsausprägung für eine spezielle Person
Welche Fragen können durch die logistische Regression geklärt werden?
- Wodurch wird das Eintreten eines Ereignisses/Zustands bei einem Untersuchungsobjekt beeinflusst?
- Gewichtungsfunktion, die angibt, welche Prädiktoren das Kriterium wie stark in welche Richtung beeinflussen
- Wie hoch ist die Wahrscheinlichkeit für das Eintreten eines Ergeignisses/Zustands bei einem bestimmten Untersuchungsobjekt, wenn man dessen Ausprägungen bei den Prädiktoren kennt?
Was sind die Voraussetzungen für die logistische Regression?
- Skalenniveau
- UV: kategorial/metrisch
- AV: kategorial
- dichotom = binär logistische Regression
- multinominal = multinominale logistische Regression
- keine Multikollinearität
- Toleranz: 1-R2 > 0.1/0.2
(1- geteilte Varianz) - Korrelationen im Output nicht > 0.8
- Toleranz: 1-R2 > 0.1/0.2
- Unabhängigkeit der Beobachtungen
- keine Ausreißer
- Linearität zwischen kontinuierlichen UVs und der Logit Transformation der AV
- Fallzahl
- alle relevanten Prädiktoren sind enthalten
Wie kann man auf Ausreißer prüfen?
- Cooks Distanz:
- Ordnen der neu erstellten Variablen nach Größe
- Ausreißer ab ca. 1