Statistik

Eigene Fragen

Eigene Fragen


Fichier Détails

Cartes-fiches 116
Langue Deutsch
Catégorie Psychologie
Niveau Université
Crée / Actualisé 10.07.2024 / 17.07.2024
Lien de web
https://card2brain.ch/box/20240710_statistik
Intégrer
<iframe src="https://card2brain.ch/box/20240710_statistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Welche Aussagen zum wissenschaftlichen Kreislauf sind korrekt?

Welche Aussagen zu Variablen sind korrekt? 

Geben Sie ein Bespiel für eine Mediator- und eine Moderatorvariable.

Mediator: Die Mediatorvariable 'Körperliche Gesundheit' vermittelt den Einfluss von Yoga auf Lebenszufriedenheit. Yoga kann zur Verbesserung der körperlichen Gesundheit führen, was wiederum zu höherer Lebenszufriedenheit führt. 

 

Moderator: Die Moderatorvariable 'Alter' verändert den Einfluss von Yoga auf Lebenszufriedenheit. Bei einem höheren Alter kann der Zusammenhang zwischen Yoga und Lebenszufriedenheit stärker sein, z.B. weil man mit höherer Lebenszufriedenheit einen besseren Zugang zu Weisheiten im Yoga hat. Andere Moderatoren könnten Persönlichkeit oder Yoga-Erfahrung sein. 

Welche Aussagen zu Experimentformen und -designs sind korrekt? 

Welche Aussagen sind korrekt?

Welche Aussagen sind korrekt? 

Welche Aussagen zur Inferenzstatistik sind korrekt? 

Welche Aussagen zum Alpha- und Beta-Fehler sind korrekt?

Welche Aussagen zu multivariaten Verfahren sind korrekt?

Welche Aussagen zur Faktorenanalyse sind richtig?

Beschreiben Sie kurz den Ablauf einer Faktorenanalyse

  1. Variablenauswahl und Errechnung der Korrelationsmatrix
  2. Extraktion der Faktoren 
  3. Bestimmung der Kommunalitäten 
  4. Zahl der Faktoren 
  5. Faktorinterpretation 
  6. Bestimmung der Faktorwerte 

Welche Vorraussetzungen gibt es für die (Variablenauswahl der) Faktorenanalyse?

Wie wählt man die Stichprobengröße für eine Faktorenanalyse aus?

Welche Aussagen zur Korrelationsmatrix der Faktorenanalyse sind korrekt?

Was bedeutet es, wenn sich in der Korrelationsmatrix einer Faktorenanalyse wenige große und ein paar kleine Korrelationen zeigen, im Bartlett-Test der p-Wert unter .05 liegt und das KMO-Kriterium einen Wert von .8 hat?

Welches dieser drei Verfahren ist am besten geeignet?

Die Güte der Korrelationsmatrix ist gut; mit dem Bartlett-Test kann man die H0 abweisen, dass die Stichprobe aus einer Grundgesamtheit stammt, in der die Variablen unkorreliert sind und kann H1 annehmen, dass die Variablen korreliert sind. KMO-Kriteriumswerte über .7 zeigen kann, dass die Variablen in einem hohen Maße Varianz teilen. Das KMO gilt als bestes Verfahren.

Was bedeutet folgende Gleichung 

Xki = ai1*pk1 + ai2*pk2 + Fehler

Nehmen wir als Objekt 'Rama', als Merkmal/Variable 'Vitamingehalt' und als Faktoren 'Wirtschaftlichkeit' und 'Gesundheit'. 

Welchen Buchstaben sind die Objekte/Merkmale/Faktoren zuzuordnen und was sagt die Gleichung aus?

Das ist eine Gleichung des Fundamentaltheorems, das aussagt, dass der beobachtete Wert (z.B. der beobachtete Wert des Objekts Rama bezüglich des Merkmals Vitamingehalt) sich aus einer linearen Kombination der dahinterliegenden Faktoren (additiv) zusammensetzt. 

Die Gleichung bedeutet also: der beobachtete Wert (x) von Rama (k) bezüglich des Merkmals Vitamingehalt (i) setzt sich aus der Faktorladung zwischen Vitamingehalt (i) und dem Faktor Wirtschaftlichkeit (1) multipliziert mit dem Faktorwert von Rama (k) mit Wirtschaftlichkeit (1) zusammen, addiert mit der Faktorladung zwischen Vitamingehalt (i) und dem Faktor Gesundheit (2), multipliziert mit dem Faktorwert von Rama (k) mit dem Faktor Gesundheit (2). 

Das heißt wörtlich: der beobachtet Wert (x) von Rama (k) bezüglich des Vitamingehalts (i) setzt sich folgend zusammen = wie hoch sind Vitamingehalt (i) und Wirtschaftlichkeit (1) korreliert * wie wirtschaftlich (1) ist Rama (k) + wie hoch sind Vitamingehalt (i) und Gesundheit (2) korreliert * wie gesund (2) ist Rama (k)

= der Wert (x) setzt sich also aus der bestimmten Gewichtung von Wirtschaftlichkeit (1) addiert mit der bestimmten Gewichtung von Gesundheit (2) zusammen (plus Fehler)

Was bedeutet folgende Gleichung 

Pkq = aq1Xk1 + aq2Xk2 + Fehler

Nehmen wir als Objekt 'Rama', als Merkmal/Variable 'Vitamingehalt' und als Faktoren 'Wirtschaftlichkeit' und 'Gesundheit'. 

Welchen Buchstaben sind die Objekte/Merkmale/Faktoren zuzuordnen und was sagt die Gleichung aus?

Diese Gleichung beschreibt den Faktorwert eines Objekts als lineare Kombination der Variablenausprägungen. 

Den Wert (P), den Rama (k) auf dem Faktor Wirtschaftlichkeit (q) hat, setzt sich zusammen aus: Faktorladung zwischen Wirtschaftlichkeit (q) und Vitamingehalt (i/1) * Wert von Rama (k) bezüglich Vitamingehalt (i/1) + Faktorladung zwischen Wirtschaftlichkeit (q) und Kaloriengehalt (i/2) * Wert von Rama (k) bezüglich Kaloriengehalt (i/2).

Das heißt wörtlich: Den Wert (P), den Rama (k) auf dem Faktor Wirtschaftlichkeit (q) hat, setzt sich zusammen aus: wie viel hat Wirtschaftlichkeit (q) mit Vitamingehalt (i/1) zu tun * welchen Vitamingehalt (i/1) hat Rama (k) + wie viel hat Wirtschaftlichkeit (q) mit Kaloriengehalt (i/2) zu tun * wie viele Kalorien (i/2) hat Rama (k)? (plus Fehler)  

Wie kann man eine Faktorenanalyse graphisch darstellen? 

Man kann Variablen als Vektoren darstellen, in dessen Mitte die Resultante, d.h. der latente Faktor, gesetzt wird

Welche zwei Verfahren der Faktorenextraktion gibt es?

Hauptkomponentenanalyse (Principal Component Analysis)

= Ziel ist Reproduktion der Datenstruktur durch möglichst wenig Faktoren, ohne eine kausale Interpretation der Faktoren oder Generalisierung der Befunde. Man geht davon aus, dass die gesamte Varianz der Variablen durch die Faktoren erklärt wird

Hauptachsenanalyse

= Ziel ist die Erklärung der Varianz in den Ausgangsvariablen durch latente Faktoren, wobei Korrelationen kausal interpretiert und Aussagen generalisiert werden können. Man geht davon aus, dass nicht die gesamte Varianz durch die Faktoren erklärt wird, sondern es Einzelrestvarianzen gibt 

Was ist Kommunalität? Welche Aussagen zur Kommunalität sind richtig?

Welche Varfahren gibt es, um zu bestimmen, wie viele Faktoren extrahiert werden sollen?

  1. Eigenwert/Kaiser-Kriterium: Faktoren mit einem Eigenwert > 1 werden behalten
  2. Scree/Geröll-Kriterium: Eigenwerte der Faktoren werden in einem Koordinatensystem abgetragen und dort, wo die Differenz zweier Eigenwerte am größten ist, entsteht ein Knick, welcher anzeigt, dass der Faktor links des Knicks der letzte zu extrahierende ist 
  3. Parallelanalyse (Horn): Faktoren, deren Eigenwerte das 95%-Perzentil der Eigenwerte von unkorrelierten normalverteilten Zufallsvariaben übersteigen, werden behalten (Anzahl an Faktoren, die die gelbe Simulationslinie übersteigen)

Wie kann man Faktoren interpretieren? 

Welche Aussagen zur Faktoreninterpretation sind korrekt? 

Wie bestimmt man Faktorwerte? Wieso bestimmt man Faktorwerte?

Welche Aussagen zur Validierung einer Faktorlösung sind korrekt?

Wie prüfe ich die Voraussetzungen für eine Faktorenanalyse in SPSS oder Jamovi? Welche Kennwerte sind wichtig? 

Was sagt die Korrelationsmatrix bei einer Faktorenanalyse aus? Wie kann man die Tabelle interpretieren?

Die Korrelationskoeffizienten r zeigen die Stärke und Richtung des Zusammenhangs zwischen einzelnen Variablen an (z.B. zeigt ein negatives Vorzeichen eine negative Korrelation an). Das Signifikanzniveau zeigt an, ob diese Korrelation signifikant ist. 

Die Determinante gibt an, wie hoch die Variablen miteinander korreliert sind. Eine Determinante nahe 0 zeigt an, dass die Variablen hoch miteinander korrelieren, nahe 1, dass sie weniger miteinander korrelieren. (?)

Was sagen die Prüfkriterien KMO-, Bartlett-Test und die Anti-Image Matrizen aus? 

Das Kaiser-Meyer-Olkin Kriterium misst die Eignung der Stichprobengröße, wobei Werte >.7 gut sind. 

Der Bartlett-Test misst die H0, dass es sich um eine Einheitsmatrix handelt und die Variablen nicht miteinander korrelieren, wobei wir die H0 ablehnen wollen und somit Werte < .05 gut sind. 

Anti-Image Matrizen zeigen an, wie hoch die Variablen miteinander korrelieren, wenn die sonst geteilte Varianz rauspartialisiert wurde. Hier sollten die Werte klein sein, weil wir viel geteilte Varianz haben wollen. Anti-Image Werte sollten also klein sein. 

Die Werte der Diagonalen-Korrelationen geben an, ob sich jede einzelne Variable für die Faktorenanalyse eignet und sollte hoch sein. 

Wie prüft man die Kommunalitäten in SPSS und was sollten für Ergebnisse/Werte herauskommen?

Man kann Kommunalitäten in der Tabelle 'Kommunalitäten' einsehen. Hier beim Endwert nach Extraktion gucken, welcher die aufgeklärte Varianz nach Extraktion angibt. Alle Werte > .5 sind bei Hauptachsenanalyse OK. 

Wie prüft man in SPSS, wie viele Faktoren man extrahieren sollte? Wie berechnet man die aufgeklärte Gesamtvarianz anhand der Werte in der Tabelle? 

  • Kaiser-Kriterium: in der Tabelle 'Erklärte Gesamtvarianz' kann man die Eigenwerte der Faktoren einsehen. Alle Faktoren mit Eigenwert >1 werden behalten. 
  • Um die aufgeklärte Gesamtvarianz zu berechnen, schaut man entweder in die letzte Spalte 'kumulierte Varianzaufklärung' oder man addiert die Eigenwerte der Faktoren und dividiert sie durch die Anzahl der möglichen Faktoren, z.B. Eigenwerte 2.955 + 1.740 addiert ergeben 4.695, geteilt durch 6 mögliche Faktoren erklären sie eine Gesamtvarianz von 0.7825 = 78.25%
  • Geröll-Kriterium: im Koordinatensystem gucken, welcher Faktor keinen deutlich größeren Eigenwert hat als der Faktor davor. Der Faktor links davon ist der letzte miteinzuschließende

Wie prüft man in Jamovi, ob die Voraussetzungen und die Prüfkriterien für eine Faktorenanalyse erfüllt sind?

  • Normalverteilung: ist der p-Wert des Shapiro-Wilk Test unter 0.05, so wird die H0, dass die Daten normalverteilt sind, abgelehnt und wir gehen nicht von einer NV aus (für die Faktorenanalyse aber nicht so schlimm)
  • KMO-Test für die Stichprobeneignung: ist der Wert >.7, sind die Daten geeignet 
  • Bartlett-Test für Korrelation zwischen Variablen: ist der p-Wert unter 0.05, so können wir die H0, dass die Daten unkorreliert sind, ablehnen 

Was muss in die Ergebnispräsentation einer Faktorenanalyse?

  • Anzahl Probanden, Items
  • Angewandte Verfahren und Kriterien (Hauptkomponenten/achsenanalyse, Scree Test/Paralleltest nach Horn)
  • Entscheidungen/Begründungen (Rotation, Exklusion, Extraktion)
  • evtl. Uneindeutigkeiten 
  • Interpretation der Faktoren (großer Teil!)
  • Tabelle mit Faktorladungen 
  • Korrelationstabelle 

Was moodelliert eine Logistische Regression im Unterschied zu z.B. einer linearen Regression?

Was könnten mögliche Fragestellungen einer logistischen Regression sein?

Was sind Voraussetzungen für eine logistische Regression (und was nicht)? Welche Kennziffern kann es für die Voraussetzungen geben?

  • Nominale Kriteriumsvariable (kategorial: Ja/Nein, 0/1)
  • Keine Multikollinearität der Prädiktoren (keine zu hohe Korrelation) = Kennzahl: Toleranz (1-R²) sollte bei .1 oder .2 liegen 
  • Größere Fallzahl/Stichprobe, d.h. ca. 10-15 Fälle pro Prädiktor
  • Alle Prädiktoren sollen im Modell enthalten sein
  • NICHT WICHTIG: Normalverteilung der Fehler/Varianzhomogenität/Skalenniveaus der Prädiktoren

Was genau ist der Unterschied zwischen einer linearen und einer logistischen Regression? Wieso kann man z.B. keine lineare anstelle einer logistischen Regression rechnen?

  • lineare Regression will einen empirischen Beobachtungswert errechnen, d.h. einen konkreten Wert vorhersagen (metrische Kriteriumsvariable) und untersucht damit den Zusammenhang zwischen Prädiktor und Kriterium 
  • bei einer linearen Regression sind Werte >1 und <0 möglich
  • logistische Regression will die Eintrittswahrscheinlichkeit eines empirischen Beobachtungswert berechnen, d.h. die Wahrscheinlichkeit vorhersagen, dass ein binäres Ergebnis (Ja/Nein) eintritt = das Ergebnis der logistischen Regression ist die Wahrscheinlichkeit, dass die binäre Kriteriumsvariable den Wert 1 annimmt  
  • bei einer logistischen Regression kann die Wahrscheinlichkeit nur Werte zwischen 0 und 1 annehmen 

Wie ermittelt man die Eintrittswahrscheinlichkeit bei einer logistischen Regression? Welche Formel muss man aufstellen?

  • Formel: zi = ß0 + ß1xi1 ..+ ui
  • z ist eine latente, nicht beobachtbare Variable, die die Ausprägung des Kriteriums in Abhängigkeit der Prädiktoren erzeugt 
  • ß0 ist die Regressionskonstante (intercept)
  • ß1 bis ßk sind Regressionsgewichte (slopes, Logit-Koeffizienten)
  • xi1 bis xik sind Ausprägungen der Prädiktorvariablen
  • Für die Person i ergibt sich, dass yi = 1 (Ereignis tritt ein), wenn z>0 und yi=0 (Ereignis tritt nicht ein), wenn z<0 oder z=0
  • s-förmiger Verlauf der Kurve, Wendepunkt bei z=0 (bzw. p=0.5)

 

Was ist der Ablauf einer logistischen Regression?

Welche Aussagen zum zweiten Schritt in einer logistischen Regression 'Schätzung der logistischen Regressionsfunktion' sind korrekt?

Wie kann man die Paramater oder Regressionskoeffizienten einer logistischen Regression interpretieren?

  • Wie verändert eine positive/negative Regressionskonstante (ß0) die Wahrscheinlichkeitsfunktion?
  • Wie verändert ein kleines/großes Regressionsgewicht (ß) die Funktion?
  • Wie verändert ein negatives Regressionsgewicht (ß) die Funktion?

  • Die Wahrscheinlichkeitsfunktion kann verschiedene Formen annehmen: 
  • Positive Regressionskonstante (Intercept) = Horizontale beeinflusst, d.h. Kurve nach links verschoben, es braucht einen kleineren Beobachtungswert x, damit das Ereignis eintritt 
  • Negative Regressionskonstante (Intercept) = Kurve nach rechts verschoben, es braucht einen größeren Beobachtungswert x, damit das Ereignis eintritt 
  • Kleines Regressionsgewicht (Slope) = Kurve wird flacher, d.h. Prädiktor hat keinen zu großen Einfluss (kleines Gewicht)
  • Großes Regressionsgewicht (Slope) = Kurve wird steiler, d.h. Prädiktor hat großen Einfluss (großes Gewicht)
  • Negatives Regressionsgewicht (Slope) = Kurve gespiegelt, d.h. Prädiktor hat negativen Einfluss
  • ABER: Koeffizienten sind nicht direkt interpretierbar, da der Zusammenhang zwischen Prädiktor und Eintrittswahrscheinlichkeit indirekt und nicht-linear ist + Koeffizienten sind untereinander NICHT vergleichbar, sondern geben nur die Richtung des Einflusses eines Prädiktors an