MR
MR
MR
Kartei Details
Karten | 21 |
---|---|
Sprache | Français |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 30.05.2020 / 10.02.2021 |
Weblink |
https://card2brain.ch/box/20200530_mr
|
Einbinden |
<iframe src="https://card2brain.ch/box/20200530_mr/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Lernkarteien erstellen oder kopieren
Mit einem Upgrade kannst du unlimitiert Lernkarteien erstellen oder kopieren und viele Zusatzfunktionen mehr nutzen.
Melde dich an, um alle Karten zu sehen.
Was ist Homoskedastizität?
bedeutet, dass sich die bedingten Residualvarianzen von Y in der Population alle identisch verteilt sind, d.h. dass die Varianz der Residuen (em) bei allen vorhergesagten Ŷ-Werten identisch ist.
Was ist Heteroskedastizität?
Gegenteil von Homoskedastizität: Heteroskedastizität.
--> Heteroskedastizität führt nicht zu einer Verzerrung der Punktschätzer der Regressionskoeffizienten, jedoch zu einer Verzerrung der Standardfehler (und damit zu einer Verzerrung des Alpha-Fehlers bei der inferenzstatistischen Absicherung).
Wie diagnostiziert man Homo- bzw. Heteroskedastizität?
mittels Residuenplot (Residuen gegen vorhergesagte Werte)
Welche Folge hat Messfehlerbehaftetheit seines Prädiktors
a) in der bivaritaten Regressionsanalyse?
b) in der multiplen Regressionsanalyse?
a) Unterschätzung des "wahren" Regressionsgewicht
b) Unter- oder Überschätzung des "wahren" Regressionsgewichts
Welche 5 Voraussetzungen gibt es für die lineare Regresseion?
Wie sollte verfahren werden, wenn die Variablen stark messfhelerbehaftet sind?
Man sollte aus lineare Strukturgleichungsmodelle ausweichen, da diese Messfehler mitberücksichtigen
a) Was genau bedeutet, dass Residuen voneinander stochastisch unabhängig sein müssen?
b) Wann ist die Gefahr der Abhängigkeit der Residuen besonders groß? (2 Beispiele)
c) Welche Folge hat die Verletzung der Unabhängigkeitsannahme? (Werden SEs über- oder unterschätzt? werden Tests zu schnell oder zu "langsam" signifikant?)
d) Was kann man machen / auf welche Verfahren kann man ausweichen, wenn die Residuen nicht unabhängig sind?
a) bedeutet, dass die Residuen stochastisch voneinander unabhängig sind: Das Residuum einer beliebigen Person kann nicht aufgrund des Residuums einer beliebigen anderen Person vorhergesagt werden.
b) ist verletzt bei abhängigen Daten (z.B. Mehrfachmessungen, Paarlingen etc.) und bei hierarchischen Datenstrukturen (z.B. Schüler(innen) in Klassen; Patient(inn)en in Therapiegruppen etc.)
c) Verletzungen der Unabhängigkeitsannahme haben zur Folge, dass die Standardfehler einer Parameterschätzung unterschätzt und die entsprechenden Tests zu liberal („zu schnell signifikant“) werden.
d) Lösung: Hierarchische lineare Modelle
Normalverteilung der Residuen:
a) Was bedeutet es genau?
b) Wie diagnostiziert man, ob Normalverteilung vorliegt oder nicht?
c) Was passiert, wenn die Annahme der Normalverteilung der Residuen verletzt ist? (Punktschätzer verzerrt oder unverzerrt? Standardfehler der Parameterschätzung verzerrt oder unverzerrt?
d) Worauf können nicht-normalverteilte Residuen hinweisen?
e) Was kann man machen, wenn die Residuen nicht normalverteilt sind?
a) bedeutet, dass die bedingten und auch die unbedingten Residuen in der Population einer Normalverteilung folgen sollten.
b) Diagnostik: die Annahme kann mit Hilfe von grafischen Tests (Histogramm; P-P-Plot; Q-Q-Plot) überprüft werden.
c) Ist die Annahme verletzt, erhält man dennoch unverzerrte Punktschätzer der Regressionskoeffizienten.
Verletzungen der Normalverteilungsannahme wirken sich zudem bei hinreichend großen Stichproben nicht gravierend auf die Standardfehler und somit auf die Ergebnisse inferenzstatistischer Tests aus. Bei kleinen Stichproben aber schon.
d) Nicht-normalverteilte Residuen können aber auch ein Hinweis auf fehlspezifizierte Modelle sein.
e) Möglichkeit: Transformation der Variablen (z.B. Logarithmus-Transformation).
Wie diagnostiziert man, ob Linearität angenommen werden kann, oder nicht? (LOWESS-Verfahren)?
LOWESS-Verfahren (LOcally WEighted Scatterplot Smoother)
- Für eine konkrete Merkmalsausprägung xm wählt man einen Teil der Messwerte (z.B. 10% aller Werte) aus, die um diesen Wert herum liegen.
- Für diese Werte fittet man eine lineare Regression und ordnet dem Wert xm einen vorhergesagten Wert ŷm zu
- Dies wiederholt man nun für alle anderen Werte.
- Die resultierende Funktion wird dann geglättet und kann inspiziert werden (z.B. darauf hin, ob sie mehr oder weniger linear ist).
Wie diagnostiziert man Ausreißer auf der Prädiktorseite? Wie heißt die Distanz?
Ausreißer und einflussreiche Datenpunkte:
--> Gemeint sind einzelne Fälle, die die Schätzung der Regressionskoeffizienten stark beeinflussen. Das sind typischerweise Fälle, deren Werte xm weit von ihrem Mittelwert abweichen.
--> Identifiziert werden können sie mit Hilfe der Mahalanobis-Distanz:
--> Auf der Basis dieser Distanz kann jeder Person ein „Hebelwert“ (leverage) zugeordnet werden (--> nur das muss man wissen) Hebelwerte über 3 mal k / n gelten als „auffällig“. bei großen Stichproben kann man auch 2 mal k / n nehmen
Wie diagnostiziert man Ausreißer auf der abhängigen Variablen?
Ausreißer auf der abhängigen Variablen: Ausreißer auf der AV (Kriterium) können identifiziert werden, indem man die Residuen (ym – ŷm) inspiziert:
- Unstandardisierte Residuen
- Standardisierte Residuen (standardisiert an der geschätzten Populationsstandardabweichung der Residuen; dem Standardschätzfehler der Regression)
- Studentisierte Residuen (standardisiert am Standardschätzfehler, aber unter Berücksichtigung des Hebelwertes einer Person)
- Gelöschtes Residuen (der vorhergesagte Wert für eine Person wird ohne diese Person im Datensatz berechnet)
- Studentisierte ausgeschlossene Residuen (s.o.; folgt einer t-Verteilung mit df = n – k – 1 Freiheitsgraden; Werte > +/-3 gelten als „auffällig“)
Was ist der Standardschätzfehler?
Standardisierte Residuen (standardisiert an der geschätzten Populationsstandardabweichung der Residuen; dem Standardschätzfehler der Regression)
Was sind studentisierte Residuen?
Studentisierte Residuen (standardisiert am Standardschätzfehler, aber unter Berücksichtigung des Hebelwertes einer Person)
sollte man verwenden für Ausreißer auf der Kriteriumsseite
Was sind gelöschte Residuen?
der vorhergesagte Wert für eine Person wird ohne diese Person im Datensatz berechnet
Was sind „DifBeta“ (für unstandardisierte Variablen) bzw. „DifBetaS“ (für standardisierte Variablen)? (bezieht sich auf Prädiktor)
steht für difference in beta --> Unterschied im geschätzten Regressionskoeffizienten
Ausmaß, in dem sich die Schätzung der Regressionskoeffizienten durch Ausschluss von einzelnen Fällen verändert: kann für jede Person auf jeder Prädiktorvariablen berechnet werden. Werte mit DifBetaS > +/-2 gelten als auffällig
Was sind „DifFit“ (für unstandardisierte Variablen) bzw. „DifFitS“ (für standardisierte Variablen)? --> Hier betrachtet man den Determinationskoeffizienten
Ausmaß, in dem sich die vorhergesagten Werte durch Ausschluss von einzelnen Fällen verändern
kann für jede Person berechnet werden. Werte mit DifFitS > +/- 1 sind auffällig.
Cooks Distanz (approximativ F-verteilt mit df1 = k + 1 und df2 = n − k − 1; kritische Schwelle: 0,50-Quantil)
Wie ist die Cook's Distanz verteilt?
F-verteilt, bezieht sich auf das 50% Quantil
Was sagen
a) DifBeta
b) DifFit
voraus?
a) Ausmaß, in dem sich die Schätzung der Regressionskoeffizienten durch Ausschluss von einzelnen Fällen verändert
b) Ausmaß, in dem sich die vorhergesagten Werte durch Ausschluss von einzelnen Fällen verändern
Welche Werte sollten nicht über-/unterschritten werden:
a) für DifBetaS?
b) für DifFitS?
a) DifBetaS > +/- 2
b) DifFitS > +/- 1
Wie funktioniert die Effektkodierung?
Was bildet der Intercept bei der Effektkodierung ab?
Was bildet das Regressionsgewicht von E1/E2 ab ? (Bei drei Gruppen: Experimentalgruppe EG1, EG2 und KG)
Beispiel – polytomer kategorialer Prädiktor
--> Experimentelles Design: EG1, EG2, KG
--> c = 3; 3 − 1 = 2 Kodiervariablen erforderlich
Prinzip der Effekt-Kodierung:
(1) Wähle eine der c Kategorien des Prädiktors als Basiskategorie aus. Beispiel: KG
(2) Bilde die erste Kodiervariable E1, Personen, die in der „EG1“ sind, erhalten in dieser Variablen eine "1", Mitglieder der "Basiskategorie" eine "-1", alle anderen eine „0“
(3)Bilde die zweite Kodiervariable E2, Personen, die in der „EG2“ sind, erhalten in dieser Variablen eine „1“, Mitglieder der "Basiskat." eine "-1", alle anderen eine „0“.
Hinweis: Eine Kodiervariable für die „Basiskategorie“ wird nicht benötigt, da die Zugehörigkeit zu dieser Kategorie aus einer „-1“ in beiden Kodiervariablen folgt
(4) Die beiden Kodiervariablen werden als Prädiktoren in die multiple Regression aufgenommen
(5) Der Intercept bildet den Gesamtmittelwert ab, das Regressionsgewicht von E1 bildet die Differenz zw. „EG1" und dem Gesamtmittelwert aller Kategorien ab, das Regressionsgewicht von E2 bildet die Differenz zw. „EG2" und dem Gesamtmittelwert aller Kategorien ab.
Wie funktioniert die Dummy-Kodierung?
Was bilden Intercept und die einzelnen Regressionsgewichte ab?
Beispiel – polytomer kategorialer Prädiktor
--> Experimentelles Design: EG1, EG2, KG
--> c = 3; 3 − 1 = 2 Kodiervariablen erforderlich
Prinzip der Dummy-Kodierung:
(1) Wähle eine der c Kategorien des Prädiktors als Referenzkategorie aus. Beispiel: KG
(2) Bilde die erste Kodiervariable D1, Personen, die in der „EG1“ sind, erhalten in dieser Variablen eine „1“, alle anderen eine „0“
(3) Bilde die zweite Kodiervariable D2, Personen, die in der „EG2“ sind, erhalten in dieser Variablen eine „1“, alle anderen eine "0"
Hinweis: Eine Kodiervariable für die Referenzkategorie wird nicht benötigt, da die Zugehörigkeit zu dieser Kategorie aus einer „0“ in beiden Kodiervariablen folgt
(4) Die beiden Kodiervariablen werden als Prädiktoren in die multiple Regression aufgenommen
(5) Der Intercept bildet den Mittelwert der Referenzkategorie „KG“ ab, das Regressionsgewicht von D1 bildet die Differenz zw. „EG1“ und der Referenzkategorie „KG“ ab, das Regressionsgewicht von D2 bildet die Differenz zw. „EG2“ und der Referenzkategorie „KG“ ab.
-
- 1 / 21
-