PHB WS18/19


Kartei Details

Karten 20
Lernende 12
Sprache Deutsch
Kategorie Psychologie
Stufe Universität
Erstellt / Aktualisiert 18.01.2019 / 25.02.2021
Weblink
https://card2brain.ch/box/20190118_multivariate_statistik_und_datenanalyse_lineare_regression
Einbinden
<iframe src="https://card2brain.ch/box/20190118_multivariate_statistik_und_datenanalyse_lineare_regression/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Welche Ziele verfolgt die einfache linieare Regression?

- Prädiktion von Merkmalsausprägungen

- Erklärung von Merkmalsunterschieden

 

Voraussetzungen für die einfache lineare Regression

- eine UV (Prädiktor) und eine metrische AV (Kriterium)

- linearer Zusammenhang zwischen UV und AV (bei nicht-linearem Zusammenhang siehe polynomische Regression)

- Normalverteilung der Residuen

- Unabhängigkeit der Residuen (gefährdet durch Klumpenstichprobe und Reihenfolgeeffekte

- Homoskedastizität (bedingte Varianz der Residuen in der Population für jede Ausprägung der UV gleich)

Wie sind die einzelnen Parameter der Regressionsgleichung definiert?

- Der Achsenabschnitt (Intercept) bo: der für x=0 vorhergesagt Y-Wert

- Die Steigung (Slope) b1: Veränderung von y, wenn x um eine Einheit zunimmt

- Das Residuum (Error) e: Differenz zwischen vorhergesagtem und beobachtetem Wert

Was ist das Kriterium der kleinsten Quadrate?

Die Regressionsgerade wird so in den Punkteschwarm gelegt, dass die Summe der quadrierten Residuen der beobachteten Kriteriumsvariable (Y) von der Regressionsgeraden ein Minimum ergibt.

Was ist der Determinationskoeffizient und wie lässt er sich bestimmen?

- standardisiertes Maß (0-1) zur Güte der Vorhersage; 1 = perfekte Vorhersage

- = Anteil der aufgeklärten / systematischen Varianz

- E = Fehlervarianz / Rest, der durch weitere Prädiktoren erklärt werden kann

- die Gesamtvarianz des Kriteriums (AV) lässt sich in die durch den Prädiktor (UV) erklärte Varianz (R²) und die Fehlervarianz (E) zerlegen

--> bei einfacher linearer Regression: multiples R²

--> ab multipler Regression: adjustiertes (korrigiertes) R²

Welche 4 Eigenschaften haben Fehlerwerte ( = Residuen) bei der einfachen linearen Regression?

Was dient der grafischen Darstellung der Regressionskurve, Lowess-Kurve und der Konfidenzintervalle mit dem Ziel einer einfacheren Interpretation?

Scatterplot

Was unterscheidet unstandardisierte von standardisierten Koeffizienten und wann werden sie verwendet?

- Form der Verteilung bleibt identisch, aber die Skalierung der x-Achse verändert sich (sodass bei z-Transformierung: M = 0 und SD = 1 werden)

- unstandardisiert: intuitive oder gut etablierte Maßeinheiten (z.B. Geld, IQ, Zeit)

- standardisiert: Vergleich von Studien mit unterschiedlichen Messinstrumenten (z.B. Metaanalysen)

Wie lautet die Interpretation vom Intercept / Achsenabschnitt / b0 in folgendem einfachen linearen Modell?

Wenn die Ausprägung der UV gleich 0 ist, so wird die Ausprägung der AV auf 136.6398 geschätzt.

Wie lauten die Interpretationen vom Slope / Anstieg / b1, APA und R²  in folgendem einfachen linearen Modell?

b1: Wenn die Ausprägung der UV um eine Einheit ansteigt, so sinkt die Ausprägung der AV um 2.7698 Einheiten.

APA: Der Prädiktor war signifikant, b = -2.77, 95% CI[-3.45,-2.09], t(148) = -8.049, p < .001. Die Nullhypothese (die Steigung ist exakt 0) wird verworfen.

R²: Das Modell, bzw. die UV erklärt 30.4% Varianz in der AV, F(1, 148) = 64.79, p < .001. Die H0 (Das Modell klärt keine Varianz auf) wird verworfen.

Im Falle einer Standardisierung wird der Slope / b1 (und auch b0 / Intercept) wie folgt interpretiert:

b0: Wenn die Ausprägung der UV durchschnittlich ist, wird die AV auf 0.000 (4.128e-17 - blödes Beispiel) Standardeinheiten geschätzt

--> Mittelwert = 0 und jeder Wert durch Standardabweichung der Variable geteilt

b1: Wenn die Ausprägung der UV  um eine Standardeinheit ansteigt, so sinkt die Ausprägung der AV  um .5518 Standardeinheiten.

Welches Regressionsgewicht verändert sich im Falle einer Zentrierung?

b0 / Intercept

Was bedeutet der Standardschätzfehler?

Standardabweichung der Residuen, sE

Welche Befehle werden in R zur Modellschätzung einer einfachen linearen Regression verwendet?

Was sind Eigenschaften des Mittelwerts?

- Summe aller Abweichungen zwischen Messwerten und Mittelwert = 0

- Summe der quadrierten Abweichungen zwischen Messwerten und Mittelwert ist minimal

- ist der Lernaufwand einer Person unbekannt, so ist der Mittelwert der Klausurpunkte ihr plausibelster Vorhersagewert

Was bedeutet die Fehlervarianz?

Varianz der Residuen (unsystematische Varianz), sE²

Wodurch zeichnet sich das Konzept der Varianzzerlegung aus?

Die Varianz der AV lässt sich in additiv in durch den Prädiktor erklärte Varianz und nicht erklärte (Fehlervarianz) zerlegen.

Wo finde ich welche Parameter und Kennwerte im R- Output?

Wie interpretiert man im Falle einer Zentrierung folgenden Output (b0, b1)?

b0: Wenn die AUsprägung der UV durchschnittlich ist, wird die AV auf .048 geschätzt.

--> da Mittelwert = 0

b1: Wenn die Ausprägung der UV um eine Einheit steigt, steigt die AV um .806.

Was passiert, wenn beide Variablen zentriert bzw. standardisiert werden?

Die Regressionsgerade verläuft durch den Nullpunkt