M2_Statistik II

B. Sc. Psychologie Fernuniversität Hagen

0.0 (0)

Kartei Details

Karten	20
Lernende	18
Sprache	Deutsch
Kategorie	Psychologie
Stufe	Universität
Erstellt / Aktualisiert	20.01.2014 / 16.10.2019
Weblink	https://card2brain.ch/box/m2statistik_ii
Einbinden	<iframe src="https://card2brain.ch/box/m2statistik_ii/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Kartenliste

Sonderfälle zu R^2:

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Wenn SQ_Residual=0, dann R²= SQ_Regression / SQ_{Total = 1}

_{--> Alle Punkte liegen auf der Regressionsgeraden = perfekte Anpassung}

Wenn R²=0 (Null-Anpassung) (bei SQ_Regression = 0 bzw. SQ_{Residual =}SQ_Total--> Die Regressionsgerade verläuft parallel zur x-Achse, somit zu jedem x-Wert derselbe y-Wert --> X hat überhaupt keinen Einfluss auf Y

Was wird mit R² ausgedrückt?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Die Güte der Anpassung der Regression and die Daten. Je größer R², desto stärker ist eine lineare Beziehung zw. X und Y ausgeprägt.

Wann verwendet man die zentrierte Regression (Zentrierungstransformation)?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Wenn man am Vergleich von relativen Entwicklungen (bezogen auf die Mittelwerte) und nicht an den Originaldaten interessiert ist.

x-schlange= -arithmetisches Mittel von X+X y-schlange=-arithmetisches Mittel von Y+Y

Regressionsgerade läuft durch Ursprung

--> Multikollinearität wird dadurch vermieden!

Dummy - Effektkodierung:

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Dummy: die Parameter sind als durchschnittliche Abweichung der Referenzkategorie zu verstehen

Effekt: die Parameter sind als Abweichung zum Gesamtmittelwert y-Strich zu verstehen

Bei z-Transformation:

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

werden die Variablen vom Maßstab unabhängig gemacht. Daraus ergibt sich:

x-mittel (x-strich) = 0, s²_x=1

_{y-mittel (y-strich) = 0, s²}_y=1

Regressionsgerade läuft durch den ursprung

(wenn in versch. Grundgesamtheiten gemessen, oder mit verschiedenen Messinstrumenten und man das aber vergleichen will)

Welche Punkte liegen immer auf der Regressionsgeraden?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

die Mittelwerte! (x-Strich und y-Strich)

Prädiktorselektionsstrategien:

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Ziel: mit möglichst wenigen Prädiktorvariabeln ein gute Vorhersage der AV zu erzielen

Rückwärtsverfahren: nach und nach werden Prädiktoren entfernt, solange es nicht zu einem signifikanten Wert von F-Change (R² überprüfen) führt. Am Ende stehen nur die notwendigen Prädiktoren im Modell.
Vorwärtsverfahren: nach und nach werden Prädiktoren aufgenommen und geprüft, welcher eine max. Veränderung von F-Change führt. Endet, wenn alle Prädiktoren aufgenommen sind, oder wenn keiner der noch nicht im Modell befindlichen Prädiktoren eine signifikante Steigerung von F-Change bewirkt.
Schrittweise Verfahren: Kombination von Vorwärts und Rückwärts

Problem der Multikollinearität:

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Korrelation: stellen bivariate Zusammenhänge dar

multiple Regression: Zusammenhang zw. einer AV und einer (2-oder mehrdimensionalen) Prädiktormatrix

Wenn lineare Beziehung sehr hoch (also wenn ein Prädiktor nahezu perfekt aus einem anderen vorhergesagt werden kann), dann ist die numerische Lösung bei der Schätzung der Koeffizienten nicht möglich. (Liefern kaum Beitrag)

Wenn nicht so stark, aber doch deutliche lineare Abhängigkeit, ist Gleichungssystem zwar lösbar, Schätzung der einzelnen Koeffizienten jedoch evtl. sehr ungenau, da die Varianzen groß sind.

wichtige Prüfgröße: Variance Inflation Factor (VIF)

VIF_j= 1 / 1-R_j²

Werte größer als 10: Hinweis auf ernsthafte Probleme mit Multikollinearität.

Werte zentrieren um Multikollinearität zu vermeiden

Moderator vs. Mediator:

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Moderator:

wenn die Stärke der Wirkung von X1 auf Y von der Ausprägung von X2 abhängt. z.B. wenn das Modell Y=ß₀X₀+ ß₁X₁ + ß₂X₂ + e in verschiedenen Teilstrichproben unterschiedliche Ergebnisse aufweist. 3 Schritte:

Prädiktor
dann zusätzlich Moderator
und noch ein Produktterm aus dem Prädiktro und Moderator

x1 und x2 müssen zentriert werden, um starke Multikolinearität zu vermeiden.

Mediator:

Wenn der Zusammenhang zw. einer UV X1 und einer Response Y durch eine Variable X2 erklärt wird. Es muss untersucht werden:

(a)Regression des Mediators X2 auf den Prädiktor X1
(b)Regression des Response Y auf den Prädiktor X1
(c)Regression des Response Y auf den Prädiktor X1 und den Mediator X2

Mediation, wenn (c) < (b)

Was ist der Unterschied zw. deskriptiver und induktiver Regression?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Deskriptive Regression beschreibt Zusammenhänge in Stichproben.

Bei der induktiven Regression wird von Zusammenhängen in einer Stichprobe auf die Zusammenhänge in der Population geschlossen. Es wird bewertet, ob die Zusammenhänge in der Stichprobe noch durch Zufall entstanden sein können oder ob sie auf Zusammenhänge in der Population hinweisen.

Varianzanalyse:

einfaktorielle Varianzanalyse: prüft, ob eine UV X mit s Stufen Einfluss auf eine AV y hat.

Grundidee der Varianzanalyse: Größe der Mittelwertsunterschiede zw. den Zellen in Relation zu setzen zur Variation innerhalb der Zellen.

t-Test: Mittelwerte zweier Gruppen werden verglichen

Als Varianzanlayse üblicherweise erst bezeichnet, wenn es sich um den Verglich von mind. drei Gruppen oder Bedingungen handelt.

Zwei Problemstellungen in der Statistik (Varainzanalyse):

Modell I ( mit festen Effekten):

Vergleich mehrerer Mittelwerte in fest gewählten Stufen eines Faktors
Man prüft H₀=müh1=müh2=...=mühS gegen H₁: mind. zwei Mittelwerte sind verschieden
zugehöriger F-Test (=Verallgemeinerung des t-Tests) dient dem Vergleich zweier Normalverteilungen -> Vergleich der Wirkungen von Behandlungen

Modell II (mit zufälligen Effekten):

dient der Zerlegung der erzeugten Gesamtvariabiltität (Varianz) in Komponenten, die den Einfluss jedes Faktors widerspiegeln
Stufen der Faktoren zufällig ausgewählt (Zufallsstichprobe)
kein Interesse an den Behandlungen selbst, sondern nur am Anteil der Gesamtvariabilität

Was ist die Varianzhomogenität oder Homoskedastizität?

Die Varianzen sind unbekannt, aber in allen Grundgesamtheiten gleich.

Was ist das Ziel des Kruskal-Wallis-Test? (Rangvarianzanalyse)

mehrere Stichproben zu vergrleichen, ob sich mind. zwei von ihnen in der Größe ihrer Messwerte signifikant unterscheiden.

Symmetrie bezüglich des Erwartungswertes: (und des Nullpunkts!)

bei normalverteilten und t-verteilten Zufallsvariablen

nicht bei x² -verteilten Zufallsvariablen!

Was misst SQ_total?

Die totale Variabilität der y-Messreihe bezogen auf das arithmetische Mittel y-strich.

Richtig oder Falsch?

Wenn man die Zufallsvariable X gemäß Y = X-1 transformiert, so ist die Varianz der transformierten Variablen Y identisch mit der der ursprünglichen Variablen X.

Die Richtigkeit der Aussage erschließt sich aus (11.12) aus Kurs 33209 – man setze dort speziell a = -1:

11.12 (S. 12 FS): V(aX+b)=a²*V(X)

Was ist die Varianz?

Die Streuung um den Mittelwert

Was ist das Quotenauswahlverfahren?

Das Quotenauswahlverfahren ist ein nicht-zufallsgesteuertes Verfahren zur Gewinnung einer Stichprobe, das z. B. bei Befragungen in der Markt- und Meinungsforschung Anwendung findet.

Erwartungswert der t-Verteilung und der Standardnormalverteilung:

immer 0

1 / 20

Kartenliste

Lernen

M2_Statistik II

Lernkarteien erstellen oder kopieren

Lernkarteien erstellen oder kopieren

Melde dich an, um alle Karten zu sehen.

SWITCHaai

Office 365

Edulog

Apple ID

Google