M2_Statistik II
B. Sc. Psychologie Fernuniversität Hagen
B. Sc. Psychologie Fernuniversität Hagen
Set of flashcards Details
Flashcards | 20 |
---|---|
Students | 18 |
Language | Deutsch |
Category | Psychology |
Level | University |
Created / Updated | 20.01.2014 / 16.10.2019 |
Weblink |
https://card2brain.ch/box/m2statistik_ii
|
Embed |
<iframe src="https://card2brain.ch/box/m2statistik_ii/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Create or copy sets of flashcards
With an upgrade you can create or copy an unlimited number of sets and use many more additional features.
Log in to see all the cards.
Sonderfälle zu R2:
Wenn SQResidual=0, dann R2= SQRegression / SQTotal = 1
--> Alle Punkte liegen auf der Regressionsgeraden = perfekte Anpassung
Wenn R2=0 (Null-Anpassung) (bei SQRegression = 0 bzw. SQResidual = SQTotal --> Die Regressionsgerade verläuft parallel zur x-Achse, somit zu jedem x-Wert derselbe y-Wert --> X hat überhaupt keinen Einfluss auf Y
Was wird mit R2 ausgedrückt?
Die Güte der Anpassung der Regression and die Daten. Je größer R2, desto stärker ist eine lineare Beziehung zw. X und Y ausgeprägt.
Wann verwendet man die zentrierte Regression (Zentrierungstransformation)?
Wenn man am Vergleich von relativen Entwicklungen (bezogen auf die Mittelwerte) und nicht an den Originaldaten interessiert ist.
x-schlange= -arithmetisches Mittel von X+X y-schlange=-arithmetisches Mittel von Y+Y
Regressionsgerade läuft durch Ursprung
--> Multikollinearität wird dadurch vermieden!
Dummy - Effektkodierung:
Dummy: die Parameter sind als durchschnittliche Abweichung der Referenzkategorie zu verstehen
Effekt: die Parameter sind als Abweichung zum Gesamtmittelwert y-Strich zu verstehen
Bei z-Transformation:
werden die Variablen vom Maßstab unabhängig gemacht. Daraus ergibt sich:
x-mittel (x-strich) = 0, s2x=1
y-mittel (y-strich) = 0, s2y=1
Regressionsgerade läuft durch den ursprung
(wenn in versch. Grundgesamtheiten gemessen, oder mit verschiedenen Messinstrumenten und man das aber vergleichen will)
Welche Punkte liegen immer auf der Regressionsgeraden?
die Mittelwerte! (x-Strich und y-Strich)
Prädiktorselektionsstrategien:
Ziel: mit möglichst wenigen Prädiktorvariabeln ein gute Vorhersage der AV zu erzielen
- Rückwärtsverfahren: nach und nach werden Prädiktoren entfernt, solange es nicht zu einem signifikanten Wert von F-Change (R2 überprüfen) führt. Am Ende stehen nur die notwendigen Prädiktoren im Modell.
- Vorwärtsverfahren: nach und nach werden Prädiktoren aufgenommen und geprüft, welcher eine max. Veränderung von F-Change führt. Endet, wenn alle Prädiktoren aufgenommen sind, oder wenn keiner der noch nicht im Modell befindlichen Prädiktoren eine signifikante Steigerung von F-Change bewirkt.
- Schrittweise Verfahren: Kombination von Vorwärts und Rückwärts
Problem der Multikollinearität:
Korrelation: stellen bivariate Zusammenhänge dar
multiple Regression: Zusammenhang zw. einer AV und einer (2-oder mehrdimensionalen) Prädiktormatrix
Wenn lineare Beziehung sehr hoch (also wenn ein Prädiktor nahezu perfekt aus einem anderen vorhergesagt werden kann), dann ist die numerische Lösung bei der Schätzung der Koeffizienten nicht möglich. (Liefern kaum Beitrag)
Wenn nicht so stark, aber doch deutliche lineare Abhängigkeit, ist Gleichungssystem zwar lösbar, Schätzung der einzelnen Koeffizienten jedoch evtl. sehr ungenau, da die Varianzen groß sind.
wichtige Prüfgröße: Variance Inflation Factor (VIF)
VIFj= 1 / 1-Rj2
Werte größer als 10: Hinweis auf ernsthafte Probleme mit Multikollinearität.
Werte zentrieren um Multikollinearität zu vermeiden
Moderator vs. Mediator:
Moderator:
wenn die Stärke der Wirkung von X1 auf Y von der Ausprägung von X2 abhängt. z.B. wenn das Modell Y=ß0X0 + ß1X1 + ß2X2 + e in verschiedenen Teilstrichproben unterschiedliche Ergebnisse aufweist. 3 Schritte:
- Prädiktor
- dann zusätzlich Moderator
- und noch ein Produktterm aus dem Prädiktro und Moderator
x1 und x2 müssen zentriert werden, um starke Multikolinearität zu vermeiden.
Mediator:
Wenn der Zusammenhang zw. einer UV X1 und einer Response Y durch eine Variable X2 erklärt wird. Es muss untersucht werden:
- (a)Regression des Mediators X2 auf den Prädiktor X1
- (b)Regression des Response Y auf den Prädiktor X1
- (c)Regression des Response Y auf den Prädiktor X1 und den Mediator X2
Mediation, wenn (c) < (b)
Was ist der Unterschied zw. deskriptiver und induktiver Regression?
Deskriptive Regression beschreibt Zusammenhänge in Stichproben.
Bei der induktiven Regression wird von Zusammenhängen in einer Stichprobe auf die Zusammenhänge in der Population geschlossen. Es wird bewertet, ob die Zusammenhänge in der Stichprobe noch durch Zufall entstanden sein können oder ob sie auf Zusammenhänge in der Population hinweisen.
Varianzanalyse:
einfaktorielle Varianzanalyse: prüft, ob eine UV X mit s Stufen Einfluss auf eine AV y hat.
Grundidee der Varianzanalyse: Größe der Mittelwertsunterschiede zw. den Zellen in Relation zu setzen zur Variation innerhalb der Zellen.
- t-Test: Mittelwerte zweier Gruppen werden verglichen
Als Varianzanlayse üblicherweise erst bezeichnet, wenn es sich um den Verglich von mind. drei Gruppen oder Bedingungen handelt.
Zwei Problemstellungen in der Statistik (Varainzanalyse):
Modell I ( mit festen Effekten):
- Vergleich mehrerer Mittelwerte in fest gewählten Stufen eines Faktors
- Man prüft H0=müh1=müh2=...=mühS gegen H1: mind. zwei Mittelwerte sind verschieden
- zugehöriger F-Test (=Verallgemeinerung des t-Tests) dient dem Vergleich zweier Normalverteilungen -> Vergleich der Wirkungen von Behandlungen
Modell II (mit zufälligen Effekten):
- dient der Zerlegung der erzeugten Gesamtvariabiltität (Varianz) in Komponenten, die den Einfluss jedes Faktors widerspiegeln
- Stufen der Faktoren zufällig ausgewählt (Zufallsstichprobe)
- kein Interesse an den Behandlungen selbst, sondern nur am Anteil der Gesamtvariabilität
Was ist die Varianzhomogenität oder Homoskedastizität?
Die Varianzen sind unbekannt, aber in allen Grundgesamtheiten gleich.
Was ist das Ziel des Kruskal-Wallis-Test? (Rangvarianzanalyse)
mehrere Stichproben zu vergrleichen, ob sich mind. zwei von ihnen in der Größe ihrer Messwerte signifikant unterscheiden.
Symmetrie bezüglich des Erwartungswertes: (und des Nullpunkts!)
bei normalverteilten und t-verteilten Zufallsvariablen
nicht bei x2 -verteilten Zufallsvariablen!
Was misst SQtotal?
Die totale Variabilität der y-Messreihe bezogen auf das arithmetische Mittel y-strich.
Richtig oder Falsch?
Wenn man die Zufallsvariable X gemäß Y = X-1 transformiert, so ist die Varianz der transformierten Variablen Y identisch mit der der ursprünglichen Variablen X.
Die Richtigkeit der Aussage erschließt sich aus (11.12) aus Kurs 33209 – man setze dort speziell a = -1:
11.12 (S. 12 FS): V(aX+b)=a2*V(X)
Was ist die Varianz?
Die Streuung um den Mittelwert
Was ist das Quotenauswahlverfahren?
Das Quotenauswahlverfahren ist ein nicht-zufallsgesteuertes Verfahren zur Gewinnung einer Stichprobe, das z. B. bei Befragungen in der Markt- und Meinungsforschung Anwendung findet.
Erwartungswert der t-Verteilung und der Standardnormalverteilung:
immer 0
-
- 1 / 20
-