M2_Statistik II

B. Sc. Psychologie Fernuniversität Hagen

B. Sc. Psychologie Fernuniversität Hagen


Fichier Détails

Cartes-fiches 20
Utilisateurs 18
Langue Deutsch
Catégorie Psychologie
Niveau Université
Crée / Actualisé 20.01.2014 / 16.10.2019
Lien de web
https://card2brain.ch/box/m2statistik_ii
Intégrer
<iframe src="https://card2brain.ch/box/m2statistik_ii/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Sonderfälle zu R2:

Wenn SQResidual=0, dann R2= SQRegression / SQTotal = 1

--> Alle Punkte liegen auf der Regressionsgeraden = perfekte Anpassung

 

Wenn R2=0 (Null-Anpassung) (bei SQRegression = 0 bzw. SQResidual = SQTotal --> Die Regressionsgerade verläuft parallel zur x-Achse, somit zu jedem x-Wert derselbe y-Wert --> X hat überhaupt keinen Einfluss auf Y

Was wird mit R2 ausgedrückt?

Die Güte der Anpassung der Regression and die Daten. Je größer R2, desto stärker ist eine lineare Beziehung zw. X und Y ausgeprägt.

Wann verwendet man die zentrierte Regression (Zentrierungstransformation)?

Wenn man am Vergleich von relativen Entwicklungen (bezogen auf die Mittelwerte) und nicht an den Originaldaten interessiert ist.

x-schlange= -arithmetisches Mittel von X+X y-schlange=-arithmetisches Mittel von Y+Y  

Regressionsgerade läuft durch Ursprung

--> Multikollinearität wird dadurch vermieden!

Dummy - Effektkodierung:

Dummy: die Parameter sind als durchschnittliche Abweichung der Referenzkategorie zu verstehen

Effekt: die Parameter sind als Abweichung zum Gesamtmittelwert y-Strich zu verstehen

Bei z-Transformation:

werden die Variablen vom Maßstab unabhängig gemacht. Daraus ergibt sich:

x-mittel (x-strich) = 0, s2x=1

y-mittel (y-strich) = 0, s2y=1

Regressionsgerade läuft durch den ursprung

(wenn in versch. Grundgesamtheiten gemessen, oder mit verschiedenen Messinstrumenten und man das aber vergleichen will)

Welche Punkte liegen immer auf der Regressionsgeraden?

die Mittelwerte! (x-Strich und y-Strich)

Prädiktorselektionsstrategien:

Ziel: mit möglichst wenigen Prädiktorvariabeln ein gute Vorhersage der AV zu erzielen

  • Rückwärtsverfahren: nach und nach werden Prädiktoren entfernt, solange es nicht zu einem signifikanten Wert von F-Change (R2 überprüfen) führt. Am Ende stehen nur die notwendigen Prädiktoren im Modell.
  • Vorwärtsverfahren: nach und nach werden Prädiktoren aufgenommen und geprüft, welcher eine max. Veränderung von F-Change führt. Endet, wenn alle Prädiktoren aufgenommen sind, oder wenn keiner der noch nicht im Modell befindlichen Prädiktoren eine signifikante Steigerung von F-Change bewirkt.
  • Schrittweise Verfahren: Kombination von Vorwärts und Rückwärts

Problem der Multikollinearität:

Korrelation: stellen bivariate Zusammenhänge dar

multiple Regression: Zusammenhang zw. einer AV und einer (2-oder mehrdimensionalen) Prädiktormatrix

Wenn lineare Beziehung sehr hoch (also wenn ein Prädiktor nahezu perfekt aus einem anderen vorhergesagt werden kann), dann ist die numerische Lösung bei der Schätzung der Koeffizienten nicht möglich. (Liefern kaum Beitrag)

Wenn nicht so stark, aber doch deutliche lineare Abhängigkeit, ist Gleichungssystem zwar lösbar, Schätzung der einzelnen Koeffizienten jedoch evtl. sehr ungenau, da die Varianzen groß sind.

wichtige Prüfgröße: Variance Inflation Factor (VIF)

VIFj= 1 / 1-Rj2

Werte größer als 10: Hinweis auf ernsthafte Probleme mit Multikollinearität.

Werte zentrieren um Multikollinearität zu vermeiden

Moderator vs. Mediator:

Moderator:

wenn die Stärke der Wirkung von X1 auf Y von der Ausprägung von X2 abhängt. z.B. wenn das Modell Y=ß0X0 + ß1X1 + ß2X2 + e in verschiedenen Teilstrichproben unterschiedliche Ergebnisse aufweist. 3 Schritte:

  1. Prädiktor
  2. dann zusätzlich Moderator
  3. und noch ein Produktterm aus dem Prädiktro und Moderator

x1 und x2 müssen zentriert werden, um starke Multikolinearität zu vermeiden.

Mediator:

Wenn der Zusammenhang zw. einer UV X1 und einer Response Y durch eine Variable X2 erklärt wird. Es muss untersucht werden:

  • (a)Regression des Mediators X2 auf den Prädiktor X1
  • (b)Regression des Response Y auf den Prädiktor X1
  • (c)Regression des Response Y auf den Prädiktor X1 und den Mediator X2

Mediation, wenn (c) < (b)

Was ist der Unterschied zw. deskriptiver und induktiver Regression?

Deskriptive Regression beschreibt Zusammenhänge in Stichproben.


Bei der induktiven Regression wird von Zusammenhängen in einer Stichprobe auf die Zusammenhänge in der Population geschlossen. Es wird bewertet, ob die Zusammenhänge in der Stichprobe noch durch Zufall entstanden sein können oder ob sie auf Zusammenhänge in der Population hinweisen.

Varianzanalyse:

einfaktorielle Varianzanalyse: prüft, ob eine UV X mit s Stufen Einfluss auf eine AV y hat.

Grundidee der Varianzanalyse: Größe der Mittelwertsunterschiede zw. den Zellen in Relation zu setzen zur Variation innerhalb der Zellen.

  • t-Test: Mittelwerte zweier Gruppen werden verglichen

Als Varianzanlayse üblicherweise erst bezeichnet, wenn es sich um den Verglich von mind. drei Gruppen oder Bedingungen handelt.

Zwei Problemstellungen in der Statistik (Varainzanalyse):

Modell I ( mit festen Effekten):

  • Vergleich mehrerer Mittelwerte in fest gewählten Stufen eines Faktors
  • Man prüft H0=müh1=müh2=...=mühS gegen H1: mind. zwei Mittelwerte sind verschieden
  • zugehöriger F-Test (=Verallgemeinerung des t-Tests) dient dem Vergleich zweier Normalverteilungen -> Vergleich der Wirkungen von Behandlungen

Modell II (mit zufälligen Effekten):

  • dient der Zerlegung der erzeugten Gesamtvariabiltität (Varianz) in Komponenten, die den Einfluss jedes Faktors widerspiegeln
  • Stufen der Faktoren zufällig ausgewählt (Zufallsstichprobe)
  • kein Interesse an den Behandlungen selbst, sondern nur am Anteil der Gesamtvariabilität

Was ist die Varianzhomogenität oder Homoskedastizität?

Die Varianzen sind unbekannt, aber in allen Grundgesamtheiten gleich.

Was ist das Ziel des Kruskal-Wallis-Test? (Rangvarianzanalyse)

mehrere Stichproben zu vergrleichen, ob sich mind. zwei von ihnen in der Größe ihrer Messwerte signifikant unterscheiden.

Symmetrie bezüglich des Erwartungswertes: (und des Nullpunkts!)

bei normalverteilten und t-verteilten Zufallsvariablen

nicht bei x2 -verteilten Zufallsvariablen!

Was misst SQtotal?

Die totale Variabilität der y-Messreihe bezogen auf das arithmetische Mittel y-strich.

Richtig oder Falsch?

Wenn man die Zufallsvariable X gemäß Y = X-1 transformiert, so ist die Varianz der transformierten Variablen Y identisch mit der der ursprünglichen Variablen X.

Die Richtigkeit der Aussage erschließt sich aus (11.12) aus Kurs 33209 – man setze dort speziell a = -1:

11.12 (S. 12 FS): V(aX+b)=a2*V(X)

Was ist die Varianz?

Die Streuung um den Mittelwert

Was ist das Quotenauswahlverfahren?

Das Quotenauswahlverfahren ist ein nicht-zufallsgesteuertes Verfahren zur Gewinnung einer Stichprobe, das z. B. bei Befragungen in der Markt- und Meinungsforschung Anwendung findet.
 

Erwartungswert der t-Verteilung und der Standardnormalverteilung:

immer 0