statistik
testtt
testtt
Kartei Details
Karten | 17 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Grundschule |
Erstellt / Aktualisiert | 12.01.2020 / 17.01.2020 |
Weblink |
https://card2brain.ch/box/20200112_statistik
|
Einbinden |
<iframe src="https://card2brain.ch/box/20200112_statistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Lernkarteien erstellen oder kopieren
Mit einem Upgrade kannst du unlimitiert Lernkarteien erstellen oder kopieren und viele Zusatzfunktionen mehr nutzen.
Melde dich an, um alle Karten zu sehen.
Was sind multivariate Verfahren?
Analyse der Zusammenhänge zwischen drei oder mehr Variablen, von denen mindestens zwei abhängige Variablen sind.
1. Matritzen?
2. Warum matritzen?
Notation: Variablen = große, kursive Buchstaben (Y, X) • Ausprägungen= kleine, kursive Buchstaben; Subskripte geben an, von welchem Objekt die Ausprägung stammt (xi, yj)
Mehr Übersichtlichkeit bei Darstellung bei komplexer multivariater Verfahren
Kern von Verahren prägnant Festtstelbar.
Vektoren?
Besondere Matritzen: Matritzen, die nur aus einer Zeile (=Zeilenvektor) oder nur aus einer Spalte (=Spaltenvektor) bestehen
Semipartialkorrelation?
Ziel Partialkorr.: Bestimmen wie hoch eingenständiger Varianzanteil von Variablen (Wieviel Varianz sie allein in AV erklären).
(Semi-)Partialkorrelationen geben den linearen Zusammenhang zweier Variablen X und Y an, au dem EInfluss 3. Variable Z eliminiert wurde
Sinvoll wenn:
1. Redundate Usammenhänge Identifizieren: das Vorhandensein von eigentlich überflüssigen, für die Information nicht notwendigen Elementen; Überladung mit Merkmalen
Beispiel Redundanz: Berufserfolg (Y) korreliert mit Intelligenz (X) und Schulnoten (Z), aber auch Intelligenz und Schulnoten korrelieren mit einander. Erklären die beiden Variablen unabhängige Varianzanteile von Berufserfolg, d.h. kann man im Rahmen der Personalauswahl auf eine Variable verzichten?
2. Kontrolle von Störvariablen
Man zeigen will, dass der Zusammenhang auch bestehen bleibt, wenn man den Einfluss einer dritten Variable kontrolliert hat
3. Scheinzusammenhang über dritte Variable Z vermutet.
Beispiel: Ist die beobachtet Korrelation zwischen dem Einkommen (Y) und der Schuhgröße (X) von Arbeitnehmern möglicherweise ein Artefakt des Geschlechts(Z)?
4. Surpressoreffekt: maskierte Zusammenhänge aufdecken
Beispiel: Paradoxerweise berichten Personen eine höhere Lebenszufriedenheit (Y), wenn sie mehr Schulden haben (X). Der erwartete negative Zusammenhang zwischen beiden Variablen findet sich, wenn man für das Einkommen (Z) kontrolliert, das sowohl mit Y als auch X positive korreliertàStörvariable= Vermögen
Simpson Paradox?
Zeigt, dass sich unbedingte Zusammenhang zwischen 2 Variablen A und B und der bedingte Zusammenhang unter Berücksichtigung von einer Drittvariable C unterscheiden können. Sind A und B mit C konfundiert, so muss der Einfluss von C kontrolliert werden, um Scheinzusammenhänge oder maskierte Zusammenhänge aufzudecken.
Residuen ?
Resdiuen (ei)= Abweichung des beobachteten Werts vom wahren Wert. Die Summe dieser sollte möglichst gering sein, um aussagekräftige Schätzung möglich zu machen
Stadardschätzfehler?
Streung der Residuen (ei)
Bivariate Regression/ Korrelation
(Zu beachten bei der linearen Regression/Produkt-Moment Korrelation ist allgemein: )
Zu beachten bei der linearen Regression/Produkt-Moment Korrelation ist allgemein:
Quantifiziert wird der lineare Zusammenhang (d.h. es gibt auch andere Formen, für die die Produkt-Moment-Korrelation nicht geeignet ist)
Korrelationen können stark durch Ausreißer („outlier“) beeinflusst werden.
Korrelationen können durch Einschränkung der Wertebereiche der Variablen ("range restriction") beträchtlich reduziert werden
Wenn Varianz künstlich eingeschränkt wird, kann Korr. verzerrt werden. Beispiel Varianzeinschränkung in Personalauswahl: Kriterium wird an Personen gemessen, die bereits arbeiten, damit aber nicht garantierte Repräsentation von Berufseinsteigern (nicht gesamte Bandbreite wird berücksichtigt)
• Aus Korrelation kann nicht auf Kausalrichtung geschlossen werden
Interpretation von Regressionsgewichten
-Intercept
-Regressionsgewicht
Intercept (b0 ) = vorhergesagter Wert für y^, wenn alle Prädiktoren 0 sind
Regressionsgewichte (b1...bx) = Unterschied im vorhergesagten Wert (AV) für jede Einheit mehr auf dem entsprechenden Prädiktor bei konstanten anderen Prädiktoren
Wichtig: Standardisierte Partialregressionsgewichte und Partialkorrelationen sind verwandt und werden auch ähnlich interpretiert, sind aber nicht ident.
Bei standardisierten Partialregressionsgewichten werden Prädiktoren standardisiert
Bei Partialkorrelationen werden Residualvariablen standardisiert
Die beiden Statistiken können ineinander überführt werden (vgl. Eid et al., 2017), da in derRegel sehr ähnlich (Sinn der OLS)
Interpretation von Regressionsgewichten 2
Wenn die Prädiktoren untereinander korreliert sind, dann können die bi auch als Regressionsgewichte zweier Residualvariablen aufgefasst werden.
◦ Der Prädiktor Xi wird um Abhängigkeiten aller anderen Prädiktoren Xj≠i bereinigt.
◦ Das Kriterium Y wird um Abhängigkeiten aller anderen Prädiktoren Xj≠i bereinigt.
Die Regressionsgewichte sind ähnlich wie die Partialkorrelation zu interpretieren und werden als Partialregressionsgewichte bezeichnet.
Ziel: Prognose vs. Erklärung
Durch Einsatz in die Regressionsgleichung können neue Werte für das Kriterium vorhergesagt werden (Prognose).
Beispiel: Prognose von Berufserfolg anhand von Informationen aus einer Eignungsuntersuchung
In der Psychologie ist man häufig an der Erklärung individueller Unterschiede in der Ausprägung des Kriteriums interessiert.
Beispiel: Warum sich Personen im Persönlichkeitsmerkmal Extraversion unterschieden lässt sich durch verschiedene Umwelt- und genetische Einflüsse erklären.
Prognose setzt nicht voraus, dass die Prädiktoren Ursache für das Kriterium sind! à Auch wenn Einfluss gefunden wird, kein Kausalzusammenhang/ alleiniger Einfluss notwendig
Beispiel: Das Wohlbefinden eines Zwillings kann durch das Wohlbefinden des anderen Zwillings vorhergesagt werden (Prognose). Eine Erklärungen ist schwieriger, da sowohl Umweltfaktoren (z.B. Familienmitglieder haben gelernt ähnlich mit Gefühlen umzugehen) wie auch erbliche Faktoren eine Rolle spielen könnten.
Kausalinterpretation erfordert: zeitliche Abfolge (Kriterium-Prädiktor), keine Alternativerklärungen
◦ eine zeitliche Abfolge: das Kriterium muss den Prädiktoren zeitlich vorgelagert sein
◦ keine Alternativerklärungen: es dürfen Drittvariablen ignoriert werden, die den Zusammenhang mitbestimmen könnten.
Verfahren
Ziel: Prädiktoren sollen so gewichtet werden, dass gewichtete additive Verknüpfung (=Linearkombination) den Kriteriumswerten „möglichst nahe kommt“: Regressionsgewichte werden so bestimmt, dass die quadrierten Residuen minimiert werden (OLS-Schätzungen)
Voraussetzung für Bestimmung:
o Prädiktorenmatrix X hat den vollen Rang, d.h. keine perfekte Multikollinearität o Notwendig: Zahl der Personen n > Zahl der Variablen m
Annahmen
Für inferenzstatistischen Tests müssen in der Population die folgenden Annahmen / Voraussetzungen gelten:
1. Die AV ist kontinuierlich (metrisch)àmindestens Intervallskalenniveau (Alternative: verallgemeinertes lineares Modell)
Alle Variablen müssen eine Varianz größer als 0 aufweisen (keine Konstanten - sonst besteht kein Unterschied und es können entsprechend keine Linearen modell geschätzt werden)
Für alle Personen gilt die gleiche lineare Regressionsgleichung (Linearität)
Kriteriumswerte (bzw. Residuen) sind statistisch unabhängig voneinander (Alternative: hierarchische lineare Regression)
Für jede Kombination von Prädiktorwerten weisen die Residuen...
Den Erwartungswert 0 auf
Die gleiche Varianz auf (Varianzhomogenität = Homoskedastizität)
Für jede Kombination von Prädiktorwerten weisen die Residuen eine Normalverteilung auf
Wünschenswert (und für einige Tests erforderlich) ist, dass sich die Kriteriumsvariable und alle Prädiktoren multivariat normalverteilen (d.h. jede Variable und jede Linearkombination
von Variablen normalverteilt ist)
Beispiel: Vorhersage des Umsatzes 1
• Aus der Regressionsgleichung
"Stückzahl" = 1531.3 - 66.2·"Preis" + 0.4·"Werbung" + 4.6·"Zahl Vertreterbesuche" + Fehler kann man schließen
Werbung und Vertreterbesuche wirken sich förderlich auf die Zahl der verkauften Einheiten aus, ein hoher Preis hinderlich.
dassz.B.fürdiefolgendenWerteeinerweiterenRegionvorhergesagtwerdenkann: "Geschätzte Stückzahl" = 1531.3 - 66.2·9.90 + 0.4·800 + 4.6·95 = 1632.9
dass vorhergesagt wird, dass 10 weitere Vertreterbesuche den Verkauf um 46 Stück erhöhen (was bei einem Preis von z.B. 10 € den Umsatz um 460 € erhöhen würde).
• Hingegen kann man nicht auf die relative Wichtigkeit der Prädiktoren schließen: die b-Gewichte hängen vom Maßstab der Prädiktoren ab!
Beispiel: Eine Angabe des Prädiktors "Preis" in Cent statt Euro führt zu einem Gewicht von b1/100.
• Um dies zu können, muss man die Variablen vorher standardisieren und erhält dann die-Gewichte: (Preis) = -0.35, (Werbung) = 0.77, (Vertreterbesuche) = 0.22
-
- 1 / 17
-