Cartes-fiches

Cartes-fiches 17 Cartes-fiches
Utilisateurs 0 Utilisateurs
Langue Deutsch
Niveau École primaire
Crée / Actualisé 12.01.2020 / 17.01.2020
Attribution de licence Non précisé
Lien de web
Intégrer
1 Réponses exactes 16 Réponses textes 0 Réponses à choix multiple
Fermer la fenêtre

Was sind multivariate Verfahren?

Analyse der Zusammenhänge zwischen drei oder mehr Variablen, von denen mindestens zwei abhängige Variablen sind.
Fermer la fenêtre

1. Matritzen?

2. Warum matritzen?

 

 

Notation: Variablen = große, kursive Buchstaben (Y, X) • Ausprägungen= kleine, kursive Buchstaben; Subskripte geben an, von welchem Objekt die Ausprägung stammt (xi, yj)

Mehr Übersichtlichkeit bei Darstellung bei komplexer multivariater Verfahren

Kern von Verahren prägnant Festtstelbar.

Fermer la fenêtre

Vektoren?

Besondere Matritzen: Matritzen, die nur aus einer Zeile (=Zeilenvektor) oder nur aus einer Spalte (=Spaltenvektor) bestehen

Fermer la fenêtre

Semipartialkorrelation?

Ziel Partialkorr.: Bestimmen wie hoch eingenständiger Varianzanteil von Variablen (Wieviel Varianz sie allein in AV erklären).

(Semi-)Partialkorrelationen geben den linearen Zusammenhang zweier Variablen X und Y an, au dem EInfluss 3. Variable Z eliminiert wurde

Sinvoll wenn:

1. Redundate Usammenhänge Identifizieren: das Vorhandensein von eigentlich überflüssigen, für die Information nicht notwendigen Elementen; Überladung mit Merkmalen

Beispiel Redundanz: Berufserfolg (Y) korreliert mit Intelligenz (X) und Schulnoten (Z), aber auch Intelligenz und Schulnoten korrelieren mit einander. Erklären die beiden Variablen unabhängige Varianzanteile von Berufserfolg, d.h. kann man im Rahmen der Personalauswahl auf eine Variable verzichten? 

2. Kontrolle von Störvariablen

Man zeigen will, dass der Zusammenhang auch bestehen bleibt, wenn man den Einfluss einer dritten Variable kontrolliert hat

3. Scheinzusammenhang über dritte Variable Z vermutet.

Beispiel: Ist die beobachtet Korrelation zwischen dem Einkommen (Y) und der Schuhgröße (X) von Arbeitnehmern möglicherweise ein Artefakt des Geschlechts(Z)?

4. Surpressoreffekt: maskierte Zusammenhänge aufdecken

Beispiel: Paradoxerweise berichten Personen eine höhere Lebenszufriedenheit (Y), wenn sie mehr Schulden haben (X). Der erwartete negative Zusammenhang zwischen beiden Variablen findet sich, wenn man für das Einkommen (Z) kontrolliert, das sowohl mit Y als auch X positive korreliertStörvariable= Vermögen

Fermer la fenêtre

Simpson Paradox?

 

Zeigt, dass sich unbedingte Zusammenhang zwischen 2 Variablen A und B und der bedingte Zusammenhang unter Berücksichtigung von einer Drittvariable C unterscheiden können. Sind A und B mit C konfundiert, so muss der Einfluss von C kontrolliert werden, um Scheinzusammenhänge oder maskierte Zusammenhänge aufzudecken.

Fermer la fenêtre

Residuen ?

Resdiuen (ei)= Abweichung des beobachteten Werts vom wahren Wert. Die Summe dieser sollte möglichst gering sein, um aussagekräftige Schätzung möglich zu machen

Fermer la fenêtre

Stadardschätzfehler?

Streung der Residuen (ei)

Fermer la fenêtre

Bivariate Regression/ Korrelation

(Zu beachten bei der linearen Regression/Produkt-Moment Korrelation ist allgemein: )

Zu beachten bei der linearen Regression/Produkt-Moment Korrelation ist allgemein:

  • Quantifiziert wird der lineare Zusammenhang (d.h. es gibt auch andere Formen, für die die Produkt-Moment-Korrelation nicht geeignet ist)

  • Korrelationen können stark durch Ausreißer („outlier“) beeinflusst werden.

  • Korrelationen können durch Einschränkung der Wertebereiche der Variablen ("range restriction") beträchtlich reduziert werden

    Wenn Varianz künstlich eingeschränkt wird, kann Korr. verzerrt werden. Beispiel Varianzeinschränkung in Personalauswahl: Kriterium wird an Personen gemessen, die bereits arbeiten, damit aber nicht garantierte Repräsentation von Berufseinsteigern (nicht gesamte Bandbreite wird berücksichtigt)

    • Aus Korrelation kann nicht auf Kausalrichtung geschlossen werden

Fermer la fenêtre

Modell der multiplen Regression 1

Attribution de licence: Non précisé
Fermer la fenêtre

Modell der multiplen Regression Matrix darstellung

Attribution de licence: Non précisé
Fermer la fenêtre

Modell der multiplen Regression Standartisiert und Unstandartisiert

Attribution de licence: Non précisé
Fermer la fenêtre

Interpretation von Regressionsgewichten

 

-Intercept

-Regressionsgewicht

Intercept (b0 ) = vorhergesagter Wert für y^, wenn alle Prädiktoren 0 sind

 

Regressionsgewichte (b1...bx) = Unterschied im vorhergesagten Wert (AV) für jede Einheit mehr auf dem entsprechenden Prädiktor bei konstanten anderen Prädiktoren

 

Wichtig: Standardisierte Partialregressionsgewichte und Partialkorrelationen sind verwandt und werden auch ähnlich interpretiert, sind aber nicht ident.

  • Bei standardisierten Partialregressionsgewichten werden Prädiktoren standardisiert

  • Bei Partialkorrelationen werden Residualvariablen standardisiert

  • Die beiden Statistiken können ineinander überführt werden (vgl. Eid et al., 2017), da in derRegel sehr ähnlich (Sinn der OLS)

Fermer la fenêtre

Interpretation von Regressionsgewichten 2

  • Wenn die Prädiktoren untereinander korreliert sind, dann können die bi auch als Regressionsgewichte zweier Residualvariablen aufgefasst werden.

    ◦ Der Prädiktor Xi wird um Abhängigkeiten aller anderen Prädiktoren Xj≠i bereinigt.

◦ Das Kriterium Y wird um Abhängigkeiten aller anderen Prädiktoren Xj≠i bereinigt.

  • Die Regressionsgewichte sind ähnlich wie die Partialkorrelation zu interpretieren und werden als Partialregressionsgewichte bezeichnet.

Fermer la fenêtre

Ziel: Prognose vs. Erklärung

Durch Einsatz in die Regressionsgleichung können neue Werte für das Kriterium vorhergesagt werden (Prognose).

Beispiel: Prognose von Berufserfolg anhand von Informationen aus einer Eignungsuntersuchung

In der Psychologie ist man häufig an der Erklärung individueller Unterschiede in der Ausprägung des Kriteriums interessiert.

Beispiel: Warum sich Personen im Persönlichkeitsmerkmal Extraversion unterschieden lässt sich durch verschiedene Umwelt- und genetische Einflüsse erklären.

Prognose setzt nicht voraus, dass die Prädiktoren Ursache für das Kriterium sind! Auch wenn Einfluss gefunden wird, kein Kausalzusammenhang/ alleiniger Einfluss notwendig

Beispiel: Das Wohlbefinden eines Zwillings kann durch das Wohlbefinden des anderen Zwillings vorhergesagt werden (Prognose). Eine Erklärungen ist schwieriger, da sowohl Umweltfaktoren (z.B. Familienmitglieder haben gelernt ähnlich mit Gefühlen umzugehen) wie auch erbliche Faktoren eine Rolle spielen könnten.

Kausalinterpretation erfordert: zeitliche Abfolge (Kriterium-Prädiktor), keine Alternativerklärungen

◦ eine zeitliche Abfolge: das Kriterium muss den Prädiktoren zeitlich vorgelagert sein

◦ keine Alternativerklärungen: es dürfen Drittvariablen ignoriert werden, die den Zusammenhang mitbestimmen könnten.

Fermer la fenêtre

Verfahren

Ziel: Prädiktoren sollen so gewichtet werden, dass gewichtete additive Verknüpfung (=Linearkombination) den Kriteriumswerten „möglichst nahe kommt“: Regressionsgewichte werden so bestimmt, dass die quadrierten Residuen minimiert werden (OLS-Schätzungen)

Voraussetzung für Bestimmung:

o Prädiktorenmatrix X hat den vollen Rang, d.h. keine perfekte Multikollinearität o Notwendig: Zahl der Personen n > Zahl der Variablen m

Fermer la fenêtre

Annahmen

Für inferenzstatistischen Tests müssen in der Population die folgenden Annahmen / Voraussetzungen gelten:

1. Die AV ist kontinuierlich (metrisch)àmindestens Intervallskalenniveau (Alternative: verallgemeinertes lineares Modell)

 

  1. Alle Variablen müssen eine Varianz größer als 0 aufweisen (keine Konstanten - sonst besteht kein Unterschied und es können entsprechend keine Linearen modell geschätzt werden)

  2. Für alle Personen gilt die gleiche lineare Regressionsgleichung (Linearität)

  3. Kriteriumswerte (bzw. Residuen) sind statistisch unabhängig voneinander (Alternative: hierarchische lineare Regression)

  4. Für jede Kombination von Prädiktorwerten weisen die Residuen...

    1. Den Erwartungswert 0 auf

    2. Die gleiche Varianz auf (Varianzhomogenität = Homoskedastizität)

  5. Für jede Kombination von Prädiktorwerten weisen die Residuen eine Normalverteilung auf

  6. Wünschenswert (und für einige Tests erforderlich) ist, dass sich die Kriteriumsvariable und alle Prädiktoren multivariat normalverteilen (d.h. jede Variable und jede Linearkombination

    von Variablen normalverteilt ist)

Fermer la fenêtre

Beispiel: Vorhersage des Umsatzes 1

• Aus der Regressionsgleichung

"Stückzahl" = 1531.3 - 66.2·"Preis" + 0.4·"Werbung" + 4.6·"Zahl Vertreterbesuche" + Fehler kann man schließen

  • Werbung und Vertreterbesuche wirken sich förderlich auf die Zahl der verkauften Einheiten aus, ein hoher Preis hinderlich.

  • dassz.B.fürdiefolgendenWerteeinerweiterenRegionvorhergesagtwerdenkann: "Geschätzte Stückzahl" = 1531.3 - 66.2·9.90 + 0.4·800 + 4.6·95 = 1632.9

  • dass vorhergesagt wird, dass 10 weitere Vertreterbesuche den Verkauf um 46 Stück erhöhen (was bei einem Preis von z.B. 10 € den Umsatz um 460 € erhöhen würde).

    • Hingegen kann man nicht auf die relative Wichtigkeit der Prädiktoren schließen: die b-Gewichte hängen vom Maßstab der Prädiktoren ab!

    Beispiel: Eine Angabe des Prädiktors "Preis" in Cent statt Euro führt zu einem Gewicht von b1/100.
    • Um dies zu können, muss man die Variablen vorher standardisieren und erhält dann die

    -Gewichte: (Preis) = -0.35, (Werbung) = 0.77, (Vertreterbesuche) = 0.22