Statistik MUP


Kartei Details

Karten 125
Sprache Deutsch
Kategorie Psychologie
Stufe Universität
Erstellt / Aktualisiert 27.05.2021 / 03.07.2024
Weblink
https://card2brain.ch/box/20210527_methoden_der_unterschiedspruefung
Einbinden
<iframe src="https://card2brain.ch/box/20210527_methoden_der_unterschiedspruefung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Welche 3 standardisierte Effektgrößen gibt es?

  • Cohen's d
  • Pearson r
  • Determinationskoeffizient eta^2

Partial eta^2 Anteil aufgeklärter Varianz > KEINE standardisierte Interpretation > Kontext

Was versteht man unter dem Determinationskoeffizienten eta^2 und welche 3 Vorteile gehen damit einher?

eta^2 ist der Anteil aufgeklärter Varianz z.B. n^2= 0.21 für einen Haupteffekt > durch Kenntnis der Gruppenzugehörigkeit der VP (=Stufe des Faktors) kann 21% der Variabilität der Messwerte vorhergesagt werden

eta^2 hat die Eigenschaft der Additivität (bei komplett gekreuzten und gleich großen Stichproben) - einzelne Effektstärken von Haupteffekten und Interaktionen lassen sich zu einer Gesamtvarianzaufklärung addieren

Welche 3 Nachteile gehen mit dem Determinationskoeffizienten eta^2 einher?

  • 1 Nachteil: die Größe eines einzelnen Effektwertes hängt von der Anzahl/Stärke der anderen Effekte ab im Design z.B. Faktor A kann in einem einfaktoriellen im Vergleich zu einem zweifaktoriellen Design unterschiedl. Effektstärken bekommen
    • Lösung partial eta^2 im Kontext von mehrfaktoriellen Anovas, diese zeigen die unique Varianzaufklärung des untersuchten Effektts, sind aber nicht merh additiv (der Nenner ist verschieden)
  • 2. Nachteil: eta^2 ist kein erwartungstreuer Schätzer der warhen Varianzaufklärung
  • 3. Nachteil: auch hier stellt sich die übliche Frage "wie viel ist viel"?

Welche Aussagen zur multiplen Regression stimmen?

Was sind Voraussetzungen für eine multiple Regression?

Korrelierte Prädiktoren sind bei der multiplen Regression keine Voraussetzung. Richtig oder falsch?

richtig

ABER: kritisch, wenn die Korrelationen zu hoch sind ca. ab .6/.7 zu hoch

  • Problem = Multikollinearität: Lineare Abhängigkeit der Prädiktoren
    • Überprüfung durch Toleranzwert ( <.1 /.2 kritisch)
    • Lösung: Zentrieren der Variablen (Mittelwert abziehen)

Bei der Regression werden multivariate Outlier über die Mahalanobis-Distanz berechnet. richtig oder falsch?

richtig

Kritisch, wenn die größte Distanz größer als eine 99.9% Quantil einer Chi^2 Verteilung mit df= Anzahl der Prädiktoren – wenn die größte Mahalanobis-Distanz im Output kleiner ist als das kritische Quantil, haben wir kein multivariaten Outlier

Welche 3 Werte gibt es, an denen ich sehen kann, wie gut ich durch die Prädiktoren mein Kriterium vorhersagen kann? = Güte der Vorhersage

  • Multiple Korrelation R: Korrelation der wahren und der vorhergesagten Kriteriumswerte
  •  R^2 = Anteil der aufgeklärten Varianz
  • Überschätzt wahren Wert systematisch => korrigiertes R^2

Was versteht man unter Residuen?

Residuen sind die Abweichung zwischen dem durch die Regressionsgleichung vorhergesagten Wert  (Kriterium) und dem tatsächlich beobachteten Wert in einer Regressions

  • Residuen sollten immer möglichst klein sein, um eine exakte Vorhersage des Kriteriums zu erhalten
  • Minimierung der Residuen mithilfe der Methode der kleinsten Quadrate

Welche 3 Arten von Regressionsverfahren gibt es?

 

1. Statistische/Stepwise Regression

  • Keine Hypothesen
  • Reihenfolge und Auswahl der Prädiktoren nach rein statistischen Kriterien
  • Auch Vorwärts/Rückwärts/Schrittweise gehört hierzu
  • fishing excursion“, Schleppnetzforschung oder gerne auch Schrotschuss-Statistik
  • Kreuzvalidierung dringend ratsam, weitere Möglichkeit: Bootstrapping

2. Sequentielle/Hierarchische Regression

  • Hypothesengeleitetes Vorgehen
  • Starker statistischer Test

3. Einschlussverfahren

  • alle Variablen werden gleichzeitig ins Modell gesteckt (unique)

Es kann vorkommen, dass bei der mulitplen Regression zwei Variablen wenig mit dem Kriterium
korrelieren, aber in der Regression eine der beiden dann einen starken Beitrag liefert. Wie wird diese Variable genannt?

 

Suppressor-Variable

In der Praxis findet man generell selten mehr als... signifikante DKFs, da die DKFs.... Varianz aufklären.

Was kommt in die Lücken?

  1. zwei
  2. suksessiv maximal

Wie beschrieben klären die DKFs sukzessiv maximale Varianz auf. Daher findet man in der Praxis selten mehr als 2 signifikante DKFs.

Welche Voraussetzung ist bei der Diskriminanzanalyse kritisch?

  • Varianzhomogenität (Problematisch bei ungleichen Gruppengrößen)- bei gleich großen Stichproben bzw. bei großem Stichprobenumfang robust
    • inhomogene Varianzen: Hier problematischer als bei der ANOVA/MANOVA
    • Je größer die Varianz einer Gruppe, desto wahrscheinlicher wird ihr ein Fall zugeordnet

Varianzhomognenität ist besonders wichtig, wenn die Klassifikation das wichtigste Ziel der Analyse ist

Mathematisch gesehen sind MANOVA und die Diskriminanzanalyse identische Verfahren. richtig oder falsch?

richtig

Mathematisch gesehen sind MANOVA (einfaktoriell between - Unterschied in Mittelwertsvektoren für Gruppen) und die Diskriminanzanalyse (Unterschiede in Merkmalsvektoren für Gruppen) identische Verfahren. richtig oder falsch?

Es gibt eine große Ähnlichkeit zwischen Faktorenanalyse (Hauptkomponentenanalyse ohne Rotationsverfahren) und der Diskriminanzanalyse. richtig oder falsch?

richtig

Es besteht eine große Ähnlichkeit zwischen Faktorenanalyse (Hauptkomponentenanalyse ohne Rotationsverfahren) und der Diskriminanzanalyse.bDie Diskriminanzfunktionen einer DKA sind etwas ganz ähnliches wie die Faktoren / Dimensionen / Achsen bei einer Faktorenanalyse

Bei der Diskriminanzanalyse werden die Merkmale so .... kombiniert, dass sie maximal zwischen den Gruppen trennen. Was kommt in die Lücke?

linear

Bei der Diskriminanuanalyse wird automatisch getestet, ob der Unterschied zwischen den Mittelwerten auf den Achsen signifikant ist. Richtig oder falsch?

falsch!

Es wird automatisch getestet, ob der Unterschied zwischen den Gruppenzentroiden auf den Achsen signifikant ist.

Was kann man bei der Diskriminanzanalyse der Klassifizierung von Merkmalen tun, um ein Overfitting zu vermeiden?

  • Teilen der Stichprobe und Durchführung einer Kreuzvalidierung
  • Fallauslassung durch das Jackknife-Verfahren

Es gibt keinen statistischen Grund, ein Merkmal mit einer Ladung unterhalb eines bestimmten Wertes nicht für die Interpretation einer Diskrimanzanalyse heranzuziehen. Nach einer verbreiteten Konvention sollte der Betrag der Ladung aber größer sein als ... Welcher Wert gehört in die Lücke?

Was versteht man bei der Diskriminanzanalyse unter Ladung eines Merkmals?

Ladung ist die Korrelation des Merkmals mit der DKF

  • Ladungen werden in der Struktur-Matrix abgelesen
  • sind vergleichbar wie bei Betas bei der Regression

Es gibt immer weniger Klassifikantionsfunktionen als Diskriminanzfunktionen. Richtig oder falsch?

falsch

Es gibt immer mehr Klassifikantionsfunktionen als Diskriminanzfunktionen. Es gibt immer so viele Klassifikaitonsfunktionen wie Gruppen in der Analyse. Diskriminanzfunktionen gibt es minimal 0 (wenn sich die Gruppen vollständig überlappe) bis maximal (Anzahl Gruppen – 1).

Welches Verfahren kann auch genutzt werden um Messwiederholungs ANOVA auszuwerten?

die MANOVA

Spherizitätsannahme entfällt aber weniger teststark

Was ist bei der Variable/AV bei ANOVA mit Messwiederholung wichtig?

Diese müssen alle demselben Konzept entspringen

nicht derselbe Test, aber dasselbe Konstrukt muss gemessen werden, um die AV über die Messzeitpunkte vergleichen zu können

Was ist bei den AVs der Profilanalyse zu beachten?

Eine Profilanalyse analysiert mehrere AVs, welche auf der selben Skala gemessen werden (oft bei MWH-Designs angemessen).

d.h. die AVs müssen dem gleichen Konstrukt zugrunde liegen, um diese in der Profilanalyse vergleichen zu können

Was trifft auf die Voraussetzung der AV bei der ANOVA zu?

Ob bei der multiplen Regression ein Prädiktor taugt, d.h. welchen Anteil der Prädiktor an Varianz aufklärt bzw. wie die aufgeklärte Varianz sich verändert bei Hinzunahme von Prädiktoren kann man in welcher Tabelle ablesen ?

bringt der Prädiktor eine zusätzliche signifikante Veränderung der Varianzaufklärung?

Modellzusammenfassung Tabelle > Spalte Korrigiertes R^2 = Anteil aufgeklärter Varianz durch Hinzunahme eines Prädiktors

In welcher Tabelle bei der multiplen Regression kann man ablesen, ob das Modell taugt, um das Kriterium vorherzusagen ?

ANOVA Tabelle > hier werden die Regressionsmodelle unabhängig voneinander auf Signifikanz getestet

Was versteht man unter Residuen und wie werden sie geschätzt?

Residuen sind Abweichung zwischen dem durch die Regressionsgleichung vorhergesagten Wert  (Kriterium) und dem tatsächlich beobachteten Wert in einer Regressionsanalyse

  • Residuum gibt an, wie weit du bei der Schätzung eines Kriteriumswertes daneben lagst
  • Residuen sollten immer möglichst klein sein, um eine exakte Vorhersage des Kriteriums zu erhalte
  • Minimierung der Residuen mithilfe der Methode der kleinsten Quadrate
  • Residuen bilden die Grundlage zur Varianzzerlegungen
  • mithilfe der Residuen kannst du den Teil der Varianz schätzen, der nicht mit dem Prädiktor aufgeklärt werden kann à Residualvarianz = Varianzanteil des Kriteriums, das nicht durch Prädiktoren aufgeklärt werden kann

Was besagt der P-Wert?

= Prozentrang des F-Bruchs > Wahrscheinlichkeit, ein Varianzverhältnis so groß wie den F-Wert oder größer zu erhalten, wenn man vom Zufall ausgeht

Posthoc-Tests haben eine größere Power als Kontraste. richtig oder falsch?

falsch

Wie viele Diskriminanzfunktionen kann es maximal geben?

Die maximale Anzahl von DKF entspricht der Anzahl der Gruppen – 1 oder der Anzahl an Merkmalen/Prädiktoren, je nachdem, welche Zahl kleiner ist.

Wie können Sie eine Kreuzvalidierun einer Diskriminanzanalyse durchführen, ohne eine zweite Stichprobe erheben zu müssen? Geben Sie den Namen des Verfahrens und eine kurze Beschreibung an

Die Klassifikation erfolgt auf denselben Daten wie die Schätzung der DKFs. Sie betreiben also mit Sicherheit ein gewisses Overfitting.

Lösungen:
1. echte Kreuzvalidierung: Stichprobe teilen oder neue Stichprobe erheben
2. Jackknife-Verfahren (in SPSS: Klassifikation mit Fallauslassung)

Varianzinhomogenität ist bei der Diskriminanzanalyse bei gleichen Stichprobengrößen kein Problem. richtig oder falsch?

Ein großes Problem sind zudem inhomoge Varianzen: Je größer die Varianz einer Gruppe, desto wahrscheinlicher wird ihr ein Fall zugeordnet

Bei sehr ungleichen Zellbesetzungen der Diskrimianzanalyse kommt auch die logistische Regression in Frage. Richtig oder falsch?

richtig

Mit der DKA kann man auch mehrfaktorielle und Messwiederholungs Designs auswerten. Richtig oder falsch?

falsch

Grenzen der DKA sind mehrfaktorielle Designs oder (nur in Spezialfällen möglich) und Messwiederholungen (gar nicht möglich)

Mathematisch gesehen sind DKA und MANOVA dabei identische Verfahren. Richtig oder falsch?

richtig

Die Diskriminanzfunktion ist eine Linearkombination. Richtig oder falsch?

richtig

In der DKA werden Merkmale (Prädiktoren) linear kombiniert, und zwar so, dass sie optimal zwischen den Gruppenmittelwerten trennen

Die Diskriminanzfunktion einer DKA ist einem Faktor bei der Faktorenanalyse (Hauptkomponentenverfahren) sehr
ähnlich. richtig oder falsch?

richtig

Bei der DKA wird getestet, ob der Unterschied zwischen den Gruppenmittelwerten auf den Achsen signifikant wird. richtig oder falsch?

falsch

Bei der DKA wird getestet, ob der Unterschied zwischen den Gruppenzentroiden auf den Achsen signifikant wird.

Beschreibe 3 Gemeinsamkeiten/Ähnlichkeiten von DKA und Faktorneanalyse

1) Die Idee der DKA ähnelt dem Hauptkomponentenanalyse. Es wird wie eine Linearkombination gesucht, sodass die Projektionen der Datenpunkte auf die neue Achse maximale Varianz aufweisen = Einfachstruktur d.h. Variablen lasden immer nur auf einem Faktor hoch und auf allen andren Faktoren niedrig

2) Die Diskriminanzfunktion einer DKA ist einem Faktor der Faktorenanalyse sehr
ähnlich. Der Wert einer VP auf einer Diskriminanzfunktion entspricht dabei exakt dem Faktorwert

3) Die Diskriminanzfunktionen können dann ähnlich wie die Faktoren der Faktoren-analyse interpretiert werden, indem der Zusammenhang zwischen DK einzelnen Merkmalen betrachtet wird.

  • ähnliche Frage: gibt es eine begrenzte Anzahl von Dimensionen/Faktoren, due denen sich vershciedene Objekte beschreiben lassen?
  • Ähnliches Ziel: Strukturierungsfunktion