Methoden der Unterschiedsprüfung
Statistik MUP
Statistik MUP
Kartei Details
Karten | 125 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 27.05.2021 / 03.07.2024 |
Weblink |
https://card2brain.ch/box/20210527_methoden_der_unterschiedspruefung
|
Einbinden |
<iframe src="https://card2brain.ch/box/20210527_methoden_der_unterschiedspruefung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Welche 3 standardisierte Effektgrößen gibt es?
- Cohen's d
- Pearson r
- Determinationskoeffizient eta^2
Partial eta^2 Anteil aufgeklärter Varianz > KEINE standardisierte Interpretation > Kontext
Was versteht man unter dem Determinationskoeffizienten eta^2 und welche 3 Vorteile gehen damit einher?
eta^2 ist der Anteil aufgeklärter Varianz z.B. n^2= 0.21 für einen Haupteffekt > durch Kenntnis der Gruppenzugehörigkeit der VP (=Stufe des Faktors) kann 21% der Variabilität der Messwerte vorhergesagt werden
eta^2 hat die Eigenschaft der Additivität (bei komplett gekreuzten und gleich großen Stichproben) - einzelne Effektstärken von Haupteffekten und Interaktionen lassen sich zu einer Gesamtvarianzaufklärung addieren
Welche 3 Nachteile gehen mit dem Determinationskoeffizienten eta^2 einher?
- 1 Nachteil: die Größe eines einzelnen Effektwertes hängt von der Anzahl/Stärke der anderen Effekte ab im Design z.B. Faktor A kann in einem einfaktoriellen im Vergleich zu einem zweifaktoriellen Design unterschiedl. Effektstärken bekommen
- Lösung partial eta^2 im Kontext von mehrfaktoriellen Anovas, diese zeigen die unique Varianzaufklärung des untersuchten Effektts, sind aber nicht merh additiv (der Nenner ist verschieden)
- 2. Nachteil: eta^2 ist kein erwartungstreuer Schätzer der warhen Varianzaufklärung
- 3. Nachteil: auch hier stellt sich die übliche Frage "wie viel ist viel"?
Welche Aussagen zur multiplen Regression stimmen?
Was sind Voraussetzungen für eine multiple Regression?
Korrelierte Prädiktoren sind bei der multiplen Regression keine Voraussetzung. Richtig oder falsch?
richtig
ABER: kritisch, wenn die Korrelationen zu hoch sind ca. ab .6/.7 zu hoch
- Problem = Multikollinearität: Lineare Abhängigkeit der Prädiktoren
- Überprüfung durch Toleranzwert ( <.1 /.2 kritisch)
- Lösung: Zentrieren der Variablen (Mittelwert abziehen)
Bei der Regression werden multivariate Outlier über die Mahalanobis-Distanz berechnet. richtig oder falsch?
richtig
Kritisch, wenn die größte Distanz größer als eine 99.9% Quantil einer Chi^2 Verteilung mit df= Anzahl der Prädiktoren – wenn die größte Mahalanobis-Distanz im Output kleiner ist als das kritische Quantil, haben wir kein multivariaten Outlier
Welche 3 Werte gibt es, an denen ich sehen kann, wie gut ich durch die Prädiktoren mein Kriterium vorhersagen kann? = Güte der Vorhersage
- Multiple Korrelation R: Korrelation der wahren und der vorhergesagten Kriteriumswerte
- R^2 = Anteil der aufgeklärten Varianz
- Überschätzt wahren Wert systematisch => korrigiertes R^2
Was versteht man unter Residuen?
Residuen sind die Abweichung zwischen dem durch die Regressionsgleichung vorhergesagten Wert (Kriterium) und dem tatsächlich beobachteten Wert in einer Regressions
- Residuen sollten immer möglichst klein sein, um eine exakte Vorhersage des Kriteriums zu erhalten
- Minimierung der Residuen mithilfe der Methode der kleinsten Quadrate
Welche 3 Arten von Regressionsverfahren gibt es?
1. Statistische/Stepwise Regression
- Keine Hypothesen
- Reihenfolge und Auswahl der Prädiktoren nach rein statistischen Kriterien
- Auch Vorwärts/Rückwärts/Schrittweise gehört hierzu
- fishing excursion“, Schleppnetzforschung oder gerne auch Schrotschuss-Statistik
- Kreuzvalidierung dringend ratsam, weitere Möglichkeit: Bootstrapping
2. Sequentielle/Hierarchische Regression
- Hypothesengeleitetes Vorgehen
- Starker statistischer Test
3. Einschlussverfahren
- alle Variablen werden gleichzeitig ins Modell gesteckt (unique)
Es kann vorkommen, dass bei der mulitplen Regression zwei Variablen wenig mit dem Kriterium
korrelieren, aber in der Regression eine der beiden dann einen starken Beitrag liefert. Wie wird diese Variable genannt?
Suppressor-Variable
In der Praxis findet man generell selten mehr als... signifikante DKFs, da die DKFs.... Varianz aufklären.
Was kommt in die Lücken?
- zwei
- suksessiv maximal
Wie beschrieben klären die DKFs sukzessiv maximale Varianz auf. Daher findet man in der Praxis selten mehr als 2 signifikante DKFs.
Welche Voraussetzung ist bei der Diskriminanzanalyse kritisch?
- Varianzhomogenität (Problematisch bei ungleichen Gruppengrößen)- bei gleich großen Stichproben bzw. bei großem Stichprobenumfang robust
- inhomogene Varianzen: Hier problematischer als bei der ANOVA/MANOVA
- Je größer die Varianz einer Gruppe, desto wahrscheinlicher wird ihr ein Fall zugeordnet
Varianzhomognenität ist besonders wichtig, wenn die Klassifikation das wichtigste Ziel der Analyse ist
Mathematisch gesehen sind MANOVA und die Diskriminanzanalyse identische Verfahren. richtig oder falsch?
richtig
Mathematisch gesehen sind MANOVA (einfaktoriell between - Unterschied in Mittelwertsvektoren für Gruppen) und die Diskriminanzanalyse (Unterschiede in Merkmalsvektoren für Gruppen) identische Verfahren. richtig oder falsch?
Es gibt eine große Ähnlichkeit zwischen Faktorenanalyse (Hauptkomponentenanalyse ohne Rotationsverfahren) und der Diskriminanzanalyse. richtig oder falsch?
richtig
Es besteht eine große Ähnlichkeit zwischen Faktorenanalyse (Hauptkomponentenanalyse ohne Rotationsverfahren) und der Diskriminanzanalyse.bDie Diskriminanzfunktionen einer DKA sind etwas ganz ähnliches wie die Faktoren / Dimensionen / Achsen bei einer Faktorenanalyse
Bei der Diskriminanzanalyse werden die Merkmale so .... kombiniert, dass sie maximal zwischen den Gruppen trennen. Was kommt in die Lücke?
linear
Bei der Diskriminanuanalyse wird automatisch getestet, ob der Unterschied zwischen den Mittelwerten auf den Achsen signifikant ist. Richtig oder falsch?
falsch!
Es wird automatisch getestet, ob der Unterschied zwischen den Gruppenzentroiden auf den Achsen signifikant ist.
Was kann man bei der Diskriminanzanalyse der Klassifizierung von Merkmalen tun, um ein Overfitting zu vermeiden?
- Teilen der Stichprobe und Durchführung einer Kreuzvalidierung
- Fallauslassung durch das Jackknife-Verfahren
Es gibt keinen statistischen Grund, ein Merkmal mit einer Ladung unterhalb eines bestimmten Wertes nicht für die Interpretation einer Diskrimanzanalyse heranzuziehen. Nach einer verbreiteten Konvention sollte der Betrag der Ladung aber größer sein als ... Welcher Wert gehört in die Lücke?
Was versteht man bei der Diskriminanzanalyse unter Ladung eines Merkmals?
Ladung ist die Korrelation des Merkmals mit der DKF
- Ladungen werden in der Struktur-Matrix abgelesen
- sind vergleichbar wie bei Betas bei der Regression
Es gibt immer weniger Klassifikantionsfunktionen als Diskriminanzfunktionen. Richtig oder falsch?
falsch
Es gibt immer mehr Klassifikantionsfunktionen als Diskriminanzfunktionen. Es gibt immer so viele Klassifikaitonsfunktionen wie Gruppen in der Analyse. Diskriminanzfunktionen gibt es minimal 0 (wenn sich die Gruppen vollständig überlappe) bis maximal (Anzahl Gruppen – 1).
Welches Verfahren kann auch genutzt werden um Messwiederholungs ANOVA auszuwerten?
die MANOVA
Spherizitätsannahme entfällt aber weniger teststark
Was ist bei der Variable/AV bei ANOVA mit Messwiederholung wichtig?
Diese müssen alle demselben Konzept entspringen
nicht derselbe Test, aber dasselbe Konstrukt muss gemessen werden, um die AV über die Messzeitpunkte vergleichen zu können
Was ist bei den AVs der Profilanalyse zu beachten?
Eine Profilanalyse analysiert mehrere AVs, welche auf der selben Skala gemessen werden (oft bei MWH-Designs angemessen).
d.h. die AVs müssen dem gleichen Konstrukt zugrunde liegen, um diese in der Profilanalyse vergleichen zu können
Was trifft auf die Voraussetzung der AV bei der ANOVA zu?
Ob bei der multiplen Regression ein Prädiktor taugt, d.h. welchen Anteil der Prädiktor an Varianz aufklärt bzw. wie die aufgeklärte Varianz sich verändert bei Hinzunahme von Prädiktoren kann man in welcher Tabelle ablesen ?
bringt der Prädiktor eine zusätzliche signifikante Veränderung der Varianzaufklärung?
Modellzusammenfassung Tabelle > Spalte Korrigiertes R^2 = Anteil aufgeklärter Varianz durch Hinzunahme eines Prädiktors
In welcher Tabelle bei der multiplen Regression kann man ablesen, ob das Modell taugt, um das Kriterium vorherzusagen ?
ANOVA Tabelle > hier werden die Regressionsmodelle unabhängig voneinander auf Signifikanz getestet
Was versteht man unter Residuen und wie werden sie geschätzt?
Residuen sind Abweichung zwischen dem durch die Regressionsgleichung vorhergesagten Wert (Kriterium) und dem tatsächlich beobachteten Wert in einer Regressionsanalyse
- Residuum gibt an, wie weit du bei der Schätzung eines Kriteriumswertes daneben lagst
- Residuen sollten immer möglichst klein sein, um eine exakte Vorhersage des Kriteriums zu erhalte
- Minimierung der Residuen mithilfe der Methode der kleinsten Quadrate
- Residuen bilden die Grundlage zur Varianzzerlegungen
- mithilfe der Residuen kannst du den Teil der Varianz schätzen, der nicht mit dem Prädiktor aufgeklärt werden kann à Residualvarianz = Varianzanteil des Kriteriums, das nicht durch Prädiktoren aufgeklärt werden kann
Was besagt der P-Wert?
= Prozentrang des F-Bruchs > Wahrscheinlichkeit, ein Varianzverhältnis so groß wie den F-Wert oder größer zu erhalten, wenn man vom Zufall ausgeht
Posthoc-Tests haben eine größere Power als Kontraste. richtig oder falsch?
falsch
Wie viele Diskriminanzfunktionen kann es maximal geben?
Die maximale Anzahl von DKF entspricht der Anzahl der Gruppen – 1 oder der Anzahl an Merkmalen/Prädiktoren, je nachdem, welche Zahl kleiner ist.
Wie können Sie eine Kreuzvalidierun einer Diskriminanzanalyse durchführen, ohne eine zweite Stichprobe erheben zu müssen? Geben Sie den Namen des Verfahrens und eine kurze Beschreibung an
Die Klassifikation erfolgt auf denselben Daten wie die Schätzung der DKFs. Sie betreiben also mit Sicherheit ein gewisses Overfitting.
Lösungen:
1. echte Kreuzvalidierung: Stichprobe teilen oder neue Stichprobe erheben
2. Jackknife-Verfahren (in SPSS: Klassifikation mit Fallauslassung)
Varianzinhomogenität ist bei der Diskriminanzanalyse bei gleichen Stichprobengrößen kein Problem. richtig oder falsch?
Ein großes Problem sind zudem inhomoge Varianzen: Je größer die Varianz einer Gruppe, desto wahrscheinlicher wird ihr ein Fall zugeordnet
Bei sehr ungleichen Zellbesetzungen der Diskrimianzanalyse kommt auch die logistische Regression in Frage. Richtig oder falsch?
richtig
Mit der DKA kann man auch mehrfaktorielle und Messwiederholungs Designs auswerten. Richtig oder falsch?
falsch
Grenzen der DKA sind mehrfaktorielle Designs oder (nur in Spezialfällen möglich) und Messwiederholungen (gar nicht möglich)
Mathematisch gesehen sind DKA und MANOVA dabei identische Verfahren. Richtig oder falsch?
richtig
Die Diskriminanzfunktion ist eine Linearkombination. Richtig oder falsch?
richtig
In der DKA werden Merkmale (Prädiktoren) linear kombiniert, und zwar so, dass sie optimal zwischen den Gruppenmittelwerten trennen
Die Diskriminanzfunktion einer DKA ist einem Faktor bei der Faktorenanalyse (Hauptkomponentenverfahren) sehr
ähnlich. richtig oder falsch?
richtig
Bei der DKA wird getestet, ob der Unterschied zwischen den Gruppenmittelwerten auf den Achsen signifikant wird. richtig oder falsch?
falsch
Bei der DKA wird getestet, ob der Unterschied zwischen den Gruppenzentroiden auf den Achsen signifikant wird.
Beschreibe 3 Gemeinsamkeiten/Ähnlichkeiten von DKA und Faktorneanalyse
1) Die Idee der DKA ähnelt dem Hauptkomponentenanalyse. Es wird wie eine Linearkombination gesucht, sodass die Projektionen der Datenpunkte auf die neue Achse maximale Varianz aufweisen = Einfachstruktur d.h. Variablen lasden immer nur auf einem Faktor hoch und auf allen andren Faktoren niedrig
2) Die Diskriminanzfunktion einer DKA ist einem Faktor der Faktorenanalyse sehr
ähnlich. Der Wert einer VP auf einer Diskriminanzfunktion entspricht dabei exakt dem Faktorwert
3) Die Diskriminanzfunktionen können dann ähnlich wie die Faktoren der Faktoren-analyse interpretiert werden, indem der Zusammenhang zwischen DK einzelnen Merkmalen betrachtet wird.
- ähnliche Frage: gibt es eine begrenzte Anzahl von Dimensionen/Faktoren, due denen sich vershciedene Objekte beschreiben lassen?
- Ähnliches Ziel: Strukturierungsfunktion