Multivariate Verfahren
Master
Master
Set of flashcards Details
Flashcards | 83 |
---|---|
Students | 22 |
Language | Deutsch |
Category | Psychology |
Level | University |
Created / Updated | 02.07.2015 / 10.11.2023 |
Weblink |
https://card2brain.ch/box/multivariate_verfahren
|
Embed |
<iframe src="https://card2brain.ch/box/multivariate_verfahren/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was geben diskrete Verteilungen an?
Geben an, wie wahrscheinlich die einzelnen Ereignisse des Zufallsexperiments sind
z. B. Bernoulli-Verteilung, Binominalverteilung, Poissonverteilung
Was geben stetige Verteilungen an?
Geben für jedes mögliche Ereignis eine Zahl an, die proportional dazu ist, dass man eine Zahl in einem winzigen Intervall um dieses Ereignis misst
Alle reelle Zahlen oder eine Teilmenge davon können als Werte angenommen werden (also überabzählbar viele Werte)
Wodurch werden stetige Verteilungen beschrieben?
Dichtefunktion / Wahrscheinlichkeitsdichte
Nenne Beispiele für diskrete Verteilungen
Bernoulli, Binomial, Poisson
Was ist die fundamentale Idee von Konfidenzintervalle? (ALM)
Die AVs sind Zufallsvariablen und haben eine Verteilung
Im ALM: Y ist eine normalverteilte, unabhängige Zufallsvariable mit Erwartungswert ß0 + ß1X1 + ... und Varianz o²
Was sind die Voraussetzungen für das ALM bezüglich der AV?
metrisch, normalverteilt, unabhängig, gleiche Fehlervarianzen (Varianzhomogenität) und Spalten der Datenmatrix sind linear unabhängig
Wann existieren Kleinste-Quadrate-Schätzungen?
Wenn sich X'X invertieren lässt
Was führt zu standardisierten Regressionskoeffizienten?
Wenn X und Y vor den Berechnungen z-standardisiert werden
Was ist Multikollinearität?
Wenn Prädiktoren stark mit Linearkombinationen der anderen Prädiktoren oder mit anderen Prädiktoren korrelieren
Warum kann Multikollinearität ein Problem werden?
Schätzung der Regressionskoeffizienten numerisch instabil
Interpretation schwer
Regressionsgewichte fälschlicherweise signifikant
Was ist ein Supressoreffekt
Es wird suggeriert, dass X2 einen Einfluss auf Y hat, obwohl X2 und Y nicht korrelieren, sondern X1 und X2 korrelieren (Bergsteiger)
Erkläre Redundanz von Prädiktoren
Es wird suggeriert, dass X1 keinen Einfluss auf Y hat, obwohl sie korrelieren!
Was ist zur nichtlinearen Transformationen im ALM zu sagen?
Nichtlineare Prädiktorterme sind erlaubt! Machen aber nur bei metrischen Prädiktoren Sinn.
Regressionskoeffizienten dürfen hier nicht mittransformiert werden!
Wozu dient Dummy Kodierung?
Für den Vergleich von Gruppenmittelwerten mit dem Mittelwert einer Referenzgruppe
Wozu dient Effektkodierung?
Für den Vergleich von Gruppenmittelwerten mit dem Mittelwert der Mittelwerte aller Gruppen
Wozu dient Zellenmittelwertkodierung und was muss beachtet werden?
Für eine direkte Interpretation der Gruppenmittelwerte
Beachte: KEIN INTERCEPT
Was ist bei der Interpretation von Interaktionen zu beachten?
Sind in Modellgleichung ALLE möglichen Interaktionsterme aufgenommen, sind diese vorgesagten Werte genau die Mittelwerte der jeweiligen Gruppen
Wenn nur ein Teil der Interaktionsterme aufgenommen ist, entsprechen die vorhergesagten Werte nicht mehr den Mittelwerten in den jeweiligen Gruppen
Was ist der Unterschied bzgl. Konfidenzintervallen, wenn Varianz bekannt ist und wenn Varianz unbekannt ist?
Varianz bekannt: Konfidenzintervall z-standardisiert und normalverteilt!
Wenn Varianz unbekannt ist: t-verteilt!
Wie ist ein 95% Konfidenzintervall zu interpretieren?
Ist unser Modell richtig und würden wir das Konfidenzintervall für viele verschiedene Stichproben berechnen, dann würde es für 95 % der Stichproben den wahren Wert überdecken.
Wie testet man auf Signifikanz einzelner Modellparameter?
t-Test
Was ist ein Nullmodell?
Enthält nur den Intercept, keine Prädiktoren, somit klären Prädiktoren keine Varianz auf und ß^0 ist der Mittelwert von Y
Was ist ein Saturiertes Modell?
So viele zu schätzende Modellparameter, wie es Beobachtungen gibt. Prädiktoren klären gesamte Varianz auf (e = 0), aber nicht gut, da nicht auf Population übertragbar
Was ist ein unrestringiertes Modell?
Normales Modell
Was ist ein restringiertes Modell?
Genestet in das unrestringierte Modell, also ein Untermodell. Enthält keine anderen Prädiktoren / ß, als das unrestringierte Modell
Wie gut ist ein Modell?
Je kleiner Fehlerterme e sind (Kleine Fehlerquadratsumme SSE) und je weniger Modellparameter
Was besagt R²?
Gibt das Verhältnis der durch das Modell erklärten Variation der AV (SSM) zur Gesamtvariation der AV (SST) an
Wann wird R² sehr groß und was ist die Folge?
Wenn Stichprobe klein und gleichzeitig viele Prädiktoren vorliegen -> adjustiertes R²
Differenz zwischen R² und adjustiertes R² wird groß
Wie vergleichen wir zwei genestete Modelle im ALM?
F-Test!
Wie vergleichen wir zwei nicht-genestete Modelle im ALM?
AIC und BIC
Was versteht man unter einem konfirmatorischen Ansatz (ALM)?
Modell wird erstellt durch vorher bestimmte Menge von Prädiktoren und bestehten Theorien und a priori formulierten Hypothesen.
Modell wird angepasst und prüft, ob das mit Theorien und Hypothesen übereinstimmt
Was versteht man unter einem explorativem Ansatz im ALM?
Modell nicht vorher spezifiziert.
Gefahr: Zu lange suchen, bis Modell passt, Zufällige Effekte beeinflussen Modellwahl
Was versteht man unter Forward Selection (ALM)?
Starte mit Nullmodell, nehme so lange Prädiktoren auf, bis Modell maximal verbessert ist
Was versteht man unter Backward Selection (ALM)?
Starte mit vollem Modell, entferne Schritt für Schritt Prädiktoren bis Modell maximal verbessert ist
Was versteht man unter Stepwise Selection (ALM)?
Kombination von Backwart und Forward, es können Prädiktoren in jedem Schritt aufgenommen oder entfernt werden
Wann benutzt man ein GLM?
Wenn AV nicht mehr normalverteilt ist, bei Binären Daten oder Zähldaten
Erwartungswerte müssen nicht mehr linear in Prädiktoren sein
Was sind die Komponenten im GLM?
Zufällige Komponente: AV mit Verteilung aus Exponentialfamilie
Systematische Komponente (ß0 + ß1X1 + ...)
Linkfunktion g, welche Zusammenhang zwischen Erwartungswert der AV mit systematische Komponente modelliert
Wie schätzt man Parameter im GLM?
ML-Schätzung, t- oder z-Wert
Was ist das Maß für die Güte im GLM?
Devianz
Erkläre Devianz
Abweichungen der Log-Likelihood-Funktionen. Je kleiner desto besser. Im ALM entspricht das SSE