Staddi
VL 1-13
VL 1-13
Set of flashcards Details
Flashcards | 268 |
---|---|
Language | Deutsch |
Category | Maths |
Level | University |
Created / Updated | 17.01.2025 / 04.02.2025 |
Weblink |
https://card2brain.ch/box/20250117_staddi
|
Embed |
<iframe src="https://card2brain.ch/box/20250117_staddi/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Wann ist ein Modell identifizierbar?
wenn die Anzahl verfügbarer Informationen ausreichen, um die Anzahl unbekannter Parameter zu schätzen
6 Schritte d. konfirmatorischen Faktorenanalyse?
1. Spezifikation des Modells (wie soll es aussehen?)
2. Prüfung d. Identifizierbarkeit (kann ich die Modellparameter berechnen?)
3. Schätzung d. Modellparameter
4. Überprüfung d. Modellgüte/ -gültigkeit
5. ggf. Modellmodifikation
6. ggf. Vergleich verschiedener Modelle
Was gilt allgemein für mehrdimensionale Modelle?
- eine manifeste Variable kann Indikator für eine oder mehrere latente Variablen sein. (latente Variablen beeinflussen die Ausprägung auf der beobachteten Variablen. Beobachtete Variablen "laden" auf der latenten Variable/ dem Faktor)
- es kann mehrere sinnvolle und passende Modelle geben, die Beziehungen zwischen latenten und manifesten Variablen darzustellen. (wenn 2 Faktoren zum gleichen Item zeigen: hier sind standardisierte quadrierte Ladungen dann NICHT mehr äquivalent zu R^2, und die standardisierte Ladung NICHT mehr äquivalent zur Korrelation)
-> Modell sollte theoriegeleitet formuliert sein
- je nach Forschungsfrage kann das eine oder andere Modell sinvoller sein. Über Modellanpassungstests muss aber gezeigt werden, dass das Modell die Daten adäquat beschreibt.
Was machen Strukturgleichungsmodelle?
Untersuchen komplexe Beziehungen zwischen latenten Variablen unter Berücksichtigung der Beziehung von latenten Variablen und ihren Indikatoren
Was macht die konfirmatorische Faktorenanalyse?
Stellt die Beziehung von latenten Variablen und ihren Indikatoren dar. Es gibt Hypothesen über die zugrundeliegenden latenten Variablen und ihre Beziehungen zu den beobachteten Variablen. Diese sollen überprüft werden.
Wie wird lambda auch genannt?
Diskriminationskoeffizient/-Parameter
(Faktor)-ladung
Welches sind die drei Axiome der Messfehlertheorie?
- Messfehler ist unsystematisch (mal wird über-, mal unterschätzt)- Über viele Personen hinweg ist Erwartungswert (=Mittelwert) der Messfehlervariablen = 0- Messfehlervariable und true-score-Variable sind unkorreliert
Womit beschäftigt sich die Messfehlertheorie?
Mit der Beziehung zwischen Indikatoren/manifesten Variablen und Ausprägungen der latenten Variablen.
(Latente Variable = manifeste Variable+Messfehler)
Def Korrelationskoeffizient
Das am Verhältnis der Streuungen beider Merkmale standardisierte Regressionsgewicht (rxy = b1*sx/sy)
Je enger der ZUsammenhang, desto genauere Vorhersagen des Kriteriums durch den Prädiktor möglich
Funktion log Reg als Logit
Siehe Bild
Funktion log Reg als Wettquotient/ Odds Ratio
Siehe Bild
Funktion log Reg als bedingte Wahrscheinlichkeiten
Siehe Bild
Was ist für die drei Darstellungsweisen der logistischen Regression gleich, was unterschiedlich?
Gleich: Regressionsparameter
Unterschiedlich:
- Form der Funktion zwischen Präds und Krit
- Interpretation der Regressionsparameter
Was wird bei einfacher logistischen Regression untersucht?
Ob die Wahrscheinlichkeit für jede der beiden AV-Kategorien von der Ausprägung der Prädiktorvariablen abhängt. (Bsp ist die Wahrscheinlichkeit, die Klausur zu bestehen, abhängig von Lernzeit?)
Wozu ist die Kovarianzanalyse eine sinnvolle Methode?
Um die Fehlervarianz in experimentellen Studien aufgrund unsystematischer Störvariablen (=Kovariaten) zu reduzieren und damit die Power zu erhöhen
Welche Probleme gibt es bei der Annahme der Messfehlerfreiheit der UVs in der Kovarianzanalyse?
Die Verletzung dieser Annahme, die auch sonst bei Regressionsanalysen gilt, ist hier besonders schwerwiegend:
- Regkoeffs werden verzerrt geschätzt und damit die adjustierten Mittelwerte falsch berechnet. Das ist deswegen so, weil das Reggewicht der Kovariaten "zu klein" geschätzt wird. Ein Teil der Varianz, die auf die Kovariate zurückgeht, wird auf die kategoriale Variable übertragen
Definition Konfidenzintervall
Bereich um einen geschätzten Populationsparameter, für den gilt, dass er mit einer WS von 1-alpha den Populationsparameter überdeckt
Welche Tests werden über (mit Annahme der?) ChiQuadrat-Verteilung gemacht?
Abweichungen zwischen mehreren erwarteten und beobachteten Häufigkeiten
Welche Tests werden über (mit Annahme der?) F-Verteilung gemacht?
Varianzanalyse, Test von R^2
Welche Tests werden über die (mit Annahme der?) t-Verteilung gemacht?
t-Test für unabhängige SP, t-Test für abhängige SP, Regressionskoeffizienten
Standardfehler ist Standardabweichung welcher Verteilung?
Stichprobenkennwerteverteilung
Bezeichnung für Stichproben-Parameter
Lateinisch
Bezeichnung für aus SP Daten geschätzte Populationsparameter
Griechisch mit Dach
Bezeichnung tatsächliche Populationsparameter
Griechisch
Was ist die AV, was die UVs, wenn man ein mehrdimensionales Modell als multiple Regressionsmodell schreibt?
Wie sieht die Gleichung bspw aus?
AVs = manVar
UVs = Faktoren
Yi = ai + lambdai1*n1 + lambdai2*n2 + ... + lambdaij*nj+...+lambaik*nk + Ei (alles griechisch)
Was fasst die Residualvariable zusammen?
unsystematischer Fehler + variablenspezifischer Anteil = E(griechisch)
Formel = 1?
standardisierte Fehlervarianz + quadrierte standardisierte Faktorladung = 1
Welches sind die 4/5 Punkte, die das Modell nach Spezifikation enthalten sollte? (Schritt 1)
- Anzahl der Faktoren
- Ladungsstruktur: Beziehung der beobachteten Variablen zu den Faktoren
- Korrelationen der Faktoren miteinander und evtl der Residualvariablen (miteinander)
- Fixierungen
- ggf weitere Restriktionen
Wann ist ein Modell identifizierbar (gehört zum Schritt 2), d.h. entweder im Endeffekt idenfifiziert oder überidentifiziert?
Wenn die Anzahl verfügbarer Informationen (man.Var.-Varianzen und deren Kovarianzen) ausreichen, um die Anzahl unbekannter Parameter (Faktorvarianzen, Fehlervarianzen, Ladungen, Korrelationen zwischen Faktoren) zu schätzen.
Identifizierbarkeit verbessert sich durch Hinzunahme weiterer manVar,
verschlechtert sich durch Hinzunahme weiterer latVar
Term für die Berechnung der verfügbaren Information
p * (p+1) / 2
p = Anzahl d. manifesten Variablen
Wie ergeben sich die Freiheitsgrade zur Überprüfung der Identifizierbarkeit?
Anzahl bekannte Infos - Anzahl zu schätzende Parameter
Welche Modellparameter kann ich fixieren?
- Faktorladungen (eine pro Faktor)
- Faktorvarianz aller Faktoren
Was ist Fixierung?
Möglichkeit, die Anzahl unbekannter Parameter zu senken (falls unteridentifiziert) und notwendig, damit das Modell eine Metrik erhält. = Die Festlegung der Skalierung der latenten Variablen. Erst dadurch wird das Modell eindeutig identifizierbar.
Dabei wird Faktorladung oder Faktorvarianz auf 1 (oder anderen beliebigen Wert) gesetzt.
Was ist Restriktion?
Behauptung über das Modell, die durch die Daten empirisch prüfbar ist. Sie ist eine Information, zb aus der Literatur, die ich meinem Modell auferlegen kann und mit der die Anzahl an zu schätzenden Parametern sinkt. Wenn Daten zur Restriktion im Widerspruch stehen, beeinflusst das die Modellpassung (negativ)
Wie werden die Modellparameter auf Basis der vorliegenden Daten geschätzt? (Schritt 3)
So, dass sie
a) die Modellrestriktionen erfüllen
b) die modelliplizierte Varianz-Kovarianz-Matrix der datenbasierten Varianz-Kovarianz-Matrix möglichst ähnlich ist (Residual-Varianz-Kovarianz-Matrix sehr geringe Werte hat)
Am verbreitetsten für die Schätzung der Parameter: Maximum-Likelihood-Schätzung (erst danach wird dann geprüft, ob die Residual-Matrix sign abweicht)
Auf welche drei Bereiche können sich Maße zur Modellanpassungsgütebeurteilung beziehen?
1) Detailmaße (Residuen, standardisierte Residuen)
2) Gesamtmaße (gesamtes Modell) ((S)RMSR, Chi2, CFI, TLI, informationstheoretische Maße (AIC, CAIC), RMSEA)
3) Modellvergleiche (CHi2-Differenzen-Test, informationstheoretische Maße (AIC, CAIC)
Was macht der Chi2 Test als Gesamtmaß der Modellgüte?
Prüft die Wahrscheinlichkeit für die beobachtete Matrix, wenn in Population die modellimplizierte vorläge. Soll nicht signifikannt werden!
Welches sind inkrementelle Fit-Indizes, worauf beziehen sie sich, und wie sollen sie sein für ein Modell, das gut auf die Daten passt?
sind approximat-fit-statistik (beispiele: CFI, Tucker-Lewis-Index)beziehen sich auf das ganze Modell: Wieviel besser ist mein Modell als ein Baseline Modell, bei dem alle Variablen unabhängig sind?Sollen sehr groß werden (über .97) (alle alle anderen Indizes für die Modellgüte sollen eher kleiner sein)