PHB Statistik Klausurvorbereitung
Zusammenfassung mögliche Klausurinhalte
Zusammenfassung mögliche Klausurinhalte
Kartei Details
Karten | 100 |
---|---|
Lernende | 11 |
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 06.02.2019 / 12.02.2024 |
Weblink |
https://card2brain.ch/box/20190206_phb_statistik_klausurvorbereitung
|
Einbinden |
<iframe src="https://card2brain.ch/box/20190206_phb_statistik_klausurvorbereitung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Lernkarteien erstellen oder kopieren
Mit einem Upgrade kannst du unlimitiert Lernkarteien erstellen oder kopieren und viele Zusatzfunktionen mehr nutzen.
Melde dich an, um alle Karten zu sehen.
Erkläre kurz die Bedeutung des Parameter e�� 1 des bedingten Wettquotienten
Der Parameter e��1 gibt die Veränderung der Chance an, wenn die UV um eine Einheit erhöht wird
Er entspricht einem Wettquotientenverhältnis („odds ratio“), d.h. dem Faktor, um den sich die Chance bei Zunahme der UV (um eine Einheit) verändert.
- Bei ��1 > 0 (d.h. ����1 > 1) ist der Zusammenhang zwischen X und Y positiv
- Bei ��1 < 0 (d.h. ����1 < 1) ist der Zusammenhang zwischen X und Y negativ
- Bei ��1 = 0 (d.h. ����1 = 1) gibt es keinen Zusammenhang zwischen X und Y
Beschreibe die Bedeutung des Parameter e��0 der bedingten Wettquotientenfunktion
Der Parameter ����0 entspricht der Chance, dass Y den Wert 1 (im Vergleich zum Wert 0) annimmt, wenn X gleich 0 ist
- Bei ��0 > 0 (d.h. ����0 > 1) ist die Wahrscheinlichkeit 0 für Y = 1 größer als für Y = 0 (d.h. größer 0.5)
- Bei �� < 0 (d.h. ����0 < 1) ist die Wahrscheinlichkeit für Y = 1 kleiner als für Y = 0 (d.h. kleiner 0.5)
- Bei �� = 0 (d.h. ����0 = 1) ist die Wahrscheinlichkeit für Y = 1 und Y = 0 gleich (d.h. gleich 0.5)
Wie werden die Parameter in der logistischen Regression geschätzt?
Die Parameter (d.h. die Regressionskoeffizenten) sowie ihre Standardfehler werden mit der Maximum- Likelihood-Methode geschätzt
Einzelne Parameter können mit dem z-Test, Wald-Test oder Likelihood-Ratio-Test auf Signifikanz geprüft werden
Mehrere oder alle Parameter können mit dem multivariaten Wald-Test oder dem Likelihood-Ratio- Test auf Signifikanz geprüft werden
Wie kann die Modellgüte in der logistischen Regression bestimmt werden?
Mc-Fadden-Index
Cox-Snell-Index
Nagelkerke-Index
Wie berechne und beurteile ich die Trefferquote in der logistischen Regression?
- Die logistische Regression kann auch zur Klassifikation von Personen herangezogen werden
- Hierzu werden anhand der Regressionsgleichung und der Werte der UVs die Wahrscheinlichkeiten geschätzt, mit der für eine Person die beiden Kategorien der AV jeweils zutreffen
- Die Person wird dann der Klasse von Personen (bzw. der Ausprägung der AV) zugeordnet, für die ihre Wahrscheinlichkeit maximal ist
- Die Güte einer Klassifikation wird anhand der Trefferquote beurteilt, d.h. anhand dem Anteil der Personen, die richtig klassifiziert wurden
- Die Trefferquote sollte vor dem Hintergrund der Trefferquote eines Modells ohne UVs, d.h. der relativen Häufigkeiten der beiden Kategorien beurteilt werden
- Die Trefferquote sollte im Sinne der Kreuzvalidierung in einer neuen Stichprobe bestimmt werden (d.h. möglichst nicht in der Stichprobe, in der die Regressionsparameter geschätzt wurden)
Warum wird eine Pfadanalyse durchgeführt?
bisher: Variable ist entweder AV oder UV -> Psychologische Theorien sind komplexer, daher Entwicklung der Pfadanalyse in der Variablen sowohl AV als auch UV sind
Pfadanalyse: Erweiterung der multiplen Regressionsanalyse -> System von Regressionsmodellen, ermöglicht die Prüfung kompplexer Zusammenhangsstrukturen
Welche Typen von Variablen gibt es in der Pfadanalyse?
Exogene Variablen: Unabhängige Variablen, die im Modell nicht erklärt werden (d.h. auf die kein Pfeil trifft und für die keine eigene Regressionsgleichung nötig ist)
Endogene Variablen: Abhängige Variablen, die im Modell erklärt werden (d.h. auf die mindestens ein Pfeil trifft und für die eine eigene Regressionsgleichung nötig ist)
- Mediatorvariablen: Endogene Variablen, die eine Kausalkette zwischen zwei anderen Variablen herstellen, d.h. die zugleich AV und UV sind
Welche Typen von Effekten gibt es in der Pfadanalyse?
Direkter Effekt: Effekt einer UV auf eine AV, der nicht über andere Variablen vermittelt wird
- repräsentiert durch einen einzelnen Pfadkoeffizienten
Indirekter Effekt: Effekt einer UV auf eine AV, der über eine oder mehrere Mediatorvariablen vermittelt wird
- repräsentiert durch das Produkt aus Pfadkoeffizienten
Totaler Effekt: Gesamteffekt einer UV auf eine AV
- repräsentiert durch die Summe aus direktem Effekt und indirekten Effekten
Was sind autoregressive Modelle? Erkläre den Unterschied zwischen dem Modell 1. und 2. Ordnung.
autoregressiv = auf sich selbst zurückgehend
Autoregressive Modelle prüfen, ob die Unterschiede in einem Merkmal zu einem späteren Messzeitpunkt durch Unterschiede in einem früheren Messzeitpunkt durch Unterschiede in einem früheren Messzeitpunkt vorhergesagt werden können.
AR 1. Ordnung: frühere Messzeitpunkte haben keine direkten (sondern höchstens indirekte) Effekte
AR 2. Ordnung: Die zu erklärende Variable zu einem Messzeitpunkt hängt direkt von mehreren Messzeitpunkten ab (Mediationsmodelle)
Wie kann man indirekte Effekte in der Pfadanalyse prüfen?
- Indirekte (und totale) Effekte setzen sich aus Produkten von Pfadkoeffizienten zusammen und werden in lavaan (und anderen Programmen) nicht automatisch auf Signifikanz geprüft
- Hierzu muss der indirekte (und ggf. der totale) Effekt in der Modellspezifikation ergänzt werden
- Da die Stichprobenkennwerteverteilung des indirekten Effekts nicht zwangsläufig symmetrisch ist, wird empfohlen, die Signifikanz anhand von bootstrapping-basierten Konfidenzintervallen zu bestimmen
Wozu verwendet man lineare Strukturgleichungsmodelle?
bisherige Annahme in Regressions- und Pfadanalysen: messfehlerfreie Variablen -> dies ist in psychologischer Forschung allerdings unlogisch
Lineare Strukturgleichungsmodelle (SEM) erlauben es, messfehlerbedingte von wahren Einflüssen zu trennen
- SEM stellen Kombination aus Faktoren- und Pfadanalyse dar
Definiere und nenne die Unterschiede von Messmodellen und Strukturmodellen
Messmodell: AVs sind beobachtbar, Um Messfehler von wahren Effekten zu trennen, braucht man mindestens zwei Indikatoren (beobachtete Varianlen) pro Konstrukt (latenter Variable)
Strukturmodell: AVs sind latent, die Gleichungen entsprechen strukturell den Gleichungen zum Pfadmodell mit direktem und indirektem Effekt
Nenne die 4 Schritte der Schätzung eines linearen Strukturgleichungsmodells
- Schätzung eines faktorenanalytischen Basismodells
- Prüfung der Messinvarianz über die Zeit
- Prüfung der Homogenität der Indikatoren
- Prüfung des Strukturmodells
Mit welcher Frage beschäftigt sich die Inferenzstatistik?
Inferenzstatistik beschäftigt sich mit der Frage, wie man aufgrund von Stichprobendaten auf Sachverhalte in einer zugrunde liegenden Population schließen kann („schließende Statistik“)
Was ist die Stichprobenkennwerteverteilung und wie wird sie erzeugt?
Was besagt der Zentrale Grenzwertsatz?
Die Stichprobenkennwerte- verteilung der Mittelwerte nähert sich mit zunehmender Stichprobengröße der Normalverteilung an, unabhängig davon, wie das Merkmal in der Population verteilt ist.
Die Stichprobe sollte mindestens n = 30
Nenne und erkläre kurz die 4 Gütekriterien der Parameterschätzung.
Erwartungstreue: gegeben, wenn der Erwartungswert der Stichprobenkennwerteverteilung dem Parameter entspricht
Konsistenz: gegeben, wenn sich der Stichprobenkennwert mit wachsender Stichprobengröße dem Parameter nähert
Effizienz: gegeben, wenn der Stichprobenkennwert den geringsten Standardfehler aller erwartungstreuen Schätzer aufweist
Suffizienz: gegeben, wenn der Stichprobenkennwert alle in den Daten enthaltenen Informationen (hinsichtlich des Parameters) berücksichtigt
Was versteht man unter dem Nullhypothesentest?
Die Annahme der Nullhypothese (H0) besagt, dass in der Population kein Effekt (z.B. Unterschied oder Zusammenhang) besteht
Was besagt der p-Wert?
Wahrscheinlichkeit, ein empirisches Ergebnis (oder ein noch stärker gegen die Nullhypothese sprechendes Ergebnis) unter der Nullhypothese zu finden
Formal handelt es sich um die bedingte Wahrscheinlichkeit p = P(E|H0)
Was besagt die Irrtumswahrscheinlichkeit α ?
Wahrscheinlichkeit, mit der ein Test ein „signifikantes“ Ergebnis ergibt, obwohl in Wirklichkeit die Nullhypothese gilt („Fehler erster Art“), Spezifität
definiert als Flächenanteil unter der H0-Verteilung
wird a priori vom Forscher festgelegt (konventionell auf 5%)
Was ist ein Konfidenzintervall (KI) und wie kann es berechnet werrden?
Bereich um einen geschätzten Populationsparameter, für den gilt, dass er mit einer Wahrscheinlichkeit von 1 - α den Populationsparameter enthält
Berechnung anhand des (geschätzten) Standardfehlers
Was besagt der Konfidenzkoeffizient (1 – α) von z.B. .95 ?
- wenn man (unendlich) viele Zufallsstichproben gleicher Größe aus der Population ziehen würde und
- für jede Stichprobe das KI berechnen würde,
- in 95 % aller KI der unbekannte Populationsparameter zu finden ist,
- in 5 % der KI hingegen nicht
Was ist der Konfidenzkoeffizient?
ein Flächenanteil unter der Stichprobenkennwerteverteilung
Was führt der Befehl colnames(dat[,1:10]) aus?
Zeige nur die Variablennamen der Spalten 1-10
Welche Unterscheidungsmerkmale statistischer Tests gibt es?
• Exakte vs. asymptotische Tests
• Parametrische vs. nonparametrische (verteilungsfreie) Tests
• robuste Verfahren
• Resampling-Verfahren
Was unterscheidet exakten von asymptotischen Tests?
Bei einem exakten Test folgt die Prüfgröße „exakt“ der zugrunde gelegten Verteilung (sofern die Voraussetzungen des Tests erfüllt sind)
Bei einem asymptotischen Test folgt die Prüfgröße der zugrunde gelegten Verteilung „asymptotisch“, d.h. ihre Verteilung nähert sich der zugrunde gelegten Verteilung mit zunehmender Stichprobengröße an
– Je kleiner die Stichprobe, desto größer der zu erwartende Fehler, den man begeht
Was unterscheidet parametrische Tests von nonparametrischen Tests?
Parametrische Tests setzen voraus, dass das Merkmal in der Population in einer spezifischen Weise verteilt ist (z.B. Normalverteilung)
Nonparametrische Tests machen keine Annahmen zur Verteilung des Merkmals in der Population
Nenne die Voraussetzungen des t--Tests für unabhängige Stichproben
- Zwei unabhängige Stichproben
- Normalverteilte Variablen in den zugrundeliegenden Populationen
- Varianzen der Variablen innerhalb der beiden Populationen sind gleich (Homoskedastizität)
-
- 1 / 100
-