Lernkartei PHB Statistik Klausurvorbereitung

Karten	100
Lernende	11
Sprache	Deutsch
Kategorie	Psychologie
Stufe	Universität
Erstellt / Aktualisiert	06.02.2019 / 12.02.2024
Weblink	https://card2brain.ch/box/20190206_phb_statistik_klausurvorbereitung
Einbinden	<iframe src="https://card2brain.ch/box/20190206_phb_statistik_klausurvorbereitung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was beschreibt diese Funktion? Definiere sie kurz.

Bedingte Wettquoptientenfunktion: Die Chance, dass die AV Y den Wert 1 (im Vergleich zum Wert 0) annimmt, variiert als Funktion der UV X

Beispiel: Hängt die Chance (bzw. der Wettquotient), schon einmal Tiere gequält zu haben, von der Empathiefähigkeit ab?

Was beschreibt diese Funktion? Definiere Sie kurz.

Bedingte Logitfunktion: Logit = logarithmierter Wettquotient bzw. Chance

Beispiel: Hängt der Logit (d.h. der logarithmierte Wettquotient), schon einmal Tiere gequält zu haben, von der Empathiefähigkeit ab?

Erkläre kurz die Bedeutung des Parameter e�� 1 des bedingten Wettquotienten

Der Parameter e^��1 gibt die Veränderung der Chance an, wenn die UV um eine Einheit erhöht wird

Er entspricht einem Wettquotientenverhältnis („odds ratio“), d.h. dem Faktor, um den sich die Chance bei Zunahme der UV (um eine Einheit) verändert.

Bei ��1 > 0 (d.h. ��1 > 1) ist der Zusammenhang zwischen X und Y positiv
Bei ��1 < 0 (d.h. ��1 < 1) ist der Zusammenhang zwischen X und Y negativ
Bei ��1 = 0 (d.h. ��1 = 1) gibt es keinen Zusammenhang zwischen X und Y

Beschreibe die Bedeutung des Parameter e��0 der bedingten Wettquotientenfunktion

Der Parameter ��0 entspricht der Chance, dass Y den Wert 1 (im Vergleich zum Wert 0) annimmt, wenn X gleich 0 ist

Bei ��0 > 0 (d.h. ��0 > 1) ist die Wahrscheinlichkeit 0 für Y = 1 größer als für Y = 0 (d.h. größer 0.5)
Bei �� < 0 (d.h. ��0 < 1) ist die Wahrscheinlichkeit für Y = 1 kleiner als für Y = 0 (d.h. kleiner 0.5)
Bei �� = 0 (d.h. ��0 = 1) ist die Wahrscheinlichkeit für Y = 1 und Y = 0 gleich (d.h. gleich 0.5)

Wie werden die Parameter in der logistischen Regression geschätzt?

Die Parameter (d.h. die Regressionskoeffizenten) sowie ihre Standardfehler werden mit der Maximum- Likelihood-Methode geschätzt

Einzelne Parameter können mit dem z-Test, Wald-Test oder Likelihood-Ratio-Test auf Signifikanz geprüft werden

Mehrere oder alle Parameter können mit dem multivariaten Wald-Test oder dem Likelihood-Ratio- Test auf Signifikanz geprüft werden

Wie kann die Modellgüte in der logistischen Regression bestimmt werden?

Mc-Fadden-Index

Cox-Snell-Index

Nagelkerke-Index

Wie berechne und beurteile ich die Trefferquote in der logistischen Regression?

Die logistische Regression kann auch zur Klassifikation von Personen herangezogen werden
Hierzu werden anhand der Regressionsgleichung und der Werte der UVs die Wahrscheinlichkeiten geschätzt, mit der für eine Person die beiden Kategorien der AV jeweils zutreffen
Die Person wird dann der Klasse von Personen (bzw. der Ausprägung der AV) zugeordnet, für die ihre Wahrscheinlichkeit maximal ist
Die Güte einer Klassifikation wird anhand der Trefferquote beurteilt, d.h. anhand dem Anteil der Personen, die richtig klassifiziert wurden
Die Trefferquote sollte vor dem Hintergrund der Trefferquote eines Modells ohne UVs, d.h. der relativen Häufigkeiten der beiden Kategorien beurteilt werden
Die Trefferquote sollte im Sinne der Kreuzvalidierung in einer neuen Stichprobe bestimmt werden (d.h. möglichst nicht in der Stichprobe, in der die Regressionsparameter geschätzt wurden)

Warum wird eine Pfadanalyse durchgeführt?

bisher: Variable ist entweder AV oder UV -> Psychologische Theorien sind komplexer, daher Entwicklung der Pfadanalyse in der Variablen sowohl AV als auch UV sind

Pfadanalyse: Erweiterung der multiplen Regressionsanalyse -> System von Regressionsmodellen, ermöglicht die Prüfung kompplexer Zusammenhangsstrukturen

Welche Typen von Variablen gibt es in der Pfadanalyse?

Exogene Variablen: Unabhängige Variablen, die im Modell nicht erklärt werden (d.h. auf die kein Pfeil trifft und für die keine eigene Regressionsgleichung nötig ist)

Endogene Variablen: Abhängige Variablen, die im Modell erklärt werden (d.h. auf die mindestens ein Pfeil trifft und für die eine eigene Regressionsgleichung nötig ist)

Mediatorvariablen: Endogene Variablen, die eine Kausalkette zwischen zwei anderen Variablen herstellen, d.h. die zugleich AV und UV sind

Welche Typen von Effekten gibt es in der Pfadanalyse?

Direkter Effekt: Effekt einer UV auf eine AV, der nicht über andere Variablen vermittelt wird

repräsentiert durch einen einzelnen Pfadkoeffizienten

Indirekter Effekt: Effekt einer UV auf eine AV, der über eine oder mehrere Mediatorvariablen vermittelt wird

repräsentiert durch das Produkt aus Pfadkoeffizienten

Totaler Effekt: Gesamteffekt einer UV auf eine AV

repräsentiert durch die Summe aus direktem Effekt und indirekten Effekten

Was sind autoregressive Modelle? Erkläre den Unterschied zwischen dem Modell 1. und 2. Ordnung.

autoregressiv = auf sich selbst zurückgehend

Autoregressive Modelle prüfen, ob die Unterschiede in einem Merkmal zu einem späteren Messzeitpunkt durch Unterschiede in einem früheren Messzeitpunkt durch Unterschiede in einem früheren Messzeitpunkt vorhergesagt werden können.

AR 1. Ordnung: frühere Messzeitpunkte haben keine direkten (sondern höchstens indirekte) Effekte

AR 2. Ordnung: Die zu erklärende Variable zu einem Messzeitpunkt hängt direkt von mehreren Messzeitpunkten ab (Mediationsmodelle)

Wie kann man indirekte Effekte in der Pfadanalyse prüfen?

Indirekte (und totale) Effekte setzen sich aus Produkten von Pfadkoeffizienten zusammen und werden in lavaan (und anderen Programmen) nicht automatisch auf Signifikanz geprüft
Hierzu muss der indirekte (und ggf. der totale) Effekt in der Modellspezifikation ergänzt werden
Da die Stichprobenkennwerteverteilung des indirekten Effekts nicht zwangsläufig symmetrisch ist, wird empfohlen, die Signifikanz anhand von bootstrapping-basierten Konfidenzintervallen zu bestimmen

Wozu verwendet man lineare Strukturgleichungsmodelle?

bisherige Annahme in Regressions- und Pfadanalysen: messfehlerfreie Variablen -> dies ist in psychologischer Forschung allerdings unlogisch

Lineare Strukturgleichungsmodelle (SEM) erlauben es, messfehlerbedingte von wahren Einflüssen zu trennen

SEM stellen Kombination aus Faktoren- und Pfadanalyse dar

Definiere und nenne die Unterschiede von Messmodellen und Strukturmodellen

Messmodell: AVs sind beobachtbar, Um Messfehler von wahren Effekten zu trennen, braucht man mindestens zwei Indikatoren (beobachtete Varianlen) pro Konstrukt (latenter Variable)

Strukturmodell: AVs sind latent, die Gleichungen entsprechen strukturell den Gleichungen zum Pfadmodell mit direktem und indirektem Effekt

Nenne die 4 Schritte der Schätzung eines linearen Strukturgleichungsmodells

Schätzung eines faktorenanalytischen Basismodells
Prüfung der Messinvarianz über die Zeit
Prüfung der Homogenität der Indikatoren
Prüfung des Strukturmodells

Mit welcher Frage beschäftigt sich die Inferenzstatistik?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Inferenzstatistik beschäftigt sich mit der Frage, wie man aufgrund von Stichprobendaten auf Sachverhalte in einer zugrunde liegenden Population schließen kann („schließende Statistik“)

Was ist die Stichprobenkennwerteverteilung und wie wird sie erzeugt?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Die Stichprobenkennwerteverteilung ist die Wahrscheinlichkeitsverteilung von Stichprobenkennwerten (z.B. ��) aus zufällig gezogenen Stichproben der Größe n.

Die theoretische Stichprobenkennwerte-verteilung des Mittelwerts ist bekannt und wird i.d.r. anhand von Formeln bestimmt.

Was besagt der Zentrale Grenzwertsatz?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Die Stichprobenkennwerte- verteilung der Mittelwerte nähert sich mit zunehmender Stichprobengröße der Normalverteilung an, unabhängig davon, wie das Merkmal in der Population verteilt ist.

Die Stichprobe sollte mindestens n = 30

Nenne und erkläre kurz die 4 Gütekriterien der Parameterschätzung.

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Erwartungstreue: gegeben, wenn der Erwartungswert der Stichprobenkennwerteverteilung dem Parameter entspricht

Konsistenz: gegeben, wenn sich der Stichprobenkennwert mit wachsender Stichprobengröße dem Parameter nähert

Effizienz: gegeben, wenn der Stichprobenkennwert den geringsten Standardfehler aller erwartungstreuen Schätzer aufweist

Suffizienz: gegeben, wenn der Stichprobenkennwert alle in den Daten enthaltenen Informationen (hinsichtlich des Parameters) berücksichtigt

Was versteht man unter dem Nullhypothesentest?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Die Annahme der Nullhypothese (H0) besagt, dass in der Population kein Effekt (z.B. Unterschied oder Zusammenhang) besteht

Was besagt der p-Wert?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Wahrscheinlichkeit, ein empirisches Ergebnis (oder ein noch stärker gegen die Nullhypothese sprechendes Ergebnis) unter der Nullhypothese zu finden

Formal handelt es sich um die bedingte Wahrscheinlichkeit p = P(E|H0)

Was besagt die Irrtumswahrscheinlichkeit α ?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Wahrscheinlichkeit, mit der ein Test ein „signifikantes“ Ergebnis ergibt, obwohl in Wirklichkeit die Nullhypothese gilt („Fehler erster Art“), Spezifität

definiert als Flächenanteil unter der H0-Verteilung

wird a priori vom Forscher festgelegt (konventionell auf 5%)

Was ist ein Konfidenzintervall (KI) und wie kann es berechnet werrden?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Bereich um einen geschätzten Populationsparameter, für den gilt, dass er mit einer Wahrscheinlichkeit von 1 - α den Populationsparameter enthält

Berechnung anhand des (geschätzten) Standardfehlers

Was besagt der Konfidenzkoeffizient (1 – α) von z.B. .95 ?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

wenn man (unendlich) viele Zufallsstichproben gleicher Größe aus der Population ziehen würde und
für jede Stichprobe das KI berechnen würde,
in 95 % aller KI der unbekannte Populationsparameter zu finden ist,
in 5 % der KI hingegen nicht

Was ist der Konfidenzkoeffizient?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

ein Flächenanteil unter der Stichprobenkennwerteverteilung

Was führt der Befehl colnames(dat[,1:10]) aus?

Zeige nur die Variablennamen der Spalten 1-10

Welche Unterscheidungsmerkmale statistischer Tests gibt es?

• Exakte vs. asymptotische Tests
• Parametrische vs. nonparametrische (verteilungsfreie) Tests

• robuste Verfahren
• Resampling-Verfahren

Was unterscheidet exakten von asymptotischen Tests?

Bei einem exakten Test folgt die Prüfgröße „exakt“ der zugrunde gelegten Verteilung (sofern die Voraussetzungen des Tests erfüllt sind)
Bei einem asymptotischen Test folgt die Prüfgröße der zugrunde gelegten Verteilung „asymptotisch“, d.h. ihre Verteilung nähert sich der zugrunde gelegten Verteilung mit zunehmender Stichprobengröße an
– Je kleiner die Stichprobe, desto größer der zu erwartende Fehler, den man begeht

Was unterscheidet parametrische Tests von nonparametrischen Tests?

Parametrische Tests setzen voraus, dass das Merkmal in der Population in einer spezifischen Weise verteilt ist (z.B. Normalverteilung)

Nonparametrische Tests machen keine Annahmen zur Verteilung des Merkmals in der Population

Nenne die Voraussetzungen des t--Tests für unabhängige Stichproben

Zwei unabhängige Stichproben
Normalverteilte Variablen in den zugrundeliegenden Populationen
Varianzen der Variablen innerhalb der beiden Populationen sind gleich (Homoskedastizität)

PHB Statistik Klausurvorbereitung

Lernkarteien erstellen oder kopieren

Lernkarteien erstellen oder kopieren

Melde dich an, um alle Karten zu sehen.

SWITCHaai

Office 365

Edulog

Apple ID

Google