Premium Partner

Statistik VL Klausurvorbereitung

bla

bla


Kartei Details

Karten 11
Sprache Deutsch
Kategorie Psychologie
Stufe Universität
Erstellt / Aktualisiert 25.03.2019 / 27.03.2019
Lizenzierung Keine Angabe
Weblink
https://card2brain.ch/box/20190325_statistik_vl_klausurvorbereitung
Einbinden
<iframe src="https://card2brain.ch/box/20190325_statistik_vl_klausurvorbereitung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Wie ist das Konfidenzintervall definiert?

Was sind Ausreißer und wie identifiziert man diese auf UV und AV? 

Ausreißer sind Werte die sich stark von restlichen Werten unterscheiden und somit zu Verzerrungen führen können.

Identifikation von Ausreißern auf der UV: Mahalanobis-Distanz, Zentrierte Hebelwerte 

Identifikation von Ausreißern auf der AV: Verteilung der Resiudn betrachten, Absolute werte >3 sollten inspiziert werden, Bonferroni-Korrektur

Was sind einflussreiche Datenpunkte und wie identifiziert msn diese? 

Einflussreiche Datenpunkte sind Wertekombinationen einer Person, deren Entfernung aus dem Datensatz die Regressionsparameter stark verändert.

Identifikation: Änderung der Regressionskoeffizienten (DfBETA, DfBETAS), Anderung der vorhergesagten Werte (DfIT, DfITS), Cooks Distanz

Definiere Multikollinearität und nenne die Konsequenzen bei Verletzung sowie Prüfungs- und Lösungsoptionen.

Multikollinearität = Hohe multiple Korrelation einer UV mit anderen UV‘s

Prüfung: Toleranzfaktor (TOL <.10 problematisch), Varianzinflations-Faktor (VIF >10 problematisch

Lösung: Zentrierung, Eliminierung von UVs, Aggregation, Faktorenanalytische Reduktion

Was ist die Maximum-Likelihood-Methode und wie funktioniert sie? 

= iteratives (schrittweises) Verfahren zur Schätzung der Parameter

  1. Auswahl der Parameter für plausible Startwerte, Berechnung der Wahrscheinlichkeit, bei Geltung dieser Werte die beobachteten Daten zu erhalten ("Likelihood-Funktion")
  2. Parameter schrittweise verändern, dass Likelihood-Funktion immer größer wird 
  3. Das Verfahren "konvergiert" (stimmt überein), wenn die Verbesserung einen kritischen Wert unterschreitet (d.h. die Parameter gefunden wurden, bei deren Geltung die Wahrscheinlichkeit der beobachteten Daten maximal ist) 

2 Ansätze:

  1. Full-Maximum-Likelihood-FUnktion (FML, simultane Schätzung des festen und zufälligen Teils) &
  2. Restricted-Maximum-Funktion (RML, zuerst Schätzung des zufälligen Teils, dann des festen Teils) 

Warum ist die Varianzaufklärung bei Mehrebenenanalysen nicht so einfach möglich? Welche Alternativen gibt es? 

– Es gibt nicht nur eine Residualvarianz, sondern Residualvarianzen auf Ebene 1 und 2: Dadurch entstehen verschiedene Möglichkeiten, die Varianzreduktion (die durch die Hinzunahme der UV erreicht wird) zu definieren

– Die geschätzte Residualvarianz auf Ebene 2 (d.h. der Achsenabschnitte) kann (verursacht durch Stichprobenfehler) bei Hinzunahme einer UV größer werden (was zu einer scheinbar negativen inkrementellen Varianzaufklärung führen würde)

Alternativen

  • Bestimmung von "Pseudo-R2" Werten (geben an, wie groß die relative Reduktion bestimmter Varianzen durch HInzunahme von UVs ist)
  • Bestimmung des marginalen & konditionalen R2 (zur Quantifizierung der Güte des Gesamtmodells) 

Warum wird bei der logistischen Regression keine lineare Funktion verwendet? 

  • Würde man eine lineare Funktion verwenden, ergäben sich bei einer metrischen UV mit unbeschränktem Wertebereich theoretisch unmögliche Werte (d.h. bedingte Wahrscheinlichkeiten < 0 oder > 1)
  • Die Residuen von dichotomen Variablen können nicht normalverteilt sein (da es nur zwei Ausprägungen gibt)
  • Die bedingten Varianzen der Residuen hängen bei dichotomen AVs von der Ausprägung der UV ab (d.h. die Annahme der Homoskedastizität ist verletzt)

Wie werden die Parameter in der logistischen Regression geschätzt? 

Die Parameter (d.h. die Regressionskoeffizenten) sowie ihre Standardfehler werden mit der Maximum- Likelihood-Methode geschätzt

Einzelne Parameter können mit dem z-Test, Wald-Test oder Likelihood-Ratio-Test auf Signifikanz geprüft werden

Mehrere oder alle Parameter können mit dem multivariaten Wald-Test oder dem Likelihood-Ratio- Test auf Signifikanz geprüft werden