PWA
WS 2019
WS 2019
Fichier Détails
Cartes-fiches | 47 |
---|---|
Langue | Deutsch |
Catégorie | Psychologie |
Niveau | Université |
Crée / Actualisé | 22.01.2020 / 22.01.2020 |
Lien de web |
https://card2brain.ch/box/20200122_pwa
|
Intégrer |
<iframe src="https://card2brain.ch/box/20200122_pwa/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
MNAR
Die Wahrscheinlichkeit, dass Daten fehlen, hängen (auch) von nicht beobachteten (=nicht im statistischen Modell) Daten ab.
In diesem Fall sind die Ergebnisse der Inferenzstatistischen Analyse verzerrt.
Möglicher Umgang mit fehlenden Werte
verwendet nur vollständige Datensätze
ersetzt fehlende Werte durch Schätzungen aus den vorhandenen Werten (Imputation):
- LOCF
- Mittelwerte
- Regressionsmodell
Statistische Modelle, die alle vorhandenen Daten nutzen, aber fehlende Daten nicht ersetzen (Maxumu - Likelihood - Schätzungen)
Verwendung vollständiger Datensätze
Das Vorgehen ist nur bei MCAR Daten korrekt. Jedoch kommt es dabei zu einer Reduktion der statistischen Power durch Reduktion der Stichprobengröße.
LOCF
In Zeitreihen werden fehlende Werte durch den letzten zuvor gemessenen Messwert erstzt.
Diese Methode führt bei allen Arten von Prozessen von fehlenden Werten zu Verzerrungen, wenn man davon ausgehen muss, dass es zu zeitlichen Veränderungen kommt.
Durch den Mittelwert anderer Items ersetzen
Diese Variante wird meist verwendet wenn einzelne Items einer Skala nicht ausgefüllt werden.
Berechnet den Skalenwert aus dem Mittelwert der vorhandenen Items.
In Zeitreihen wird fehlende Wert (wenn möglich) durch den Mittelwert der vorangegangenen und nachherigen Messung ersetzt.
Schätzungen durch Regressionsmodell
Hierbei wird anhand des Datensatzes für jede Variable das beste Regressionsmodell zur Schätzung der fehlenden Variablen ermittelt.
Darf davon ausgehen, dass das Vorgehen bei MCAR und MAR Daten keine systematischen Verzerrungen bewirkt.
Multiple Imputation
pro fehlendem Werte nicht nur ein Schätzwert, sondern mehrere berechnet werden, sodass zahlreiche Datensätze resultieren. Die statistische Analyse erfolgt dann an allen Datensätzen und die resultierenden p-Werte werden gemittelt.