Premium Partner

Methoden der OHP

methoden A&o

methoden A&o


Kartei Details

Karten 123
Sprache Deutsch
Kategorie Scherzfragen
Stufe Universität
Erstellt / Aktualisiert 04.01.2024 / 10.01.2024
Lizenzierung Keine Angabe
Weblink
https://card2brain.ch/box/20240104_methoden_der_ohp
Einbinden
<iframe src="https://card2brain.ch/box/20240104_methoden_der_ohp/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

welches sources gibts für missing values (e.g. bei einem assessment)?

a) Item nonresponse (intermittent missing data): wenn bestimmte Elemente (Items) in einem Fragebogen oder Datensatz nicht beantwortet wurden. Es handelt sich um intermittierende, sporadische oder zufällige fehlende Werte, die bei bestimmten Variablen auftreten können.

b) Participant attrition (data present up to a specific point in time but not thereafter):

Dies bezieht sich auf die Teilnehmerfluktuation oder -abwanderung. Es tritt auf, wenn Daten bis zu einem bestimmten Zeitpunkt vorhanden sind, aber danach nicht mehr verfügbar sind, weil Teilnehmer die Studie verlassen haben oder aus anderen Gründen nicht mehr teilnehmen.

Beispiel: Example: longitudinal design with bursts of daily assessments

tägliche Bewertungen (Assessments) in bestimmten Zeiträumen durchgeführt werden, aber nicht kontinuierlich über den gesamten Studienzeitraum

how to report missing values?

a) Percentage of missing responses for each item of the measure:

Hierbei handelt es sich um die prozentuale Anzahl der fehlenden Antworten für jedes einzelne Item oder jede Variable in der Messung. Diese Information kann in einer Tabelle der Deskriptivstatistik (descriptive statistics) aufgenommen werden, wenn möglich

b) Range of missing values:

Dies bezieht sich auf den Bereich der fehlenden Werte in den Daten. Es könnte darauf hinweisen, in welchen Bereichen der Messung oder der Variable die fehlenden Werte am häufigsten auftreten. Dies kann für die Interpretation der Daten und für die Entscheidung über geeignete Imputationsstrategien (Strategien zur Behandlung fehlender Werte) relevant sein.

which patterns of missing values are possible accoring to Rubin(1976)?

a) Missing completely at random: Fehlende Werte gelten als vollständig zufällig (MCAR). Das bedeutet, dass es keine Muster oder Zusammenhänge zwischen den fehlenden Werten und den Variablen im Datensatz gibt. Die fehlenden Werte treten vollständig zufällig auf, unabhängig von anderen Datenpunkten im Datensatz.

b) Missing at random(geht in die Richtung einer Covariate):

Fehlende Werte gelten als zufällig (MAR). Dies bedeutet, dass die Wahrscheinlichkeit, einen fehlenden Datenpunkt zu haben, mit einer anderen Variable im Datensatz zusammenhängt, aber nicht mit der Variable von Interesse. Mit anderen Worten, das Fehlen von Werten ist zufällig, wenn es unter Berücksichtigung anderer Variablen erklärt werden kann.

c) Not missing at random:

Fehlende Werte gelten als nicht zufällig (NMAR) oder nicht zufällig im Sinne von Konzeptualisierung. Dies bedeutet, dass die fehlenden Werte nicht zufällig erscheinen und nicht einfach durch andere Variablen erklärt werden können. Es könnte darauf hinweisen, dass das Fehlen der Werte selbst einen informativen oder systematischen Charakter hat, der mit der Variable von Interesse in Zusammenhang steht.

how is it possible to handle missing values?

a)Ignoring missings:

  • Diese Methode beinhaltet das Ignorieren oder Löschen von fehlenden Werten aus der Analyse. Es gibt zwei Untertypen:
    • Listwise deletion (biased estimation): Wenn Datensätze mit fehlenden Werten vollständig aus der Analyse entfernt werden. Dies kann zu verzerrten Schätzungen führen.
    • Pairwise deletion (unequal sample sizes): Wenn nur die verfügbaren Datensätze für jede spezifische Analyse verwendet werden, was zu ungleichen Stichproben führen kann. Ich kicke nicht grundlegend sondern bei nem spezifischen test nur die VPN welche da nicht geantwortet haben . Führt dann aber bei unterschiedlichen test zu unterschiedlichen VPN anzahl

b)

Substituting a plausible value for missings:

  • Hierbei werden plausible Werte für fehlende Werte eingesetzt. Es gibt verschiedene Methoden, darunter:
    • Mean substitution: Durchschnittswerte werden für fehlende Werte eingesetzt, was jedoch zu Verzerrungen führen kann.
    • Regression substitution: Werte werden basierend auf Regressionsmodellen vorhergesagt.
    • Pattern-matching imputation: Fehlende Werte werden basierend auf Mustern anderer Variablen im Datensatz vorhergesagt.
    • Stochastic regression: Ein Ansatz, der stochastische Elemente in die Regressionseinbezieht. (Unbiased means & variance estimates)

c)

Other advanced imputation methods:

  • Expectation maximization: Ein Algorithmus, der iterative Schätzungen für fehlende Werte verwendet, besonders nützlich, wenn keine Hypothesentests erforderlich sind.
  • Multiple imputation: Mehrfache Imputationen werden durchgeführt, um mehrere vollständige Datensätze zu erstellen, was zu genaueren Standardfehlern führt.
  • Full information maximum likelihood (FIML): Eine Methode, die alle verfügbaren Informationen nutzt, um Parameter zu schätzen, und sowohl imputiert als auch analysiert.

Sampling & participation: which  Errors of nonobservation can occur?

a) Coverage error:

  • Dieser Fehler tritt auf, wenn das Stichprobendesign nicht in der Lage ist, die gesamte Population repräsentativ abzubilden. Einige Individuen haben keine Chance, in die Stichprobe aufgenommen zu werden. Dies könnte auf unvollständige oder nichtrepräsentative Stichprobenauswahlverfahren zurückzuführen sein.

b) Sampling error:

  • Der Begriff "Sampling error" bezieht sich auf die Unsicherheit, die durch die zufällige Auswahl von Stichproben aus einer Population entsteht. Es handelt sich um die Differenz zwischen den Schätzwerten, die aus der Stichprobe abgeleitet werden, und den tatsächlichen Werten in der Gesamtpopulation.

c) Non-response bias (differential participation) & differential attrition:

  • "Non-response bias" bezieht sich auf Verzerrungen in den Studienergebnissen aufgrund unterschiedlicher Teilnahmeraten. Wenn bestimmte Gruppen von Personen eher dazu neigen, nicht zu antworten oder sich nicht zu beteiligen, kann dies zu Verzerrungen in den Studienergebnissen führen.
  • "Differential attrition" bezieht sich auf das unterschiedliche Ausscheiden von Teilnehmern im Verlauf einer Studie. Wenn bestimmte Gruppen von Teilnehmern eher dazu neigen, die Studie vorzeitig zu verlassen, kann dies zu Verzerrungen führen, da die verbleibenden Teilnehmer möglicherweise nicht mehr repräsentativ für die Ausgangspopulation sind.

in welche Kategorien kann man outlier unterscheiden?

a) Error outliers:

  • Error-Ausreißer beziehen sich auf Datenpunkte, die auf Messfehler, Datenmanipulation oder andere Arten von Fehlerquellen zurückzuführen sind. Diese Ausreißer sind normalerweise nicht repräsentativ für die wahre Verteilung der Daten und können die Analyse beeinträchtigen. Bei der Identifizierung von Error-Ausreißern ist es oft ratsam, sie zu korrigieren oder zu entfernen, um Verzerrungen zu minimieren.

b)  Interesting outliers:

  • Interessante Ausreißer sind Datenpunkte, die auf tatsächliche Unterschiede oder Besonderheiten in den Daten hinweisen können. Diese Ausreißer können wichtige Einblicke in das Verständnis der Daten liefern und sollten genauer untersucht werden. In einigen Fällen können sie relevante Informationen oder Muster in den Daten darstellen.

c) Influential outliers:

  • Einflussreiche Ausreißer haben einen erheblichen Einfluss auf statistische Analysen, wie z. B. auf Regressionsmodelle. Diese Ausreißer können die Schätzung von Modellparametern stark beeinflussen und Verzerrungen verursachen. Es ist wichtig, Einflussreiche Ausreißer zu erkennen und ihre Auswirkungen zu bewerten, insbesondere wenn sie das Ergebnis von statistischen Modellen signifikant beeinflussen.

name some of the Outlier-identification techniques!

Single construct techniques

◼ Box Plot

◼ q-q / p-p Plot

Multiple-construct techniques

◼ Scatter Plot

◼ Mahalanobis distance

◼ Local outlier factor

Name possible ways how to deal with outliers!

a) Correct value if plausible explanation exists:

  • Korrigiere den Ausreißerwert, wenn eine plausible Erklärung für das Vorliegen des Ausreißers existiert. Dies könnte bedeuten, dass der Ausreißer auf einen Messfehler oder eine Datenanomalie zurückzuführen ist, der durch eine korrigierte oder bereinigte Messung ersetzt werden kann.

b) Transform data if distribution is lognormal:

  • Transformiere die Daten, insbesondere wenn die Verteilung der Daten log-normal ist. Die Anwendung von Logarithmen oder anderen Transformationen kann dazu beitragen, die Auswirkungen von Ausreißern zu mildern.

c)  Keep as is and analyze data/report findings with and without outliers:

  • Behalte Ausreißer bei und analysiere die Daten. Berichte die Ergebnisse sowohl mit als auch ohne Ausreißer und führe Sensitivitätsanalysen durch, um zu verstehen, wie stark die Ausreißer die Ergebnisse beeinflussen.

d) Keep as is and use robust statistics (e.g., medians, trimmed means, trimmed SD):

  • Behalte Ausreißer bei und verwende robuste Statistiken wie Mediane, beschnittene Mittelwerte oder beschnittene Standardabweichungen, die weniger empfindlich gegenüber Ausreißern sind als ihre klassischen Gegenstücke.

e) Winsorize (=transform extreme values to a specified value/percentile of the data):

  • Winsorizing beinhaltet das Umwandeln von extremen Werten in einen festgelegten Wert oder ein bestimmtes Prozentil der Daten. Dies hilft, die Auswirkungen von extremen Ausreißern zu begrenzen, während die Datenstruktur beibehalten wird.

f) Impute new value:

  • Imputiere einen neuen Wert für den Ausreißer. Dies könnte bedeuten, dass der Ausreißer durch einen Wert ersetzt wird, der auf statistischen Methoden oder anderen Techniken basiert.

g) Remove outlier (=set to missing):

  • Entferne den Ausreißer aus der Analyse, indem du ihn als fehlend (missing) setzt. Dies ist eine drastischere Maßnahme, die jedoch in bestimmten Fällen gerechtfertigt sein kann.