03418 5
h
h
Set of flashcards Details
Flashcards | 14 |
---|---|
Language | Deutsch |
Category | Psychology |
Level | University |
Created / Updated | 17.01.2017 / 09.09.2018 |
Weblink |
https://card2brain.ch/box/20170117_03418_5
|
Embed |
<iframe src="https://card2brain.ch/box/20170117_03418_5/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Messgenauigkeit eines Messwerts (Sicherheitswahrscheinlichkeitt & Vertrauensintervall)
bei der Beurteilung muss berücksichtigt werden.
Je genauer ein Messwert eine Fähigkeit misst, desto näher liegt wahrscheinlich der wahre Wert der Person an dem beobachteten Messwert einer Person. Die Messgenauigkeit eines Messwerts wird berücksichtigt, indem ein Bereich mit Grenzen angegeben wird, der den wahren Wert mit einer gewissen Wahrscheinlichkeit, beispielsweise 95 Prozent, überdeckt. Diese Wahrscheinlichkeit wird auch Sicherheitswahrscheinlichkeit genannt. Der Bereich selbst wird als Vertrauensintervall bezeichnet.
Vertrauensintervall
ist der Bereich um einen beobachteten Wert, der mit einer bestimmten Wahrscheinlichkeit die Lage des wahren Werts überdeckt. Dabei wird das Vertrauensintervall gemäß des frequentistischen Ansatzes der Statistik so konstruiert, dass beispielsweise 95 Prozent der Vertrauensintervalle um den wiederholt gemessenen beobachteten Wert einer Person den wahren Wert enthalten (unter Annahme einer Normalverteilung)
Da der wahre Wert für eine Person eine Konstante darstellt, hat dieser auch keine Wahrscheinlichkeitsverteilung. Somit beschreibt das Vertrauensintervall die Wahrscheinlichkeit, mit der man auf die Richtigkeit künftiger Aussagen, also die Menge aller Vertrauensintervalle bei unendlich oft wiederholten Messungen, vertrauen kann. Die Breite eines Vertrauensintervalls stellt somit ein konkretes Maß für die Schätzpräzision eines psychologischen Tests dar.
Methoden Zur Absicherung von beobachteten Testwerten
- Absicherung des individuellen Testergebnisses mithilfe des Standardmessfehlers auf Basis der Äquivalenzhypothese.
- Die Absicherung des individuellen Testergebnisses mithilfe des Standardschätzfehlers auf Basis der Regressionshypothese.
Die Äquivalenzhypothese geht davon aus, dass der beobachtete Wert des Probanden bereits eine gute Annäherung an den wahren Wert des Probanden darstellt. Im Gegensatz dazu geht die Regressionshypothese davon aus, dass der wahre Wert des Probanden erst aus dem beobachteten Wert des Probanden geschätzt werden muss.
Klassifikation der Testergebnisse
Fällt das Vertrauensintervall einer Person komplett in den Bereich unterhalb einer Standardabweichung des Mittelwerts der Normstichprobe, wird die Leistung oder Eigenschaftsausprägung der Person als unterdurchschnittlich bezeichnet.
Reicht das Vertrauensintervall einer Person vom Bereich unter einer Standardabweichung des Mittelwerts der Normstichprobe bis in den Bereich plus/minus einer Standardabweichung um den Mittelwert, wird die Leistung oder Eigenschaftsausprägung der Person als unterdurchschnittlich bis durchschnittlich bezeichnet.
Fällt das Vertrauensintervall einer Person komplett in den Bereich plus/minus einer Standardabweichung um den Mittelwert der Normstichprobe, wird die erzielte Leistung oder Eigenschaftsausprägung der Person als durchschnittlich bezeichnet.
Reicht das Vertrauensintervall einer Person vom Bereich plus/minus einer Standardabweichung um den Mittelwert bis in den Bereich über eine Standardabweichung des Mittelwerts, wird die Leistung oder Eigenschaftsausprägung der Person als durchschnittlich bis überdurchschnittlich bezeichnet.
Fällt das Vertrauensintervall einer Person komplett in den Bereich über eine Standardabweichung des Mittelwerts der Normstichprobe, wird die Leistung oder Eigenschaftsausprägung der Person als überdurchschnittlich bezeichnet.
Testwert auch als durchschnittlich zu klassifizieren ist, wenn der Mittelwert der Normstichprobe in dem Vertrauensintervall enthalten ist.
Sicherheitswahrscheinlichkeit
bezieht sich also darauf, wie verlässlich das geschätzte Vertrauensintervall den wahren Wert überdeckt.
Fehler 1. Art oder α-Fehler und der Fehler 2. Art oder β-Fehler.
Der α-Fehler würde bedeuten, dass eine Nullhypothese (z. B. „Es besteht kein Unterschied zwischen zwei Mittelwerten in der Population.“) zu Unrecht verworfen wird. Der β-Fehler als Komplement bedeutet, dass die Alternativhypothese zu Unrecht verworfen wird.
Möglichkeiten um Breite des Vertrauensintervall zu beeinflussen
- Art des Vertrauensintervalls. Im Allgemeinen sind die Vertrauensintervalle, diedurch die Anwendung der Regressionshypothese gebildet werden, schmaler alsdie Vertrauensintervalle, die durch die Äquivalenzhypothese berechnet werden.
- Wahl der Sicherheitswahrscheinlichkeit. Der Wert für die Sicherheitswahr-scheinlichkeit unterscheidet sich für ein- (z1-α) bzw. zweiseitige (z1-α/2) Fragestel-lungen.
- Wahl des geeigneten Reliabilitätskoeffizienten. Um Vertrauensintervalle zu bilden, werden Reliabilitätsschätzungen der Messwerte benötigt.
Fragestellung
–Einseitig: Es liegt eine begründete Vermutung vor, dass das zu erwartende Ergebnis in einen bestimmten Merkmalsbereich hineinfällt.
–Zweiseitig: Es liegt keine Vermutung vor, in welchem Bereich das Ergebnis zu erwarten ist.
Wahl der Sicherheitswahrscheinlichkeit:
Wahl der Sicherheitswahrscheinlichkeit:
–Es ist günstig, sich zuerst an den negativen Konsequenzen für die Person zu orientieren und dann an der Messgenauigkeit des Messwerts. Ist der Test wenig messgenau, so dass Vertrauensintervalle resultieren, die sich vom unter- bis in den überdurchschnittlichen Bereich erstrecken, muss die Sicherheitswahrscheinlichkeit reduziert werden.
Wahl der Reliabilität
Querschnittdiagnose: Es ist relevant, wie eine Person am heutigen Tag abschneidet, eine Prognose auf zukünftiges Verhalten wird nicht gefordert. In diesem Fall kann die innere/ interne Konsistenz verwendet werden.
–Längsschnittdiagnose: Es wird gefordert, dass die Einschätzung über die Zeit hinweg stabil ist, beispielsweise im Rahmen der Eignungsdiagnostik. In diesem Fall kann die Retest-Korrelation als Reliabilitätsschätzung verwendet werden
Voraussetzungen für die Anwendung von Standardmess- undStandardschätzfehler
Voraussetzungen bei der Verwendung des Standardmessfehlers auf Basis der Äquivalenzhypothese
- Die Fehlervarianz eines Tests ist in allen Skalenbereichen gleich groß, die Messfehler und wahren Werte müssen normalverteilt sein. Dabei muss die Varianz der wahren Werte größer als null sein. Weiterhin darf sich auch innerhalb
Bei der Verwendung des Standardschätzfehlers auf Basis der Regressionshypothese muss zusätzlich zu den Voraussetzungen, die für den Standardmessfehler genannt wurden, eine bivariate Normalverteilung der Messfehler und der wahren Werte vorliegen (Huber, 1973, S. 118), die jedoch unkorreliert sein müssen.
Interpretation von mess- und valenzkritischer Absicherung
- messfehlerkritischen Absicherung geprüft: ob Unterschiede in den Messwerten zweier Tests auf Messfehler zurückzuführen sind
- valenzkritischen Absicherung :ob der Unterschied in der Testleistung dadurch bedingt ist, dass beide Tests unterschiedliche Eigenschaften oder Fähigkeiten messen. Inhaltlich wird mithilfe der valenzkritischen Prüfung ermittelt, ob der beobachtete Unterschied einer Person in zwei Untertests in der Normstichprobe selten auftritt.
Normierung
ind die Reliabilitäten der Skalen oder Untertests unterschiedlich, kann dies durch eine spezielle Normierung berücksichtigt werden. Man unterscheidet zwischen der x- und der Tau-Normierung
Liefern die Normierungen Vergleichsmaßstäbe für beobachtete Werte bzw. Rohwerte, bezeichnet man diese als x-Normierung. Nach Huber (1973, S. 71 f.) lassen sich praktisch alle Normen, die in der Testkonstruktion angewendet werden, als x-Normierungen bezeichnen. Die Tau-Normierung orientiert sich im Gegensatz zur x-Normierung an der Verteilung der wahren Testwerte in der Normpopulation. Dabei wird angenommen, dass die wahren Werte zumindest einer ähnlichen Verteilung wie diebeobachteten Messwerte folgen.
Vorgang bei der Absicherung von Testwertdifferenzen
- Zunächst wird geprüft, ob die Reliabilitäten der Messwerte gleich sind.
- a.Sind die Reliabilitäten gleich wird mit den Normwerten (x-normierte Werte) die Absicherung vorgenommen. b.Sind die Reliabilitäten unterschiedlich, wird eine Tau-Normierung vorgenommen.
- Nach der ersten Entscheidung erfolgt dann zunächst eine messfehlerkritische Absicherung der Testwertdifferenz mithilfe der Tau- oder x-normierten Messwerte.
- a.Ist im Rahmen der messfehlerkritischen Absicherung die beobachtete Differenz bzw. der empirische z-Wert gleich groß oder extremer als die kritische Differenz bzw. der kritische z-Wert, wird eine valenzkritische Absicherung der Testwertdifferenz angeschlossen.
- b.Führt die messfehlerkritische Absicherung zu keinem signifikanten Ergebnis, ist die gefundene Differenz durch Messfehler erklärbar und eine valenzkritische Absicherung erübrigt sich.
- Führt die messfehlerkritische Absicherung zu einem signifikanten Ergebnis, erfolgt eine valenzkritische Absicherung der Testwertdifferenz mithilfe der Tauoder x-normierten Messwerte.
- a.Ist im Rahmen der valenzkritischen Absicherung die beobachtete Differenz bzw. der empirische z-Wert gleich groß oder extremer als die kritische Differenz bzw. der kritische z-Wert, liegt eine diagnostisch bedeutsame Testwertdifferenz vor.
- b.Führt die valenzkritische Absicherung zu keinem signifikanten Ergebnis, liegt keine diagnostisch bedeutsame Differenz vor.