M6 Grundlagen der Testkonstruktion
Kapitel 3: Itemanalyse: Kürzung und Revision des Entwurfs
Kapitel 3: Itemanalyse: Kürzung und Revision des Entwurfs
Kartei Details
Karten | 84 |
---|---|
Lernende | 12 |
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 28.11.2011 / 12.09.2017 |
Weblink |
https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion4
|
Einbinden |
<iframe src="https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion4/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Wie wird die Trennschärfe bei dichotomen Items berechnet?
Durch die punktbiseriale Korrelation. (Formel S. 69)
In SPSSautomatisch
Welchen Grund kann es haben, wenn die Trennschärfe verzerrt ist, indem die Varianz der eingehenden Variablen artifiziell erweitert ist?
Ausreißer
Bimodale Verteilungen
Welchen Grund kann es haben, wenn die Trennschärfe verzerrt ist, indem die Varianz der eingehenden Variablen artifiziell eingeschränkt ist?
durch Schiefe
Extreme Schwierigkeiten
Wie kann man die verzerrte Trennschärfe prüfen?
1.statistisch: schwierigkeitsanalyse
2.visuell: Inspektion der Histogramme
Welchen Effekt haben Ausreißer auf Ratingskalen?
Sie haben bei den meist nur wenigen Optionen einer Ratingskala selten gravierende Auswirkungen
Durch bimodale Verteilungen ( weil z.B. die Mittelkategorie nur selten gewählt wird) kann es aber zu erheblichen Varianzerweiterungen kommen
Was ist bei Ratingskalen häufiger ein Problem als Varianzerweiterungen durch bimodale Verteilungen?
Varianzeinschränkungen durch schiefe Verteilungen
Was ist die schwierigkeitsproportionale Stichprobenverteilung?
- Ein alternatives Verfahren zur Korrektur der Trennschärfen von Items mit extremen Schwierigkeiten
- Entwickelt von Moosbrugger und Zistler 1993
Wie funktioniert die schwierigkeitsproportionale Stichprobenverteilung?
- Die Trennschärfe dichotomer Items wird dabei aufgewertet, indem ein sog. Selektionskennwert berechnet wird, der eine Art Korrektur der Trennschärfe um Varianzeinschränkung darstellt.
- Dies führt zu einer Selektion von Items, bei der solche mit extremen Schwierigkeiten weniger stark benachteiligt sind als bei Anwendung der unkorrigierten Trennschärfen.
Wird wird in SPSS die Trennschärfenanalyse durchgeführt?
ANALYSIEREN-> SKALIERUNG -> RELIABILITÄTSANALYSE
Die Items müssen in die Itemliste verschoben werden. Bei mehrdimensionalem Inventar wird jede Dimension einzeln verschoben
-> STATISTIKEN -> SKALA WENN ITEM GELÖSCHT
Wie wird in SPSS die Fremdtrennschärfe berechnet?
indem ein Item mit den Summenwerten der anderen Faktoren korreliert wird.
ANALYSIEREN-> KORRELATION -> BIVARIAT
Was gilt allgemein für die Itemselektion in der KTT?
- Es ist ein nicht automatisierterer Prozess des Abwägend und Begründens
- Die Indikatoren sind simultan zu betrachten und gegen inhaltliche Gesichtspunkte abzuwägen
- Faustregeln zu einzelnen Indizes können nur eine grobe Richtschnur sein
Welche Indikatoren werden zur Itemselektion geprüft?
Itemschwierigkeit
Trennschärfe
Evt. : Varianz, Korrelation mit Außenkriterien
Welche Kennwerte sind relativ bedeutsamer zur Itemselektion?
die korrelativen: Trennschärfe und in inhaltlich begründeten Fällen auch die Korrelation mit Außenkriterien.
Unter welchen Umständen können Items mit extremen Schwierigkeiten beibehalten werden?
bei gleichzeitig angemessen hohen Trennschärfen
Wie lautet eine in der Praxis häufig angewandte Regel zur Itemselektion?
Behalte Items bei, solange sie positiv zur Erhöhung der Reliabilität beitragen
Welches ist das wichtigste Modell im Probabilistischen Testmodell?
Das Rasch-Modell
Worum geht es in der PTT im Gegensatz zur KTT?
Es geht darum, wie Antworten auf Items zustande kommen. Antwortmuster werden untersucht
Wovon hängt die Lösungswahrscheinlichkeit für ein bestimmtes Item ab?
1. Von der Fähigkeit oder Eigenschaftsausprägung einer Person
2. Von der Schwierigkeit des Items
Was folgt, wenn das Rasch-modell durch den Modelltest nicht abgelehnt wird?
dann sagt der ungewichtete Summenwert der Itemantworten auch wirklich etwas über den Ausprägungsgrad einer Person auf der latenten Variable aus.
erst dann ist der Summenwert eine erschöpfende Statistik der Personenfähigkeit
Was heißt erschöpfende Statistik der Personenfähigkeit?
Es heißt, der Summenwert einer Person liefert alle Informationen über die Fähigkeitsausprägung der Person
Demnach muss das Antwortmuster der Person nicht mehr Item für Item betrachtet werden.
Wann ist in der PTT ein Item ein guter Indikator für eine Fähigkeit/Eigenschaft?
wenn die Antwort auf dieses Item komplett auf eine einzige Fähigkeit- oder Eigenschaftsausprägung zurückzuführen ist und nicht auf mehrere Fähigkeiten oder Eigenschaften.
Wieviele Dimensionen hat ein Test unter Geltung des Rasch-modells?
er ist eindimensional
Wann ist die Eindimensionalität des Rasch-Modells formal gegeben?
lokale Unabhängigkeit: wenn die Korrelation zwischen den Items eines Tests nach Auspartiialisierung der latenten Eigenschaft (d.h. bei deren konstanter Ausprägung) verschwindet
lokale stochastische Unabhängigkeit: wenn für jede einzelne Person die Lösungswahrscheinlichkeiten zweier beliebiger Items multipliziert werden dürfen um die kombinierte Lösungswahrscheinlich beider Items zu ermitteln.
Was ist (nach Rasch) die spezifische Objektivität?
1. Vergleiche zwischen Personen sind invariat über spezifische Items und Maße, die verwendet werden
2. Vergleiche zwischen Items sind invariat über die spezifischen Personen, an denen die Items kalibriert werden.
Von welchen zwei Parametern hängt im Rasch-Modell die Itemlösung ab?
Itemparameter = kennzeichnet die Itemschwierigkeit (sigma)
Personenparameter= kennzeichnet die Fähigkeitsausprägung (Theta) einer Person Er stellt den Ort oder den Wert einer Person auf der latenten Variablen (theta) dar
Was wird benötigt um die Personenfähigkeit im Rasch-Modell festzustellen?
Itemparameter werden benötigt. Diese können mit Hilfe der conditional Maximum-Likelihood-Methode (cML) geschätzt werden
Warum kann man nicht die Itemrohwerte zur Bestimmung der Personenfähigkeit im Raschmodell verwenden?
Sie sind nicht intervallskaliert und deshalb kann man keine belastbaren Aussagen über die Unterschiede von Personen treffen.
Welches Niveau besitzen Personenparameter im rasch-Modell?
sie haben Differenzskalenniveau (logarithmierte Verhältnisskala) und eine sogenannte Logit- Einheit
Was ist die Logit- Transformation?
Es handelt sich u eine nicht-lineare Transformation, die Differenzskalenniveau von Item- und Personenparametern sichert und damit im Gegensatz zu ordinalskalierten Rohwerten die Interpretation von Differenzen zwischen Fähigkeits- und Eigenschaftsausprägungen zulässt.
In welchem Logit-Wertebereich liegt der Personen- und Itemparameter ?
zwischen Plus und Minus unendlich, aber in der Regel zwischen plus und minus 3
Was kennzeichnen negative Parameter/Werte im Logit- Wertebereich?
leichte Items oder Personen mit geringerer Fähigkeit
Was kennzeichnen positive Werte/ Parameter im Logit- Wertebereich?
schwere Items, die nur von wenigen Personen gelöst werden können oder nur geringe Zustimmung finden oder aber Personen mit höherer Fähigkeit
Wie kann man direkt berechnen wie hoch die Lösungswahrscheinlichkeit einer Person für ein Item ist?
Vorraussetzung:
1. Item- und Personenparameter müssen bekannt sein
2. Die gleiche Einheit
Verantwortlich dafür, ob ein Proband ein Item löst (+) oder nicht (-), sind dabei seine Fähigkeitsausprägung bzw. der Itemparameter sigma.
Je größer die Fähigkeit eines Probanden (Theta) im Vergleich zur Schwierigkeit des Items (sigma) ist, desto größer wird die Wahrscheinlichkeit (p) die Aufgabe zu lösen.
Wie sind Item- und Personenparameter im Rasch-Modell verknüpft?
Beide Parameter besitzen das selbe Skalenniveau und dieselbe Einheit und können dadurch additiv (Additivität, genauer gesagt subtraktiv) verknüpft werden. Die Lösung eines Items wird immer wahrscheinlicher , je weiter die Fähigkeit oder Eigenschaftsausprägung die Itemschwierigkeit übersteigt.
Die Beziehung zwischen Itemlösungswahrscheinlichkeit sowie Fähigkeits- oder Eigenschaftsausprägung und Itemschwierigkeit ist dabei eine logistische Funktion.
Was ist die Item- Charakteristic- Curve ICC?
logistische Funktionen zwischen Itemlösungswahrscheinlichkeit und den Parametern
Wie wird festgestellt, ob das Rasch-Modell durch die Daten abgelehnt werden muss?
Durch Modelltests
Was ist der Grafische Modelltest?
Es handelt sich um ein Streudiagramm, in dem die geschätzten Itemparameter aus zwei Stichproben dargestellt werden
Die Schätzung der Itemparameter sollte dabei unabhängig von der Teilstichprobe sein.
Im Idealfall liegen die Schätzungen der Itemparameter in den beiden Stichproben auf der Regressionsgeraden und diese fällt mit der Winkelhalbierenden zusammen.
Der Nachteil ist, dass es sich nicht um einen Signifikanztest handelt.
Welcher Signifikanztest hat sich bewährt, um festzustellen, ob das Raschmodell durch die Daten abgelehnt werden muss?
Der (bedingte) Anderson Likelihood Quotienten Test
Er ist die teststatistische Umsetzung des grafischen Modelltests
Was ist die Bootstrap-Methode?
Ein Modelltest für verschiedene Prüfgrößen, der sich als kritisch erwiesen hat, um festzustellen, ob das Rasch-Modell durch Daten abgelehnt werden muss. Die B.-Methode simuliert für verschiedene Modelltests eine Verteilung der jeweiligen Prüfgrößen unter Geltung des Rasch-Modells. Dies ist deshalb nötig, da die Verwendung der asymptotischen Prüfgröße der chi-quadrat-Verteilungen an Vorraussetzungen geknüpft ist, die im Rahmen des Rasch-Modells selten erfüllt sind.
Welche Annahmen treffen zu, wenn das Rasch-Modell durch einen Modell-Test nicht abgelehnt wird?
1. Die Lösungswahrscheinlichkeit wird durch eine logistische Funktion beschrieben
2. Summenwerte sind suffiziente oder erschöpfende Statistiken der Personenfähigkeit
3. Vergleiche zwischen Items und Personen sind spezifisch objektiv
4. Items sind- abgesehen von wenigen Ausnahmen- eindimensional (die Forderung der lokalen stochastischen Unabhängigkeit der Items erfüllt ist)
5. (Nur im Rahmen des dichotomen Rasch-modells notwendig und sie ist eine Grundvoraussetzung für erschöpfende Statistiken) Alle Items besitzen die gleiche Trennschärfe