Testtheorie und Fragebogenkonstruktion
Testtheorie und Fragebogenkonstruktion
Testtheorie und Fragebogenkonstruktion
Kartei Details
Karten | 71 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 24.04.2017 / 27.12.2024 |
Weblink |
https://card2brain.ch/box/20170424_testtheorie_und_fragebogenkonstruktion
|
Einbinden |
<iframe src="https://card2brain.ch/box/20170424_testtheorie_und_fragebogenkonstruktion/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Konstruktvalidierung: Berücksichtigung der Reliabilität
Konstruktvalidierung: Berücksichtigung der Reliabilität
• Psych. Tests: fast nie optimale (messfehlerbehaftet)
• Korrelation kann max. so groß sein wie Korrelation der
wahren Werte und der zugrunde liegenden Konstrukte
• Strukturgleichungsmodelle/CFA
- Explizite Berücksichtigung der Messfehler
- Direkte Schätzung der wahren Werte
• Doppelte Minderungskorrektur (Kristof, 1983; Spearman, 1904)
- Manifeste Korrelationen
- Korrektur des beobachtbaren Zusammenhangs nach oben
Wie soll mit dem Problem der Interpretation der diskriminanten Validität umgegangen werden?
Umgang a priori:
-Dezidierte Annahmen über Höhe der max. Korrelation
-Festlegung der optimalen Stichprobengröße
-a und ß Fehler
--> dies verringert die Wahrscheinlichkeit, Verletzungen der Annahmen der diskriminanten Validität aufgrund zu geringer Stichprobengröße zu übersehen
Definition eines Methodeneffekt:
= verschiedene systematische Varianzquellen, die sich über den Trait hinaus auf die Validität der Messung auswirken können
Quellen:
-Messinstrument
-Beurteiler
-Kontext
Welche Analysemethoden der MTMM gibt es ?
-korrelationsbasierte Analyse
-Varianzanalytische Analyse
-Exploratorisch faktorenanalytische Analyse
-konformatorisch faktorenanalytische Analyse
Welcher Hinweis spricht für korrelierte Methoden?
Erhöhte Korrelationen versch. Traits mit unterschiedlichen Methoden (spricht gegen Validität)
Welche Kritk kann man an der korrelationsbasierten Methode üben? (MTMM)
• Häufigkeitsauszählungen und Einzelvergleiche--> nur grober Überblick, kein zufallskritisches Vorgehen
• Inspektion manifester Variablen (nicht latente Traits)
• Keine unabhängige Bestimmung konvergenter und diskriminanter Validität
• Keine exakten Entscheidungsregeln --> subjektive Auswertung
--> Lösung: konfirmatorische Analyse (CFA)
Vorteile der konfimatorischen MTMM-Analysen
• Analyse der Korrelationsmatrizen mit konfirmatorischen Faktorenanalysen
• Erlaubt Trennung von Trait-, Methoden- und Messfehleranteilen
• Erlaubt .berprüfung der Gültigkeit der zugrunde liegenden Annahmen, z. B. .berprüfung der Eindimensionalität der einzelnen Traits und der Unkorreliertheit oder Korreliertheit von Methoden- oder Traitfaktoren
• Möglichkeit, die latenten Traitfaktoren mit Kriterien in Beziehung zu setzen --> Kriteriumsvalidität auf latenter Ebene überprüfen
Arten von Modellen:
--> Modelle mit Trait- und Methodenfaktoren
--> Modelle mit Traitfaktoren und korrelierten Messfehlern
Wie sieht die das CFA-Modell in dem Traits und Methoden als Faktoren spezifiziert werden gernauer aus ?
Aufbau des Modells
- mindestens drei Traits
- mindestens drei Methoden
- mindestens 9 (3 Å~ 3) Indikatoren (Messvariablen)
- jeder Indikator lädt jeweils auf einem Traitfaktor und auf einem Methodenfaktor, nicht aber auf den anderen Faktoren
- Traitfaktoren und die Methodenfaktoren können jeweils untereinander korrelieren, es dürfen jedoch keine Beziehungen zwischen diesen beiden Faktorengruppen bestehen
Was bedeutet lokale stochastische Unabhängigkeit ?
Korrelation zwischen den Antwortvariablen verschwindet, wenn man die lantente Variable auf einem bestimmten Wert (auf einer lokalen Stufe = eine Gruppe von Personen die die gleichen Werte auf der Latenten Variable hat) konstant hält
--> Korrelationsmuster: bei heterogener Gruppe Korrelation zwischen den Items, bei homogener Gruppe (lokal), keine Korrelation --> Hinweis dass die Items das latente Konstrukt messen.
Bechreibe das Guttman-Modell
Annahme: es gibt für jedes dichotim beantwortete Item einen bestimmten Wert auf der Ksi-Skale, ab dem das Item gelöst bzw. bejaht wird. (je weiter rechts desto schwieriger das Item) Lösungwahrscheinlichkeit springt von 0 auf 1 (wenn Person höhere Fähigkeit als die Aufgabenschwierigkeit besitzt) -> keine reellen Daten entsprechen diesem Modell
Kritik: Modellverletzung z.B. beim Abschreiben
Eigenschaften des Rasch-Modells
- lokale stochastische Unabhängigkeit
- Eindimensionalität & Itemhomogenität
- Anzahl gelöster Aufgaben als „erschöpfende Statistik“
- spezifische Objektivität der Vergleiche
- Stichprobenunabhängigkeit
- Prüfbarkeit
--> Diese Eigenschaften folgen aus der Modelldefinition des Rasch-Modells; sie gelten nur für Items, für die das Rasch-Modell gilt!
Was bedeutet Itemhomogenität?
Antwortverhalten nur von der latenten Variablen und keinem anderen Merkmal abhängig
• Konsequenz:
Manifeste Variablen müssen Bedingung der lokalen stochastischen Unabhängigkeit genügen, damit man von Itemhomogenität ausgehen kann
• Untersuchbar anhand von Korrelationen
- Latente Variable ξ wird auf einem bestimmten Wert (der lokalen Stufe ξv) konstant gehalten
- Wenn dann die Korrelationen zwischen den Antwortvariablen verschwinden: lokale stochastische Unabhängigkeit --> Itemhomogenität
Was bedeutet spezifische Objektivität? (Rasch-Modell)
-Vergleiche zwischen Aufgaben/Personen immer unabhängig von Personen/Aufgabe
-->
-Unterschied zwischen 2 Itemschwierigkeiten ist immer gleich, egal mit welcher Person
-Unterschied zwischen 2 Personenfähigkeiten immer gleich, egal mit welcher Aufgabe
Überprüfung: Produkt der Einzelwahrscheinlichkeit muss Wahrscheinlichkeit entsprechen beide Items zusammen zu lösen
Wie kann die individuelle Testgenauigkeit gesteigert werden?
-Steigerung der Itemzahl
-Geeignete Itemauswahl (Items mit hohen individuellen Informationsbeiträgen)
Was sind Vorteile und Nachteile der Birnbaum-Modell?
• In den Birnbaum-Modellen werden „vorteilhafte“ Eigenschaften aufgegeben (z.B. spezifische Objektivität), das könnte aber auch realistischer in der Abbildung von Itemeigenschaften sein.
• Empirische .berprüfung ausschließlich mit „Anpassungstests“ (sog. Goodness-of-Fit-Maßen), die feststellen, wie gut die beobachteten Daten zum postulierten Modell passen, ohne aber einen sicheren Rückschluss auf die Geltung der Modellimplikationen zu erlauben.
• Beim Raschmodell können diese Implikationen (z.B. spezifische Objektivität, Stichprobenunabhängigkeit, Intervallskalierung, Summenwerte als erschöpfende Statistik) teilweise mit Modelltests überprüft werden.
Definition adaptives Testen
- expliziter, vorab festgelegter adaptiver Algorithmus zur Itemauswahl
- Items entsprechen den Annahmen eines ad.quaten Messmodells
Voraussetzung für das Nutzen der Items zum adaptivem Testen?
• Menge aller Testitems (der sog. Itempool) weist Konformität mit den Annahmen des verwendeten IRT-Modells auf
• für IRT-konforme Items wird lokale stochastische Unabhängigkeit angenommen
Mehrstudige Strategien des adaptiven Testens, welche 2 Formen gibt es ? + Beschreibe sie
- fest verzweigte Strategie (.fixed-branched strategy.)
• Beginn: Item mittlerer Schwierigkeit für alle
• Danach: je nach Antwort schwierigeres oder leichteres Item (bereits vor Testbeginn festgelegt, welches)
• Ende: Schätzung der individuellen Merkmalsauspr.gung (Schwierigkeit des Items, das als nächstes vorgelegt worden w.re oder mittlere Schwierigkeit aller im Testverlauf vorgelegten Items inkl. des Items, das als nächstes vorgelegt worden w.re, aber ohne das erste Item, das für alle Probanden identisch war)
- maßgeschneiderte Strategien (.tailored strategy.)
• Sehr feine Anpassung der vorzugebenden Items an das Antwortverhalten der Probanden möglich
• Setzt Computer voraus
• Verzweigung ergibt sich erst w.hrend der Testung (.variable branched tests.)
Welche sind mögliche Abbruchkriterium für eine Beedigung eines adaptiven Testes?
- eine bestimmte Anzahl von Items vorgelegt wurde und/oder
- der Standardfehler der Personenparametersch.tzung hinreichend klein ist und/oder
- eine maximale Testzeit erreicht wurde oder
- alle im Itempool verfügbaren Items vorgelegt wurden
Vorteile computerbasierte Testadministraion
+ hohe Testsicherheit
+ standardisierter Testablauf
+ probandenbestimmte Testgeschwindigkeit
+ schnelle und fehlerfreie Testwertbestimmung
+ Auswertung ohne psychometrisches Fachwissen
+ schnelle Ergebnisrückmeldung
+ Möglichkeit zur Verwendung innovativer Itemformate
Nachteile computerbasierter Testadministration
- hoher Entwicklungsaufwand
- Aufwand durch die Bereitstellung von Computern am Testort
- teilweise höhere Kosten
- problematische Fairness hinsichtlich computerbezogener Personenmerkmale (z. B. Erfahrung, .ngstlichkeit)