M6 Kapitel 1+2+3 Grundlagen der Testkonstruktion

Modul 6 der Fernuni Hagen. Grundlagen psychologischer Testkonstruktion/KTT/ PTT Kapitel 1+2+3

Modul 6 der Fernuni Hagen. Grundlagen psychologischer Testkonstruktion/KTT/ PTT Kapitel 1+2+3

Katharina Malzahn
Teacher

Katharina Malzahn
Teacher

Kartei Details

Karten 134
Lernende 149
Sprache Deutsch
Kategorie Psychologie
Stufe Universität
Erstellt / Aktualisiert 02.01.2013 / 30.07.2020
Weblink
https://card2brain.ch/box/m6_kapitel_123_grundlagen_der_testkonstruktion
Einbinden
<iframe src="https://card2brain.ch/box/m6_kapitel_123_grundlagen_der_testkonstruktion/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Standardabweichung bei 5-stufiger Skala

  • sollte idealerweise bei 1 liegen
  • bei 10-stufiger Skala entsprechend bei 2

Itemschwierigkeit

  • prozentualer Anteil der richtigen Lösung
  • Mittelwerte bilden Grundlage zur Berechnung

Trennschärfe

Korrelation zwischen Item & Skala; liegt immer zwischen -1 und +1

Validierungsstudien

  • prüft ob Trennschärfe ein angemessener Indikator für inhaltliche Angemessenheit des Items ist
  • Annahme: Summe der übrigen Items misst das Merkmal valide

Eigentrennschärfe

  • part-whole-Korrektur
  • sagt aus wie gut ein Item eine Skala wiederspiegelt
  • wichtigster Indikator dafür wie gut ein einzelnes Item das zugrunde liegende Merkmal abbildet

Part-Whole-Korrektur

  • korrigierte Korrelation
  • Item wird mit dem - aus allen übrigen Items bestehendem - Testwert in Beziehung gesetzt
  • liegt vor Berechnung der Trennschärfe um eine Überschätzung der Trennschärfe zu vermeiden

Fremdtrennschärfe

  • Korrelation von Items mit Skalen/ Testwerten anderer Fragebögen/ Kriterien
  • Verwendung besonders bei externaler Skalenkonstruktion

Unkorrigierte Trennschärfe

  • enthält partielle Eigenkorrelation eine Items mit sich selbst
  • umso stärker je kürzer die Skala
  • umso stärker je heterogener die Skala

Warum ist die partielle Eigenkorrelation umso stärker je kürzer die Skala ist?

Weil die anteiligen Gewichte der Items steigen.

Warum ist die partielle Eigenkorrelation umso stärker je heterogener die Skala ist?

Weil es dann geringere Korrelationen der Items untereiander gibt.

Produkt-Moment-Korrelation

  • auch: Maßkorrelation; Bravais-Pearson-Korrelation
  • beschreibt Enge des linearen Zusammenhangs zwischen zwei intervallskalierten Variablen durch Koeffizienten r
  • Anwendung bei Ratingskalen (Pendant zur part-whole-Korrektur)

Punktbiseriale Korrelation

  • Zusammenhangsmaß für dichotome Merkmale

Potentielle Probleme bei Trennschärfeanalyse

  • Verzerrung
  • Schiefe Verteilung

Verzerrung 

  • nach oben oder unten, indem Varianz der eingehenden Variablen artifiziell erweitert oder eingeschränkt ist
  • bimodale Verteilung kann zu erheblichen Varianzerweiterungen führen

Schiefe Verteilung

  • häufig Varianzverzerrung
  • zeigt an wie stark wie Verteilung nach links/rechts geneigt ist

links-schiefe Verteilung

Negative Schiefe

rechts-schiefe Verteilung

positive Schiefe

Probabilistische Testtheorie: Grundannahmen

  • in der Testsituation kann nur ein Verhaltensausschnitt erfasst werden, welcher auf eine Disposition zurückgeht
  • Korrelation der manifesten Veriable soll auf eine einzige latente Variable zurückgeführt werden
  • lokale stochastische Unabhängigkeit & probabilistischer Zusammenhang

Manifeste Variable (PTT)

Verhaltensausschnitt

Latente Variable (PTT)

Verhaltensdisposition

PTT: Lösungswahrscheinlichkeit p ergibt sich aus...

  • Personenparameter θ
  • Itemparameter σ

Personenparameter

  • Theta: θ
  • Fähigkeit/ Eigenschaftsausprägung

Itemparameter

  • Sigma: σ
  • Schwierigkeit der Items

Erschöpfende Statistik der Personenfähigkeit

  • Summenwert der Person liefert alle Informationen über die Fähigkeitsausprägung einer Person
  • wird das Rasch-Modell nicht abgelehnt, sagt der Summenwert der Itemantworten auch etwas über deren Ausprägungsgrad aus

Aspekte des Rasch-Modells

  • Erschöpfende Statistik der Personenfähigkeit
  • Eindimensionalität
  • Lokale Unabhängigkeit
  • lokale stochastische Unabhängigkeit
  • Spezifische Objektivität
  • Additivität

Eindimensionalität (Rasch-Modell)

Ein Item ist ein guter Indikator für eine Fähigkeit, wenn die Antwort auf das Item auf eine Fähigkeitsausprägung zurückzuführen ist

Lokale Unabhängigkeit (Rasch-Modell)

Eindimensionalität ist formal gegeben, sobald Inter-Item-Korrelation eines Test nach Auspartialisierung der latenten Eigenschaft verschwindet

Lokale stochastische Unabhängigkeit (Rasch-Modell)

Ist gegeben, wenn für jede Person die Lösungswahrscheinlichkeit zweier beliebiger Items multipliziert werden dürfen um die kombinierte Lösungswahrscheinlichkeit beider Items zu ermitteln

Spezifische Objektivität (Rasch-Modell)

  • Interpersonelle Vergleiche sind invariant über spezifische Vergleche & Maße die verwendet werden
  • Inter-Item-Vergleiche sind invariant über die spezifischen Personen an denen die Items kalibriert werden

Additivität (Rasch-Modell)

Parameter haben dasselbe Skalenniveau und dieselbe Einheit, sodass sie additiv/ subtraktiv miteinander verknüpft werden können

Modellparameter

  • Personenparameter
  • Logit-Einheit

Schätzung der Personenparameter

  • durch conditional Maximum-Likelihood-Methode (cML)
  • θ hat Differenzskalenniveau: Logit-Einheit
  • Kenntnis der Itemparameter wird für cML vorausgesetzt

Logit-Einheit

nicht-lineare Transformation der Rohwerte in eine abstrakte Einheit

Logit-Einheit: negative Werte

spricht für leichte Items/ geringe Fähigkeit

Logit-Einheit: positive Werte

spricht für schwere Items/ hohe Fähigkeit

Item characteristic Curve (ICC): y-Achse

Itemlösungswahrscheinlichkeit

Item characteristic Curve (ICC): x-Achse

Gemeinsame Einheit von Personen-/ Itemparameter

Item characteristic Curve (ICC): Itemschwierigkeit

Schnittpunkt einer x-Achsen-Parallelen mit Kurve

Grafischer Modelltest

  • Streudiagramm in welchem die geschätzten Parameter aus 2 Stichproben dargestellt werden
  • x-/y-Achse sind die Logit-Einheiten der Itemparameter
  • ansteigende Linie= Regressionsgerade der Parameter einer Teilstichprobe auf die andere

Modell-Tests für Rasch-Modell

  • Stellen fest ob Rasch-Modell abgelehnt werden muss
  • Grafischer Modelltest
  • Andersen-Likelihood-Quotienten-Test
  • Bootstrap-Methode