testkonstruktion

Testkonstruktion

Testkonstruktion


Set of flashcards Details

Flashcards 269
Language Deutsch
Category Psychology
Level Primary School
Created / Updated 22.08.2014 / 13.09.2020
Weblink
https://card2brain.ch/box/testkonstruktion1
Embed
<iframe src="https://card2brain.ch/box/testkonstruktion1/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was entsteht durch Rotation?

Asymptotically Distribution Free ADF

Gruppe verwandter Methoden (WLS; DWLS ERLS)

keine oder nur eingeschränkte Verteilungseigenschaften werden vorrausgesetzt

+ skaleninvariant

+ skalenfrei

+ stellen Prüfstatistiken bereit

gut für dichotomer oder kategorialer Daten

- sehr große Stichprobengröße (besonders WLS)

Mustermatrix

Ladungen des Items auf Faktor (Faktormustekoeffizienten)

es sind partiell standardisierte Regressionsgewichte des Items mit rotierten Faktoren

werden meistens für Interpretation herangezogen

Musterkoeffizienten können Werte größer 1 und kleiner -1 annehmen

Generalized Least Squares GLS

GLS und ML eng verwandt und ähnliche Eigenschaften

GLS gelichgut oder schlechter als ML -> nur selten Gründe für GLS

Wobei ist Part-whole Korrektur notwendig

Schätzverfahren für Reliabiltäten KTT

Varianz der beobachteten Messwert leicht zu ermitteln

Problem: Varianz der wahren Werte

Bias (systematische Fehler z.B. Testangst) werden der wahren Varianz zugeschlagen

RMSEA

wichtigster Vertreter der Badness-Fit-Indizes

mittlere Diskrepanz der implizierten Matrix pro Freiheitsgrad interpretieren

es lässt Konfidenzintervall berechnen, dass Null möglichst mit einschließen sollte

Welche Verfahren sind oblique Rotationen?

Promax

Direkte Oblimin

iterative Schätzalgorithmen

Maximum Likelihood

Generalized Least Square GLS

Unweighted Least Squares ULS

Asymptotically Distribution Free ADF

Fremdtrennschärfe

Korrelation von Items mit mit den Skalen und oder Testwerten anderer Fragebögen oder Kriterien

Quartimax

strebt Eindeutigkeit Zuordnung der Items zu Faktor an

Wie kann die Varianz von Messwerten variieren?

1) bei einer Testung einer einzelnen Person zwischen den Teilen des Tests

2) intraindividuell (mehrfach Testung)

3) interindividuell (verschiedene Teilnehmer einer einzelnen Testug)

Einheit und Skalierung Personenparameter

Differenzskalennievau (logarithmierte Verhältnisskala)

Logit Einheit (durch Logit-transformation)

Modell mehrerer gemeinsamer Faktoren

Annahme: Ausprägung einer Person auf einer beobachteten Variable setzt sich aus gewichtete Kombination von Ausprägung auf latenter Variable plus Fehlerterm zusammen

 

z.B. PAF

Oblique Rotation

schiefwinkilge Rotation

Korrelationen werden zugelassen

-> quadrierte Ladungen lassen sich nicht zeilenweise aufsummieren um die Kommunalität zu erhalten

-> Eigenwerte lassen sich nicht zum Maß für die aufgeklärte Gesamtvarianz adieren

+korrelierte Faktoren sind einfacher zu betrachten

Urscahen für Nichtkonvergenz und Heywood Cases

spezifische Objektivität

Aspekt eines Rasch-skalierten Tests

Durch zwei Arten invarianter Vergleiche gekennzeichnet:

Vergleiche zwischen Personen sind invariant über die spezifischen Maße und Items

Vergleiche zwischen Items sind invariant über spezifische Personen

RMSEA (mc)

Was spricht grundsätzlich gegen die interne Konsistenz zur Bestimmung der Reliabilität

Speedtest

Test zur Messung von heterogenen Merkmalen

taukongenerische Messungen

Messwerte können um eine multiplikative Konstante verschoben sein d.h. in unterschiedlichen Einheiten gemessen

Messung muss eindimensional sein (jedes Item läd nur auf einem FAktor

Faktorladung und Fehlerterme dürfen in der Höhe variieren

lokal stochastische Unabhängigkeit

strengeres Kriterium als lokale Unabhängigkeit für Eindimensionalität

Gegeben, wenn für einzelne Person die Lösungswahrscheinlichkeiten zweier beliebiger Items multipliziert werden dürfen um kombinierte Lösungswahrscheinlichkeit zu erhalten

Kontrastgruppenmethode

Bsp. externale Konstruktion

in MMPI angewendet

Items werden aus Pool ausgewählt, die signifikant zwischen zwei Gruppen unterscheiden (psychisch auffällig vs unauffällig)

dichotome Auswahlaufgaben

+einfache Auswertung

+erleichert Anwendung PTT erheblich

-hohe Zufallslösung, muss durch längere Tests ausgeglichen werden

-Informationsverlust

Wann ist die Trennschärfe am höchsten?

Bei mittlerer Itemschwieirgkeit ( und hohe Streuung)

Am häufigsten verwendete Varianten der EFA

Hauptachsenanalyse (principal axis factor analysis PAF)

Hauptkomponentenanalyse (principal components analysis PCA)

Anteil der faksch klassifizieren Personen die das Kriterium nicht erfüllen

Quote falscher Alarme

Merkmale Fit-Indizes

Versuchen Ausmaß der Modellgüte in einem Index zu quantifizieren (wie Effektstärke zu interpretieren)

standardisierte Bereich zumeist 0-1Cut-off Wert

beruhen auf chiquadrat-Test und versuchen Sensivität gegenüber Stichprobengröße, Freiheistgraden bzw beiden durch Korrekturfaktor auszugleichen

kein Signifikanztest auch wenn hier ebenso Grenzen für Cut-off Werte willkürlich gesetzt werden

Vorzugsweise verschiedene Fit-indizes berichten (aus verschiedenen Klassen)

Aufgaben mit freiem Antwortformat

Kurzaufsatzaufgaben

Ergänzungsaufgaben

eher bei Fähigkeits und Leistungstest da endliche Anzahl objektiver Lösungen

+keine Zufallslösungen möglich

+qualitative  Auswertung möglich (durch Lösungsweg)

+unerlässlich bei Wissenstest, stilistische Begabungs-Test

-fehlende Standardisierung

-erschöpfende Musterlösung

-ggf. Verletzung stochastischer Unabhängigkeit

-Vergleich

-Objektivität

-Auswertungsaufwand

Wie werden in der Sem in Pfadanalysen manifeste Variablen (Indikatoren) dargestellt?

rechteckige Kästchen

lateinische Buchstaben

Trennschärfe in der PTT

Steigung der Itemfunktion (ICC) wieder

Steigung der Tangente im Wendepunkt (p=.50)

je höher Trennschärfe desto steiler die Steigung (Null bis pluss unendlich)

Methode der kritischen Ereignisse

critical incident technique (CIT)

aus Organsiationspsychologie ursprünglich " Verfahren der beruflichen Leistungsbeurteilung"

heute

Arbeits und Organisationspsychologie "anforderungsanalytische Fundierung zahlreicher Instrumente"

gute oder unbefriedigende Leistung zeigen sich in konkreten erfolgskritischen Ereignissen

umfangreicher und konkrtetere Situationen als AFA

Umsetzung in Erhebungsinstrument erfolgt mittels unabhängiger Einschätzung der Erfolgswirksamkeit (kurze Zusammenfassung Ereignisse als Anker)

Validität hinsichtlich Vorhersage späterer beruflicher Leistung vielfach empirisch bestätigt, für Verfahren mit Ziel der Maximierung der kriterienbezogenen Validität

Welche Verfahren sind orthogonale Rotationen?

Varimax (dominante Methode)

Quartimax

Equamax

Grundlegender Gegensatz KTT und PTT

In der PTT geht es darum wie Antworten auf Items zustande kommen

-> Zusammenhang von Fähigkeit der Person und Wahrscheinlichkeit mit der eine Person Aufgabe löst

 

Antwortmuster werden betrachtet (statt Rohwertvarianzen und Kovaraianzen)

 

In PTT wird Modelltest durchgeführt (Eindimesnionalität, Zulässigkeit Summation)

In PTT ist es möglich stichprobenunabhängige Item- und Personenkennwerte zu ermitteln

Itemschwierigkeit

Prozentualer Anteil der richtigen Lösungen an allen Lösungen eines Items innerhalb der Stichprobe

Index sinkt je weniger richtige Lösungen vorliegen

Hohe bzw niedrige Itemschwierigkeit bedeutet niedrige Itemvarianz

Wann steigt Cronbach alpha an?

wenn Varianz des Gesamtwertes der Skala steigt

                        dies geschieht je höher positive Korrelation zwischen Items

                        je mehr positiv korrelierter Items zu einer Skala zusammengefasst werden

Überschätzung wenn  die positive Korreliertheit der Items durch einen systematischen Fehler künstich erhöht wird
 

3-Parameter-Modell

Itemparameter

Personenparameter

Itemtrennschärfe

Ratewahrscheinlichkeit

erschöpfende Statistik (PTT)

erschöpfend-> Summenwert liefert alle Informationen über Fähigkeitsausprägung

 

Mixed-Rasch-Modelle

quantifizieren und klassifizieren

Suche nach Personengruppen die sich im Antwortmuster maximal unterscheiden

Innerhalb der klassen gilt Rasch-Modell

Items die zu zweiklassenlösung führen werden elimiert

Referenzvariable

Um eine eindeutige Näherungslösung in der CFA herbeizuführen, muss ein Indikator als Referenzvariable ausgewählt und festgesetzt werden

Häufiges Vorgehen:

~bester (= reliabelster) Einzelindikator wird auf 1 gesetzt -> Faktor hat Metrik der Referenzvariable

Alternativ:

~zugehörigen Residuen oder Varianzen auf 1 setzten

Was stellt die quadrierte Ladung inhaltlich dar?

Anteil gemeinsamer Varianz (Item und Faktor) an Gesamtvarianz der beteiligten Variable