testkonstruktion
Testkonstruktion
Testkonstruktion
Set of flashcards Details
Flashcards | 269 |
---|---|
Language | Deutsch |
Category | Psychology |
Level | Primary School |
Created / Updated | 22.08.2014 / 13.09.2020 |
Weblink |
https://card2brain.ch/box/testkonstruktion1
|
Embed |
<iframe src="https://card2brain.ch/box/testkonstruktion1/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was entsteht durch Rotation?
Asymptotically Distribution Free ADF
Gruppe verwandter Methoden (WLS; DWLS ERLS)
keine oder nur eingeschränkte Verteilungseigenschaften werden vorrausgesetzt
+ skaleninvariant
+ skalenfrei
+ stellen Prüfstatistiken bereit
gut für dichotomer oder kategorialer Daten
- sehr große Stichprobengröße (besonders WLS)
Mustermatrix
Ladungen des Items auf Faktor (Faktormustekoeffizienten)
es sind partiell standardisierte Regressionsgewichte des Items mit rotierten Faktoren
werden meistens für Interpretation herangezogen
Musterkoeffizienten können Werte größer 1 und kleiner -1 annehmen
Generalized Least Squares GLS
GLS und ML eng verwandt und ähnliche Eigenschaften
GLS gelichgut oder schlechter als ML -> nur selten Gründe für GLS
Wobei ist Part-whole Korrektur notwendig
Schätzverfahren für Reliabiltäten KTT
Varianz der beobachteten Messwert leicht zu ermitteln
Problem: Varianz der wahren Werte
Bias (systematische Fehler z.B. Testangst) werden der wahren Varianz zugeschlagen
RMSEA
wichtigster Vertreter der Badness-Fit-Indizes
mittlere Diskrepanz der implizierten Matrix pro Freiheitsgrad interpretieren
es lässt Konfidenzintervall berechnen, dass Null möglichst mit einschließen sollte
Welche Verfahren sind oblique Rotationen?
Promax
Direkte Oblimin
iterative Schätzalgorithmen
Maximum Likelihood
Generalized Least Square GLS
Unweighted Least Squares ULS
Asymptotically Distribution Free ADF
Fremdtrennschärfe
Korrelation von Items mit mit den Skalen und oder Testwerten anderer Fragebögen oder Kriterien
Quartimax
strebt Eindeutigkeit Zuordnung der Items zu Faktor an
Wie kann die Varianz von Messwerten variieren?
1) bei einer Testung einer einzelnen Person zwischen den Teilen des Tests
2) intraindividuell (mehrfach Testung)
3) interindividuell (verschiedene Teilnehmer einer einzelnen Testug)
Einheit und Skalierung Personenparameter
Differenzskalennievau (logarithmierte Verhältnisskala)
Logit Einheit (durch Logit-transformation)
Modell mehrerer gemeinsamer Faktoren
Annahme: Ausprägung einer Person auf einer beobachteten Variable setzt sich aus gewichtete Kombination von Ausprägung auf latenter Variable plus Fehlerterm zusammen
z.B. PAF
Oblique Rotation
schiefwinkilge Rotation
Korrelationen werden zugelassen
-> quadrierte Ladungen lassen sich nicht zeilenweise aufsummieren um die Kommunalität zu erhalten
-> Eigenwerte lassen sich nicht zum Maß für die aufgeklärte Gesamtvarianz adieren
+korrelierte Faktoren sind einfacher zu betrachten
Urscahen für Nichtkonvergenz und Heywood Cases
spezifische Objektivität
Aspekt eines Rasch-skalierten Tests
Durch zwei Arten invarianter Vergleiche gekennzeichnet:
Vergleiche zwischen Personen sind invariant über die spezifischen Maße und Items
Vergleiche zwischen Items sind invariant über spezifische Personen
RMSEA (mc)
Was spricht grundsätzlich gegen die interne Konsistenz zur Bestimmung der Reliabilität
Speedtest
Test zur Messung von heterogenen Merkmalen
taukongenerische Messungen
Messwerte können um eine multiplikative Konstante verschoben sein d.h. in unterschiedlichen Einheiten gemessen
Messung muss eindimensional sein (jedes Item läd nur auf einem FAktor
Faktorladung und Fehlerterme dürfen in der Höhe variieren
lokal stochastische Unabhängigkeit
strengeres Kriterium als lokale Unabhängigkeit für Eindimensionalität
Gegeben, wenn für einzelne Person die Lösungswahrscheinlichkeiten zweier beliebiger Items multipliziert werden dürfen um kombinierte Lösungswahrscheinlichkeit zu erhalten
Kontrastgruppenmethode
Bsp. externale Konstruktion
in MMPI angewendet
Items werden aus Pool ausgewählt, die signifikant zwischen zwei Gruppen unterscheiden (psychisch auffällig vs unauffällig)
dichotome Auswahlaufgaben
+einfache Auswertung
+erleichert Anwendung PTT erheblich
-hohe Zufallslösung, muss durch längere Tests ausgeglichen werden
-Informationsverlust
Wann ist die Trennschärfe am höchsten?
Bei mittlerer Itemschwieirgkeit ( und hohe Streuung)
Am häufigsten verwendete Varianten der EFA
Hauptachsenanalyse (principal axis factor analysis PAF)
Hauptkomponentenanalyse (principal components analysis PCA)
Anteil der faksch klassifizieren Personen die das Kriterium nicht erfüllen
Quote falscher Alarme
Merkmale Fit-Indizes
Versuchen Ausmaß der Modellgüte in einem Index zu quantifizieren (wie Effektstärke zu interpretieren)
standardisierte Bereich zumeist 0-1Cut-off Wert
beruhen auf chiquadrat-Test und versuchen Sensivität gegenüber Stichprobengröße, Freiheistgraden bzw beiden durch Korrekturfaktor auszugleichen
kein Signifikanztest auch wenn hier ebenso Grenzen für Cut-off Werte willkürlich gesetzt werden
Vorzugsweise verschiedene Fit-indizes berichten (aus verschiedenen Klassen)
Aufgaben mit freiem Antwortformat
Kurzaufsatzaufgaben
Ergänzungsaufgaben
eher bei Fähigkeits und Leistungstest da endliche Anzahl objektiver Lösungen
+keine Zufallslösungen möglich
+qualitative Auswertung möglich (durch Lösungsweg)
+unerlässlich bei Wissenstest, stilistische Begabungs-Test
-fehlende Standardisierung
-erschöpfende Musterlösung
-ggf. Verletzung stochastischer Unabhängigkeit
-Vergleich
-Objektivität
-Auswertungsaufwand
Wie werden in der Sem in Pfadanalysen manifeste Variablen (Indikatoren) dargestellt?
rechteckige Kästchen
lateinische Buchstaben
Trennschärfe in der PTT
Steigung der Itemfunktion (ICC) wieder
Steigung der Tangente im Wendepunkt (p=.50)
je höher Trennschärfe desto steiler die Steigung (Null bis pluss unendlich)
Methode der kritischen Ereignisse
critical incident technique (CIT)
aus Organsiationspsychologie ursprünglich " Verfahren der beruflichen Leistungsbeurteilung"
heute
Arbeits und Organisationspsychologie "anforderungsanalytische Fundierung zahlreicher Instrumente"
gute oder unbefriedigende Leistung zeigen sich in konkreten erfolgskritischen Ereignissen
umfangreicher und konkrtetere Situationen als AFA
Umsetzung in Erhebungsinstrument erfolgt mittels unabhängiger Einschätzung der Erfolgswirksamkeit (kurze Zusammenfassung Ereignisse als Anker)
Validität hinsichtlich Vorhersage späterer beruflicher Leistung vielfach empirisch bestätigt, für Verfahren mit Ziel der Maximierung der kriterienbezogenen Validität
Welche Verfahren sind orthogonale Rotationen?
Varimax (dominante Methode)
Quartimax
Equamax
Grundlegender Gegensatz KTT und PTT
In der PTT geht es darum wie Antworten auf Items zustande kommen
-> Zusammenhang von Fähigkeit der Person und Wahrscheinlichkeit mit der eine Person Aufgabe löst
Antwortmuster werden betrachtet (statt Rohwertvarianzen und Kovaraianzen)
In PTT wird Modelltest durchgeführt (Eindimesnionalität, Zulässigkeit Summation)
In PTT ist es möglich stichprobenunabhängige Item- und Personenkennwerte zu ermitteln
Itemschwierigkeit
Prozentualer Anteil der richtigen Lösungen an allen Lösungen eines Items innerhalb der Stichprobe
Index sinkt je weniger richtige Lösungen vorliegen
Hohe bzw niedrige Itemschwierigkeit bedeutet niedrige Itemvarianz
Wann steigt Cronbach alpha an?
wenn Varianz des Gesamtwertes der Skala steigt
dies geschieht je höher positive Korrelation zwischen Items
je mehr positiv korrelierter Items zu einer Skala zusammengefasst werden
Überschätzung wenn die positive Korreliertheit der Items durch einen systematischen Fehler künstich erhöht wird
3-Parameter-Modell
Itemparameter
Personenparameter
Itemtrennschärfe
Ratewahrscheinlichkeit
erschöpfende Statistik (PTT)
erschöpfend-> Summenwert liefert alle Informationen über Fähigkeitsausprägung
Mixed-Rasch-Modelle
quantifizieren und klassifizieren
Suche nach Personengruppen die sich im Antwortmuster maximal unterscheiden
Innerhalb der klassen gilt Rasch-Modell
Items die zu zweiklassenlösung führen werden elimiert
Referenzvariable
Um eine eindeutige Näherungslösung in der CFA herbeizuführen, muss ein Indikator als Referenzvariable ausgewählt und festgesetzt werden
Häufiges Vorgehen:
~bester (= reliabelster) Einzelindikator wird auf 1 gesetzt -> Faktor hat Metrik der Referenzvariable
Alternativ:
~zugehörigen Residuen oder Varianzen auf 1 setzten
Was stellt die quadrierte Ladung inhaltlich dar?
Anteil gemeinsamer Varianz (Item und Faktor) an Gesamtvarianz der beteiligten Variable