testkonstruktion
Testkonstruktion
Testkonstruktion
Kartei Details
Karten | 269 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Grundschule |
Erstellt / Aktualisiert | 22.08.2014 / 13.09.2020 |
Weblink |
https://card2brain.ch/box/testkonstruktion1
|
Einbinden |
<iframe src="https://card2brain.ch/box/testkonstruktion1/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
2-Parameter-Modell (auch Birnbaum-Modell)
zusätzlich zu Item und Personenparameter noch einen trennschärfeparameter
Trennschärfe einzelner Items kann sich unterscheiden
Konsequenz: die Steigung ändert sich
Kritisch:
-unterschiede in Trennschärfe und Schweirigkeit können dazu führen, dass Items mit größerer Schwierigkeit und geringerer Trennschärfe eine höhere Lösungswahrscheinlichkeit besitzen, als leichtere trennschärfere Items
-unterschiedliche Trennschärfen müssen auf Kosten der Schätzgenauigkeit geschätzt werden
-ungewichtete Summenwertbildung nicht mehr zulässig (Gewichtung mit der Itemtrennschärfe wäre nötig)
esbräuchte Nahweis der Eindimensionalität des Tests
Goodness-of-Fit-Indizes
Ausmaß der Verbesserung bei no model at all
GFI und nach Freiheitsgraden adjustierte Variante AGFI
Hohe Werte gute Passung
Anteil durch das implizierte Modell aufgeklärte Varianz an der Gesamtvarainz
-> wegen Sensivität ist hiervon abzuraten
negative Schiefe
rechtssteile Verteilung
Summenwert in der PTT
Zulässigkeit der Summation wird geprüft
Bei Geltung des Modells misst der Summenwert die Fähigkeitsausprägung (latente Variable)
Erschöpfende Statistik der Personenfähigkeit
Welche Extraktionsmethode in der EFA erfodert die größte Stichprobe?
Trennschärfe
Für das Ausmaß, in dem die Differenzierung der Probanden in „Löser“ und „Nichtlöser“ durch das Item mit der durch die Gesamtskala übereinstimmt
in KTT ist Trennschärfe guter Indikator wie gut einzelne Items das zugrunde liegende Merkmal abbilden
korrigierte Korrelation einer Aufgabe mit Skala
Was stimmt?
Vorteile rationale Konstruktprinzip
intuitiv unmittelbar zugängliche Ergebnisse
kein oder nur geringer Validitätsverlust bei Übertragung auf andere Situationen bzw Replikationen
CCC (Category Characteristic Curves)
Kategorienfunktion
für Ratingskalen /ordinale Raschmodelle
bei mehr als zwei geordneter Antwortalternativen
Interrater -Reliabilität (Beurteilerübereinstimmung)
zahlreiche Maße
Intraklassenkorrelation: intervallskalierte Merkmale, justiert (gleiche Varianz der Urteile) oder unjustiert (zusätzlich gleiche Mittelwertebzw. 0-1
Vorteile Paralleltest- Reliabilität
weder Homogenität noch Stabilität wird vorausgesetzt
Einflüsse Messintervalle entfallen
Womit steigen die Anforderungen an die Stichprobengröße bei der EFA?
je weniger Items je Faktor
je weniger reliabel
Interne Konsistenz
Markiervariablen
Items, die sich eindeutig zuordnen lassen also rel. hoch auf einen Faktor und niedrig auf die anderen laden
Probleme internale Testkonstruktion
große STichproben nötig zur Replikation
subjektive Interpretation der Skalen
Kriterienbezogene Validität kann eingeschränkt sein
Minderungskorrektur/ Attenuationskorrektur
Tests sind nicht Perfekt reliabel, was zu einer Unterschätzung der latenten KOrrelation führt
Konstrukt oder auch kriterienbezogene Validität berechnet sich die Korrelation aus gemeinsamer Varianz der beiden Variablen- diese KOvarianz ausschließlich systematische Varianz (bei Unkorreliertheit der Variabalen)
maximale Korrelation ist um unkorrelierte Fehleranteile in beiden Variablen eingeschränkt
Korrektur für eine oder beide Variablen
Minderungskorrektur ist nur sinnvoll bei Eindimensionalität-> sonst Überschätzung
bei rein Anwendungsbezogenen Fallen einfach bei Frage nach Beziehung auf Konstruktebene zwefach Korrektur
Kategorien Tests nach Inhalt
Leistungstests: (Aufschluss über Fähigkeiten und Fertigkeiten, Problemlöseaufgaben richtig/falsch)
Psychometrische Persönlichkeitstests/ Persönlichkeits-Struktur-Test: Gefühle.Vorlieben, Abneigungen, interessen und Meinungen (subjektive Selbstbeurteilungen und Selbstbeschreibungen; Inventare bei mehreren Merkmalen)
Persönlichkeits- Entfaltungsverfahren: projektive Tests, unstrukturiertes Matrial oder mehrdeutigen Bildern, Bsp. rorschachtest Problem: häufig nicht nach testtheoretischen Prinzipien konstruiert, anders semi-projektiv
Prüfung tau-äquivalenz und Parallelität
zusätzliche Gleichheitsrestriktionen der Ladungs bzw. Fehlverkotren notwendig
Was sollte für die Itemselektion betrachtet werden? (KTT)
Itemschwierigkeit
Trennschärfe
ggf. Varianz und andere deskriptive Faktoren
Korrelation Außenkrierien
abwägen zu inhaltlichen Gesichtspunkten
Einfachstruktur
Ladungsmuster: möglichst jedes Item läd auf einen bestimmten Fakor hoch, auf den anderen niedirg oder gar nicht
Durch Rotation wird Lage der Faktoren verändert
NICHT Items oder Faktorenzahl
Was wird für die Faktorenanalyse zweiter Ordnung benötigt?
Was wird gemacht?
Korrelationsmatrix der Primärfaktoren/ Korrelationsmatrix der rotieren Komponenten
korrelierte Faktorwerte werden auf gemeinsame Sekundärfaktoren untersucht und von den spezfischen Varianz der Primärfaktoren getrennt
Was sagt Heterotrait-Heteromethod Koeffizient?
diskriminante Validität wenn niedriger als Monotrait-Heteromethod
Logit Wertebereich
plus und minus unendlich
Wo lese ich in SPSS die Trennschärfe ab?
korrigierte Item-Skala-Korrelation
Was ist nötig für Faktorenanalyse zweiter Ordnung?
AFA
act frequency approach
Metatheorie der Persönlichkeit
Dispositionen als kognitive Kategorien, in denen Verhaltensweisen nach der Häufigkeit ihres Auftretens ohne eigentlichen Erklärungswert zusammengefasst werden
Bsp. Peter ist klug -> Peter zeigt in Zeitraum relativ viele kluge Verhaltensweisen im Verhleich zur Gesamtpopulation
Vorgehen: psychogische Laien bennen konkrete Verhaltensweisen einer Person die hohe Ausprägung hat auf der untersuchten eigenschat aus dem Bekanntenkreis -> Itemsammlung
Itemsammlung wird von anderer Testgruppe auf Prototypizität eingeschätzt
Prinzip der PCA
Varaiblensatz neuen Variablensatz extrahieren, der
nach Bedeutung geordnet ist (jede Komponente klärt Maximum an verbleibender Varianz auf
Berrechnung erfolgt ni einem Schritt
Suche nach Gerade, die von allen Punkten die geringste Entfernung hat als erste Komponente
zweite unabhängige Komponente mit maximaler Aufklärung an Varianz
usw.
variablensatz ist nach varianzaufklärung geordnet
standardisierte Varianz (Eigenwert)><1 [Ausgangsvariablen standardisiert 1]
Mimnimum an komplexität soll Maximun an Informationen bewahren
datenreduzierendes Verfahren
Was sagen die Koeffizienten Heterotrait-Monomethod und was muss zusätzlich erfült sein?
Diskriminante Validität
wenn niedirger als Monot-monom und Monot-Hetreom
Minderung sozialer Erwünschtheit
subtile Items (Zielrichtung möglichst undurchschaubar)
forced-choice ( aus mehreren gleich erwünscht erscheinenden Antwortalternativen muss gewählt werden)
objektive Tests (Leistungstest)
Instruktion/ Warnung vor Aufdeckung Verfäschlungstendenzen (z.B. Lügendetektor bogues pipeline)
Erwünschtheitsskalen
bogues items (Kenntnisse oder Erfahrungen mit nicht existierenden Gegenständen)