testkonstruktion

Testkonstruktion

Testkonstruktion


Kartei Details

Karten 269
Sprache Deutsch
Kategorie Psychologie
Stufe Grundschule
Erstellt / Aktualisiert 22.08.2014 / 13.09.2020
Weblink
https://card2brain.ch/box/testkonstruktion1
Einbinden
<iframe src="https://card2brain.ch/box/testkonstruktion1/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

2-Parameter-Modell (auch Birnbaum-Modell)

zusätzlich zu Item und Personenparameter noch einen trennschärfeparameter

Trennschärfe einzelner Items kann sich unterscheiden

Konsequenz: die Steigung ändert sich

Kritisch:

-unterschiede in Trennschärfe und Schweirigkeit können dazu führen, dass Items mit größerer Schwierigkeit und geringerer Trennschärfe eine höhere Lösungswahrscheinlichkeit besitzen, als leichtere trennschärfere Items

-unterschiedliche Trennschärfen müssen auf Kosten der Schätzgenauigkeit  geschätzt werden

-ungewichtete Summenwertbildung nicht mehr zulässig (Gewichtung mit der Itemtrennschärfe wäre nötig)

 

esbräuchte Nahweis der Eindimensionalität des Tests

 

Goodness-of-Fit-Indizes

Ausmaß der Verbesserung bei no model at all

GFI und nach Freiheitsgraden adjustierte Variante AGFI

Hohe Werte gute Passung

Anteil durch das implizierte Modell aufgeklärte Varianz an der Gesamtvarainz

-> wegen Sensivität ist hiervon abzuraten

negative Schiefe

rechtssteile Verteilung

Summenwert in der PTT

Zulässigkeit der Summation wird geprüft

Bei Geltung des Modells misst der Summenwert die Fähigkeitsausprägung (latente Variable)

Erschöpfende Statistik der Personenfähigkeit

Welche Extraktionsmethode in der EFA erfodert die größte Stichprobe?

Trennschärfe

Für das Ausmaß, in dem die Differenzierung der Probanden in „Löser“ und „Nichtlöser“ durch das Item mit der durch die Gesamtskala übereinstimmt

in KTT ist Trennschärfe guter Indikator wie gut einzelne Items das zugrunde liegende Merkmal abbilden

korrigierte Korrelation einer Aufgabe mit Skala

Was stimmt?

Vorteile rationale Konstruktprinzip

intuitiv unmittelbar zugängliche Ergebnisse

kein oder nur geringer Validitätsverlust bei Übertragung auf andere Situationen bzw Replikationen

CCC (Category Characteristic Curves)

Kategorienfunktion

für Ratingskalen /ordinale Raschmodelle

bei mehr als zwei geordneter Antwortalternativen

Interrater -Reliabilität (Beurteilerübereinstimmung)

zahlreiche Maße

Intraklassenkorrelation:  intervallskalierte Merkmale, justiert (gleiche Varianz der Urteile) oder unjustiert (zusätzlich gleiche Mittelwertebzw. 0-1

Vorteile Paralleltest- Reliabilität

weder Homogenität noch Stabilität wird vorausgesetzt

Einflüsse Messintervalle entfallen

Womit steigen die Anforderungen an die Stichprobengröße bei der EFA?

je weniger Items je Faktor

je weniger reliabel

Interne Konsistenz

Markiervariablen

Items, die sich eindeutig zuordnen lassen also rel. hoch auf einen Faktor und niedrig auf die anderen laden

Probleme internale Testkonstruktion

große STichproben nötig zur Replikation

subjektive Interpretation der Skalen

Kriterienbezogene Validität kann eingeschränkt sein

Minderungskorrektur/ Attenuationskorrektur

Tests sind nicht Perfekt reliabel, was zu einer Unterschätzung der latenten KOrrelation führt

Konstrukt oder auch kriterienbezogene Validität berechnet sich die Korrelation aus gemeinsamer Varianz der beiden Variablen- diese KOvarianz ausschließlich systematische Varianz (bei Unkorreliertheit der Variabalen)

maximale Korrelation ist  um unkorrelierte Fehleranteile in beiden Variablen eingeschränkt

Korrektur für eine oder beide Variablen

Minderungskorrektur ist nur sinnvoll bei Eindimensionalität-> sonst Überschätzung

bei rein Anwendungsbezogenen Fallen einfach bei Frage nach Beziehung auf Konstruktebene zwefach Korrektur

Kategorien Tests nach Inhalt

Leistungstests: (Aufschluss über Fähigkeiten und Fertigkeiten, Problemlöseaufgaben richtig/falsch)

Psychometrische Persönlichkeitstests/ Persönlichkeits-Struktur-Test: Gefühle.Vorlieben, Abneigungen, interessen und Meinungen (subjektive Selbstbeurteilungen und Selbstbeschreibungen; Inventare bei mehreren Merkmalen)

Persönlichkeits- Entfaltungsverfahren: projektive Tests, unstrukturiertes Matrial oder mehrdeutigen Bildern, Bsp. rorschachtest Problem: häufig nicht nach testtheoretischen Prinzipien konstruiert, anders semi-projektiv

Prüfung tau-äquivalenz und Parallelität

zusätzliche Gleichheitsrestriktionen der Ladungs bzw. Fehlverkotren notwendig

Was sollte für die Itemselektion betrachtet werden? (KTT)

Itemschwierigkeit

Trennschärfe

ggf. Varianz und andere deskriptive Faktoren

Korrelation Außenkrierien

abwägen zu inhaltlichen Gesichtspunkten

Einfachstruktur

Ladungsmuster: möglichst jedes Item läd auf einen bestimmten Fakor hoch, auf den anderen niedirg oder gar nicht

Durch Rotation wird Lage der Faktoren verändert

NICHT Items oder Faktorenzahl

Was wird für die Faktorenanalyse zweiter Ordnung benötigt?

Was wird gemacht?

Korrelationsmatrix  der Primärfaktoren/ Korrelationsmatrix der rotieren Komponenten

korrelierte Faktorwerte werden auf gemeinsame Sekundärfaktoren untersucht und von den spezfischen Varianz der Primärfaktoren getrennt

Was sagt Heterotrait-Heteromethod Koeffizient?

diskriminante Validität wenn niedriger als Monotrait-Heteromethod

Logit Wertebereich

plus und minus unendlich

Wo lese ich in SPSS die Trennschärfe ab?

korrigierte Item-Skala-Korrelation

Was ist nötig für Faktorenanalyse zweiter Ordnung?

AFA

act frequency approach

Metatheorie der Persönlichkeit

Dispositionen als kognitive Kategorien, in denen Verhaltensweisen nach der Häufigkeit ihres Auftretens ohne eigentlichen Erklärungswert zusammengefasst werden

Bsp. Peter ist klug -> Peter zeigt in Zeitraum relativ viele kluge Verhaltensweisen im Verhleich zur Gesamtpopulation

Vorgehen: psychogische Laien bennen konkrete Verhaltensweisen einer Person die hohe Ausprägung hat auf der untersuchten eigenschat aus dem Bekanntenkreis -> Itemsammlung

Itemsammlung wird von anderer Testgruppe auf Prototypizität eingeschätzt

Prinzip der PCA

Varaiblensatz neuen Variablensatz extrahieren, der

nach Bedeutung geordnet ist (jede Komponente klärt Maximum an verbleibender Varianz auf

Berrechnung erfolgt ni einem Schritt

Suche nach Gerade, die von allen Punkten die geringste Entfernung hat als erste Komponente

zweite unabhängige Komponente mit maximaler Aufklärung an Varianz

usw.

variablensatz ist nach varianzaufklärung geordnet

standardisierte Varianz (Eigenwert)><1 [Ausgangsvariablen standardisiert 1]

Mimnimum an komplexität soll Maximun an Informationen bewahren

datenreduzierendes Verfahren

Was sagen die Koeffizienten Heterotrait-Monomethod und was muss zusätzlich erfült sein?

Diskriminante Validität

wenn niedirger als Monot-monom und Monot-Hetreom

Minderung sozialer Erwünschtheit

subtile Items (Zielrichtung möglichst undurchschaubar)

forced-choice ( aus mehreren gleich erwünscht erscheinenden Antwortalternativen muss gewählt werden)

objektive Tests (Leistungstest)

Instruktion/ Warnung vor Aufdeckung Verfäschlungstendenzen (z.B. Lügendetektor bogues pipeline)

Erwünschtheitsskalen

bogues items (Kenntnisse oder Erfahrungen mit nicht existierenden Gegenständen)