Glossar Moosbrugger Kelava Testkonstruktion Modul 6a Fernuniversität Hagen

Glossar Moosbrugger Kelava Testkonstruktion Modul 6a Fernuniversität Hagen

Glossar Moosbrugger Kelava Testkonstruktion Modul 6a Fernuniversität Hagen


Set of flashcards Details

Flashcards 173
Language Deutsch
Category Psychology
Level University
Created / Updated 23.07.2019 / 12.04.2023
Weblink
https://card2brain.ch/box/20190723_glossar_moosbrugger_kelava_testkonstruktion_modul_6a_fernuniversitaet_hagen
Embed
<iframe src="https://card2brain.ch/box/20190723_glossar_moosbrugger_kelava_testkonstruktion_modul_6a_fernuniversitaet_hagen/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
Ratekorrektur

"Zieht bei der Testwertbestimmung jene Anzahl an ""richtigen"" Lösungen ab, die nur durch Erraten der richtigen Antworten entstanden ist."

Receiver-Operating-Characteristics-(ROC)-Analyse

Die Receiver-Operating-Characteristics-(ROC)-Analyse ermöglicht für eine binäre Klassifikation (z.B. krank vs. nicht krank) den zur Fallunterscheidung verwendeten Schwellenwert optimal in der Weise festzulegen, dass Trefferquote und Quote korrekter Ablehnungen maximiert werden.

Reliabilität (Gütekriterium)

Bezeichnet die Messgenauigkeit eines Tests. Ein Testverfahren ist perfekt reliabel, wenn die damit erhaltenen Testwerte frei von zufälligen Messfehlern sind. Je höher die Einflüsse solcher zufälligen Messfehler sind, desto weniger reliabel ist das Testverfahren.

Reliabilität (KTT)

Gütekriterium zur Beurteilung der Messgenauigkeit eines Tests. In der Klassischen Testteorie wird Reliabilität als Verhältnis zwischen true score-Varianz Var(τ) und Testwertevarianz Var(x) definiert.

Repräsentative Aufgabenstichprobe

Stimmt hinsichtlich der Schwierigkeitsverteilung mit der Grundgesamtheit aller merkmalsrelevanten Aufgaben überein und erlaubt somit eine kriteriumsorientierte Testwertinterpretation in Bezug auf die Aufgabeninhalte.

Repräsentativität

Eine Stichprobe weist dieses Merkmal dann auf, wenn sie hinsichtlich ihrer Zusammensetzung die jeweilige Zielpopulation möglichst genau abbildet.

Retest-Reliabilität

Methode der Reliabilitätsschätzung. Ein Test wird zu zwei Messzeitpunkten der gleichen Stichprobe vorgegeben. Die Korrelation der Testwerte beider Messzeitpunkte dient als Maß der Reliabilität des Tests.

Retrospektive Befragung

"In der Testentwicklungsphase wird der Proband ""zurückblickend"" über Schwierigkeiten bei der Beantwortung der einzelnen Items befragt."

Schwellenwert

Im Rahmen kriteriumsorientierter Testwertinterpretation jener Testwert, ab dem das Kriterium als zutreffend angenommen wird. Kann z.B. mittels ROC-Analyse empirisch bestimmt werden.

Schwierigkeitsparameter (IRT)

σi ist ein Itemparameter, der durch jene Merkmalsausprägung ξ definiert ist, bei der die Lösungswahrscheinlichkeit des Items 50% beträgt.

Sicherung

Die Pflicht zur Regelung der Verfügbarkeit, Aufbewahrungsdauer und Verwendung von Testdaten (inkl. des Testprotokolls und aller schriftlichen Belege) und Schutz der Identität von Probanden.

Skalierung

Ein Test erfüllt dieses Gütekriterium, wenn die laut Verrechnungsregel resultierenden Testwerte die empirischen Merkmalsrelationen adäquat abbilden.

Soziale Erwünschtheit

Beinhaltet die Antworttendenz eines Probanden, sich selbst so darzustellen, wie es soziale Normen seiner Wahrnehmung nach erfordern (auch soziale Desirabilität genannt).

Spearman-Brown-Korrektur

Formel zur Schätzung der Reliabilität eines Tests bei Verlängerung des Tests um homogene Testteile; findet auch bei der Splithalf-Reliabilität Verwendung, bei der die Halbtest-Reliabilität auf die Reliabilität des Gesamttests aufgewertet wird.

Speedtests

Leistungstests mit meist einfachen Aufgaben, wobei erhoben wird, wie viele Aufgaben unter Zeitdruck gelöst werden können. (Auch: Geschwindigkeitstests)

Spezifische Objektivität

Liegt vor, wenn alle IC-Funktionen die gleiche Form aufweisen, d.h. lediglich entlang der ξ-Achse parallel verschoben sind. Ist dies der Fall, kann der Schwierigkeitsunterschied zweier Items (σj - σi) unabhängig davon festgestellt werden, ob Personen mit niedrigen oder hohen Merkmalsausprägungen ξ untersucht wurden. In Umkehrung kann auch der Fähigkeitsunterschied zweier Personen (ξw – ξv) unabhängig von den verwendeten Items festgestellt werden.

Spezifität

Beschreibt das Ausmaß der durch die Situation und die Person-Situation-Interaktion erklärten Varianz relativiert an der Gesamtvarianz einer Messvariablen.

Splithalf-(Testhalbierungs-) Reliabilität

Methode der Reliabilitätsschätzung. Aus den Items eines Tests werden zwei möglichst parallele Testhälften gebildet. Aus der Korrelation der Testwerte der Halbtests wird mittels Spearman-Brown-Korrektur die Reliabilität des Gesamttests geschätzt.

Standardabweichung SD(x)

Die Standardabweichung gibt die Streuung der Testwertvariable x-quer um den Mittelwert an. Ist die Testwertvariable normalverteilt, so befinden sich im Bereich xquer ± 1 /SD(x) ca. 68% der Testwerte, im Bereich xquer ± 2 /SD(x)ca. 95% der Testwerte.

Standardmessfehler SD(ε)

Der Standardmessfehler SD(ε) eines Tests resultiert aus der Unreliabilität des Tests und errechnet sich als Wurzel aus der Fehlervarianz eines Tests. Der Standardmessfehler ist bei höherer Reliabilität kleiner und bei niedrigerer Reliabilität größer.

Standardnormen

Die z-Norm sowie weitere durch Lineartransformationen gewonnene Normen (z.B. IQ- oder T-Norm).

State

Ein zeitlich begrenzter biologischer, emotionaler und kognitiver Zustand, in dem sich eine Person befinden kann. Er kennzeichnet sich durch personenbedingte (d.h. trait-bedingte), situativ bedingte und durch die Interaktion zwischen Person und Situation bedingte Einflüsse.

Stichprobenunabhängigkeit

Bedeutet, dass in IRT-Modellen die Itemparameter unabhängig von den Personen und die Personenparameter unabhängig von den Items geschätzt werden können.

Strukturell unterschiedliche Methoden

Solche Methoden, die nicht austauschbar sind, weil sie sich qualitativ von anderen Methoden unterscheiden und kein Zufallsauswahl darstellen. Strukturell unterschiedliche Methoden sind z.B. Selbst- und Fremdbeurteilungen.

TBS-TK

Veröffentlichtes Testbeurteilungssystem des Testkuratoriums zur standardisierten Erstellung und Publikation von Testrezensionen anhand eines vorgegebenen Kriterienkataloges.

Teaching to the test

Ist ein Phänomen, das die Validität bewertender Interpretationen im Bildungssystem dadurch gefährdet, dass gezielt spezielle Aufgaben geübt werden, um ein besseres Abschneiden der Schülerinnen und Schüler bei den Tests zu gewährleisten.

Tendenz zur Mitte

Eine Antworttendenz, die extreme Antworten eher vermeidet und mittlere Antwortkategorien eher bevorzugt.

Testadaptation

Bezeichnet den Prozess einer qualitativ hochwertigen Übertragung (Übersetzung unter Berücksichtigung von Konstruktäquivalenz) und empirischen Evaluation psychologischer Tests aus anderen Sprachen und in andere Sprachen unter Beachtung der kulturellen Unterschiede.

Testeichung

Dient dazu, Normwerte zur normorientierten Testwertinterpretation zu gewinnen. Dazu wird der Test an Personen einer Normierungsstichprobe, welche hinsichtlich einer definierten Bezugsgruppe repräsentativ ist, durchgeführt.

Testgütekriterien

Stellen ein System zur Qualitätsbeurteilung psychologischer Tests dar. Folgende 10 werden üblicherweise unterschieden: Objektivität, Reliabilität, Validität, Skalierung, Normierung (Eichung), Testökonomie, Nützlichkeit, Zumutbarkeit, Unverfälschbarkeit und Fairness.

Testitem

Zu beantwortende Aufgabe (Frage, Statement etc.) eines Tests.

Testkuratorium

Gremium der Föderation Deutscher Psychologievereinigungen (Deutsche Gesellschaft für Psychologie e.V. und Berufsverband Deutscher Psychologinnen und Psychologen e.V.), dessen Aufgabe es ist, die Öffentlichkeit vor unzureichenden diagnostischen Verfahren und vor unqualifizierter Anwendung diagnostischer Verfahren zu schützen.

Testökonomie

Ein Test entspricht dann diesem Gütekriterium, wenn er, gemessen am diagnostischen Erkenntnisgewinn, relativ wenig Ressourcen wie Zeit, Geld oder andere Formen beansprucht.

Teststandards

Vereinheitlichte Leitlinien, in denen sich allgemein anerkannte Zielsetzungen zur Entwicklung, Adaptation, Anwendung und Qualitätsbeurteilung psychologischer Tests widerspiegeln.

Testwert

Das individuelle numerische Testresultat; wird aus den registrierten Antworten einer Testperson durch Anwendung definierter Regeln unmittelbar gebildet.

Testwertestreuung SD(x)

Sagt aus, wie breit die empirisch gewonnenen Testwerte einer Stichprobe um den Mittelwert der Testwerte verteilt sind. Die Streuung der Testwerte wird meist als Standardabweichung SD(x) angegeben; man gewinnt sie als Wurzel aus der Testwertevarianz Var(x).

Testwertevarianz Var(x)

Die Testwertevarianz Var(x) ist die Varianz der beobachteten Testwerte. Sie setzt sich aus der wahren Varianz Var(τ) und der Fehlervarianz Var(ε) zusammen.

Trait

Mehr oder weniger zeitlich stabiles Merkmal (Disposition), das personeninhärent und transsituativ überdauernd ist.

Trait-Methoden-Einheit

In der Multitrait-Multimethod-Analyse wird angenommen, dass in jeder Messung Einflüsse des zu messenden Konstrukts und der verwendeten Messmethode zu finden sind. (Multiple) Messungen eines Traits repräsentieren somit eine Trait-Methoden-Einheit.

Treffsicherheit

Index zur Beurteilung der Güte eines LCA-Modells. Definiert als die durchschnittliche Höhe der maximalen bedingten Klassenzuordnungswahrscheinlichkeit Pmax(g|av) über alle in der Stichprobe vorkommenden Antwortmuster (Na) hinweg.