Glossar Moosbrugger Kelava Testkonstruktion Modul 6a Fernuniversität Hagen

Glossar Moosbrugger Kelava Testkonstruktion Modul 6a Fernuniversität Hagen

Glossar Moosbrugger Kelava Testkonstruktion Modul 6a Fernuniversität Hagen


Set of flashcards Details

Flashcards 173
Language Deutsch
Category Psychology
Level University
Created / Updated 23.07.2019 / 12.04.2023
Weblink
https://card2brain.ch/box/20190723_glossar_moosbrugger_kelava_testkonstruktion_modul_6a_fernuniversitaet_hagen
Embed
<iframe src="https://card2brain.ch/box/20190723_glossar_moosbrugger_kelava_testkonstruktion_modul_6a_fernuniversitaet_hagen/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
Likelihood (LCA)

In der Latent Class Analyse (LCA) ist die Likelihood das Anpassungskriterium bei der Parameterschätzung. Es ist dort definiert als das Produkt der unbedingten Antwortmusterwahrscheinlichkeiten P(av) über alle Antwortmuster in der Stichprobe (Na) hinweg.

Likelihood-Ratio-Test (LRT)

Möglichkeit zur inferenzstatistischen Absicherung der Güte eines LCA-Modells: Der Test wird zur inferenzstatistischen Absicherung des Unterschieds zweier geschachtelter Modelle („nested models“) verwendet.

Linear-logistische Modelle

Zerlegen die Schwierigkeitsparameter der Items in für die Bearbeitung des Items erforderliche Basisoperationen. Jeder der Schwierigkeitsparameter wird als Linearkombination einer möglichst geringen Anzahl von Basisparametern ausgedrückt.

Lizenzprüfung nach DIN 33430

Nachweis einschlägiger Kenntnisse von Auftragnehmern (Lizenz A), bzw. Mitwirkenden an Verhaltensbeobachtungen (Lizenz MV) und von Mitwirkenden an Eignungsinterviews (Lizenz ME) gemäß DIN 33430.

Lokale stochastische Unabhängigkeit

Bedingung, die erfüllt sein muss, um die Korrelation zwischen zwei Testitems auf eine dahinterliegende latente Persönlichkeitsvariable zurückführen zu können. Die lokale stochastische Unabhängigkeit liegt dann vor, wenn die Korrelation zwischen den Items verschwindet, wenn man sie auf den einzelnen („lokalen“) Stufen des latenten Persönlichkeitsmerkmals untersucht.

Manifeste Variablen

Variablen zur Erfassung des beobachtbaren Antwortverhaltens mit verschiedenen Items, die Indikatoren für die latente Dimensionen darstellen.

Messeffizienz

Parameter eines Tests, das sich sich durch den Quotienten aus Messpräzision und Testlänge berechnet, wobei letztere häufig durch die Anzahl präsentierten Items quantifiziert wird.

Messmodell

Im Rahmen von Strukturgleichungsmodellen: Teilmodelle, in denen die Zuordnungen der beobachteten Variablen zu den Faktoren erfolgt.

Messpräzision

Grad der Übereinstimmung von wahren Merkmalsauprägungen und den Testwerten. Auf Skalenebene oft durch die mittlere quadratische Abweichung von wahrer und geschätzter Merkmalsausprägung bestimmt.

Methodeneffekte

Ein Sammelbegriff für verschiedene systematische Varianzquellen bei der Multitrait-Multimethod-Analyse, die sich über den Trait hinausgehend auf die Validität der Messung auswirken können. Hierbei kann es sich u.a. um Charakteristika der eingesetzten Messinstrumente, der Beurteiler oder der Situationen, in der eine Messung erfolgt, handeln.

Methodenspezifitätskoeffizient

Gibt den Anteil an beobachteter Varianz wieder, der auf den Einfluss eines Methodeneffektes zurückzuführen ist. Je höher der Methodenspezifitätskoeffizient ausfällt, desto stärker ist der Einfluss der Messmethode auf die Messung.

Mischverteilungs-Rasch-Modelle

Kombination aus Rasch-Modell und Latent-Class-Analyse. Innerhalb jeder Klasse wird versucht, jeweils ein eigenes Rasch-Modell anzupassen. Zwischen den latenten Klassen unterscheiden sich die Parameter des Rasch-Modells.

Modelldifferenztest

Werden mit der konfirmatorischen Faktorenanalyse hierarchisch geschachtelte Modelle spezifiziert und gegeneinander getestet, so kann der Unterschied im Modellfit statistisch über die Differenz der Chi-Quadrat-Werte beider Modelle überprüft werden, die wiederum Chi-Quadrat-verteilt ist.

Multidim. adaptives Testen

Eine spezielle Form des adaptiven Testen bei der mehrere latente Dimensionen als ursächlich für das beobachtete Antwortverhalten angesehen werden; aus den Antworten wird simultan auf mehrere latente Merkmale geschlossen.

Multiple Regression

Mittels einer multiplen Regression wird eine Kriteriumsvariable anhand mehrerer Prädiktoren vorhergesagt.

Multitrait-Multimethod-Analyse

Verfahren zum Nachweis der Konstruktvalidität unter Berücksichtigung einer systematischen Kombination von mehreren Traits und mehreren Messmethoden.

Nested Models

(Geschachtelte) Modelle, die durch Parameterrestriktionen ineinander überführbar sind.

Nomologisches Netz

Beziehungsgeflecht zwischen (latenten) Konstrukten und beobachtbaren Testvariablen dar. Die beiden Ebenen werden mit Axiomen bzw. empirischen Gesetzen beschrieben und durch Korrespondenzregeln miteinander verbunden.

Normaktualisierung

Erneute Testeichung, sobald die empirische Überprüfung der Gültigkeit von Normen ergeben hat, dass sich die Merkmalsverteilung in der Bezugsgruppe seit der vorherigen Testeichung bedeutsam verändert hat.

Normalisierung

Bei der Normalisierung wird eine nicht-normalverteilte Testwertvariable zur besseren Interpretierbarkeit so transformiert, dass die Variable danach normalverteilt ist. Die Normalisierung ist von der Normierung zu unterscheiden, die bei der Testeichung vorgenommen wird.

Normdifferenzierung

Bildung von separaten Normen für die einzelnen Subpopulationen aus der Eichstichprobe hinsichtlich eines mit dem Untersuchungsmerkmal korrelierten Hintergrundfaktors (z.B. separate Normen für Männer und Frauen).

Normierung (Testeichung)

Dient dazu, zur normorientierten Testwertinterpretation Vergleichswerte zu gewinnen. Dazu werden Testergebnisse von Personen einer "Eichstichprobe" in Normierungstabellen zusammengestellt.

Normorientierte Testwertinterpretation

Besteht darin, dass zu einem individuellen Testwert ein Normwert bestimmt wird, anhand dessen die Testperson bezüglich ihrer individuellen Merkmalsausprägung hinsichtlich ihrer relativen Position innerhalb der Bezugsgruppe eingeordnet wird.

Normwert

Beispiel: Prozentrang, zv-Wert. Ermöglicht es, den Testwert xv einer Testperson hinsichtlich seiner Position in der Testwerteverteilung einer bestimmten Bezugsgruppe zu interpretieren.

Nützlichkeit

Ein Test entspricht dann diesem Gütekriterium, wenn die auf seiner Grundlage getroffenen Entscheidungen (Maßnahmen) mehr Nutzen als Schaden erwarten lassen.

Objektivität eines Tests

Ein Test entspricht dann diesem Gütekriterium, wenn er dasjenige Merkmal, das er misst, unabhängig von Testleiter, Testauswerter und von der Ergebnisinterpretation misst.

Odd-Even-Methode

Methode der Aufteilung eines Tests in Testhälften zur Bestimmung der Splithalf-Reliabilität. Die Items des Tests werden nach ihrer Schwierigkeit geordnet und abwechselnd den beiden Halbtests zugewiesen. Ein Halbtest enthält so alle ungeradzahligen Items, der andere die geradzahligen Items des Gesamttests.

Ordnungsaufgaben

Diese Aufgaben werden bearbeitet, indem die einzelnen Bestandteile der Aufgabe so umgeordnet oder einander zugeordnet werden, dass idealerweise eine logisch passende Ordnung entsteht.

Parallele Tests

Zwei Tests heißen parallele Tests, wenn sie gleiche wahre Werte und gleiche Fehlervarianzen aufweisen.

Paralleltest-Reliabilität

Methode der Reliabilitätsschätzung. Die Reliabilität eines Tests, von dem zwei parallele Formen existieren, wird über die Korrelation der Testwerte der beiden parallelen Testformen geschätzt.

Personenparameter

Unter Personenparametern versteht man in der IRT die latente Merkmalsausprägung ξv einer Person v, die im Rahmen eines IRT-Modells geschätzt wird.

Persönlichkeitsmerkmale

Persönlichkeitsmerkmale sind mehr oder weniger zeitlich stabile psychische und physische Eigenschaften von Probanden (z.B. Extraversion, Körpergröße).

Persönlichkeitstests

Persönlichkeitstests dienen der Erfassung von individuell typischem Verhalten als Indikator für die Ausprägung von Persönlichkeitsmerkmalen (Verhaltens- oder Erlebensdispositionen).

Perzentil

Bezeichnet jenen Testwert, der einem bestimmten Prozentrang in der Normierungsstichprobe entspricht. Beispielsweise wird derjenige Testwert, welcher von 30% der Testwerte unterschritten bzw. höchstens erreicht wird, als 30. P. bezeichnet.

Powertests

Leistungstests mit eher schwierigen Aufgaben, wobei erhoben wird, welches Schwierigkeitsniveau der Aufgaben der Proband ohne Zeitbegrenzung bewältigen kann. (Auch Niveautests genannt)

Probabilistische Modelle

Gehen im Unterschied zu deterministischen Modellen davon aus, dass die Wahrscheinlichkeit, ein Item zu lösen bzw. ihm zuzustimmen, jeden Wert zwischen 0 und 1 annehmen kann; die IC-Funktion entspricht einer monoton steigenden Funktion.

Projektive Tests

Bei diesen Tests kommt mehrdeutiges Stimulusmaterial (meist Bilder) zum Einsatz. Es wird angenommen, dass Probanden unbewusste oder verdrängte Bewusstseinsinhalte in das Bildmaterial hineinprojizieren und dadurch Persönlichkeitsmerkmale ermittelt werden können.

Prozentrang

Gibt an, wie viel Prozent der Bezugsgruppe bzw. Normierungsstichprobe einen Testwert erzielten, der niedriger oder maximal ebenso hoch ist, wie der Testwert xv der Testperson v.

Quartil

Das erste, zweite bzw. dritte Quartil (Q1, Q2, Q3) ist jener Testwert xv, der von 25%, 50% bzw. 75% der Testwerte unterschritten bzw. höchstens erreicht wird.

Rasch-Modelle

Klasse von spezifisch objektiven Modellen in der IRT (Item-Response-Theorie).