Lehrbuchaufgaben
Lehrbuch Testtheorie & Testkonstruktion
Lehrbuch Testtheorie & Testkonstruktion
Set of flashcards Details
Flashcards | 18 |
---|---|
Language | Deutsch |
Category | Psychology |
Level | University |
Created / Updated | 17.02.2019 / 12.11.2022 |
Weblink |
https://card2brain.ch/box/20190217_lehrbuchaufgaben
|
Embed |
<iframe src="https://card2brain.ch/box/20190217_lehrbuchaufgaben/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Create or copy sets of flashcards
With an upgrade you can create or copy an unlimited number of sets and use many more additional features.
Log in to see all the cards.
Welche Methoden zur Schätzung der Itemparameter können beim Rasch-Modell herangezogen werden?
Beim Rasch-Modell können zur Schätzung der Itemparameter folgende Schätzmethoden herangezogen werden:
- unbedingte Maximum-Likelihood-Schätzung
· bedingte Maximum-Likelihood-Schätzung
· marginale Maximum-Likelihood-Schätzung
Welche testbaren Konsequenzen impliziert das Rasch-Modell und wie können diese überprüft werden?
Antwort zu Frage 5
Das Rasch-Modell hat folgende testbare Konsequenzen:
1. Gleichheit der Itemparameter in Subpopulationen
2. Implikationen für die Wahrscheinlichkeitsverteilung der Antwortmuster
ie Gleichheit der Itemparameter in Subpopulationen kann durch einen grafischen Modelltest, durch den bedingten Likelihood- Quotienten-Test und durch den Wald-Test überprüft werden.
Wie können abweichende Items und abweichende Personen im Rasch-Modell identifiziert werden?
Antwort zu Frage 6
Abweichende Items und abweichende Personen können im Rasch-Modell anhand von Residualmaßen identifiziert werden.
Wodurch ist das zweiparametrische logistische Modell gekennzeichnet?
Das zweiparametrische logistische Modell ist dadurch gekennzeichnet, dass die Lösungswahrscheinlichkeit eines Items von der Differenz aus der latenten Variablen und einem Schwierigkeitsparameter abhängt, die mit einem Diskriminationsparameter multipliziert wird. Im zweiparametrischen logistischen Modell können sich Items sowohl in ihrer Schwierigkeit als auch in ihrer Diskriminationsfähigkeit unterscheiden.
Wie ist die Trennschärfe definiert und wie kann sie bei dichotomen Variablen bestimmt werden?
Antwort zu Frage 9
Die Trennschärfe ist die Korrelation eines Items mit der Testwertvariablen. Sie kann bei dichotomen Items über die punkt-biseriale Korrelation und die biseriale Korrelation bestimmt werden. Häufig greift man zur Bestimmung der Trennschärfe auf eine Part-Whole-Korrektur zurück. Hierbei nimmt man zur Bestimmung der Trennschärfe eines Items das Item aus der Summierung heraus bzw. korrigiert den Korrelationskoeffizienten.
Wie lauten die drei wesentlichen Gütekriterien psychologischer Tests und was bedeuten sie?
Die drei wesentlichen Gütekriterien psychologischer Tests sind die Objektivität, die Reliabilität und die Validität.
Das Gütekriterium der Objektivität besagt, dass das Ergebnis einer psychologischen Messung nicht von der Person abhängt, die die Untersuchung durchgeführt hat.
Das Gütekriterium der Reliabilität bezieht sich auf die Zuverlässigkeit und somit die Messfehlerabhängigkeit psychologischer Messungen. Je geringer der Messfehlereinfluss ist, desto größer ist die Reliabilität.
Das Gütekriterium der Validität ist gegeben, wenn die Schlüsse, die aufgrund der Messungen mit einem Erhebungsinstrument getroffen werden, gültig sind.
Was sind die wichtigsten Gemeinsamkeiten und Unterschiede zwischen psychologischen und physikalischen Messungen?
Bei psychologischen und physikalischen Messungen geht es darum, ein Merkmal mit hoher Objektivität, Reliabilität und Validität zu messen. Im Gegensatz zur physikalischen Messung gibt es bei der Erfassung psychologischer Merkmale häufig keinen allgemein akzeptierten Vergleichsstandard, den man zur Eichung von Messinstrumenten heranziehen könnte. Dies liegt unter anderem daran, dass häufig eine allgemein akzeptierte Definition eines Merkmals fehlt. Darüber hinaus kann man in der Psychologie das interessierende Merkmal anhand eines einzelnen Messvorgangs häufig nur viel gröber messen als dies bei physikalischen Messungen der Fall ist, und es fehlen generell akzeptierte Maßeinheiten.
Worin bestehen die Grundideen des Rasch-Modells?
Das Rasch-Modell geht von beobachtbaren dichotomen Antwortvariablen wie z. B. der Lösung vs. Nichtlösung einer Aufgabe aus. Dem Rasch-Modell zufolge hängen
die Lösungswahrscheinlichkeiten aller betrachteten Aufgaben (Items) von einer nicht direkt beobachtbaren (latenten) kontinuierlichen Merkmalsvariablen ab. Die Lösungswahrscheinlichkeit einer Person in Bezug auf eine Aufgabe hängt sowohl von der Aufgabenschwierigkeit als auch dem Wert einer Person auf der latenten Variablen ab. Die Lösungswahrscheinlichkeit nimmt mit Zunahme der Werte auf der latenten Variablen zu. Die Abhängigkeit der Lösungswahrscheinlichkeit von der latenten Variablen wird durch eine Itemcharakteristik beschrieben. Im Rasch-Modell verlaufen alle Itemcharakteristiken parallel. Die Lösungswahrscheinlichkeiten aller Items hängen im Rasch-Modell sowohl von der Itemschwierigkeit als auch dem Personenmerkmal ab.
Wie ist ein psychologischer Test im weiteren Sinne definiert?
Nach Krauth (1995, S. 18) besteht ein psychologischer Test „aus einer Menge von Reizen mit den zugehörigen zugelassenen Reaktionen, d. h. aus einer Menge von manifesten Variablen, und einer Vorschrift (Skala), die den Reaktionsmustern der manifesten Variablen Ausprägungen einer oder mehrerer latenter Variablen zuordnet."
Welche Annahmen und Eigenschaften zeichnen psychometrische Modelle im Allgemeinen aus?
In psychometrischen Modellen wird das Verhalten als eine Funktion von Person und Aufgabe dargestellt, wobei aufgrund von Person- und Aufgabenmerkmalen das Verhalten nur mit einer bestimmten Wahrscheinlichkeit vorhergesagt werden kann. Ziel ist es, mittels solcher Modelle aufgrund von registrierten Verhaltensweisen die Merkmalsausprägungen einer Person auf einer latenten Variablen zu schätzen. Im Gegensatz zu den Ausprägungen der Items (den beobachtbaren Variablen) sind die Ausprägungen der latenten Variablen nicht direkt beobachtbar. In psychometrischen Modellen werden latente Variablen, die auch Konstrukte genannt werden, über eine Verknüpfung mit den beobachtbaren Testwerten definiert. Ein psychometrisches Modell enthält daher eine theoretische Vorstellung darüber, in welcher Weise das beobachtbare Verhalten von dem latenten Merkmal abhängt und warum die verschiedenen beobachtbaren Verhaltensweisen miteinander zusammenhängen. Das theoretische Konstrukt erklärt den Zusammenhang zwischen den beobachtbaren Verhaltensweisen. Bei psychometrischen Modellen handelt es sich um Messmodelle für latente Merkmalsausprägungen. Psychometrische Modelle stellen darüber hinaus eine Grundlage dar, psychologische Tests zu konstruieren.
Wonach lassen sich testtheoretische Modelle unterscheiden?
Antwort zu Frage 6
Testtheoretische Modelle lassen sich nach der Art der beobachtbaren und der latenten Variablen unterscheiden. Liegen kategoriale manifeste Variablen und kategoriale latente Variablen vor, so lassen sich diese psychometrischen Modelle der Latent-Class-Analyse zuordnen. Die latente Profilanalyse geht von kontinuierlichen manifesten und kategorialen latenten Variablen aus. Liegen kontinuierliche latente Variablen vor, so spricht man von Latent-Trait-Modellen. Bei diesen können die manifesten Variablen sowohl kategorial als auch kontinuierlich sein.
Wie lauten die Gütekriterien psychologischer Tests und was bedeuten sie?
Die Gütekriterien psychologischer Tests lauten:
1. Objektivität
2. Reliabilität
3. Validität
4. Skalierung
5. Normierung
6. Testökonomie
7. Nützlichkeit
8. Zumutbarkeit
9. Unverfälschbarkeit
10. Fairness
Objektivität bedeutet, dass die Durchführung, Auswertung und Interpretation einer psychologischen Messung nicht von der Person abhängt, die diese durchführt. Reliabilität bezeichnet die Zuverlässigkeit einer Messung. Die Reliabilität ist dann hoch, wenn der Einfluss des Messfehlers gering ist. Die Validität ist eine integrierte Bewertung, die sich darauf bezieht, in welchem Ausmaß Schlüsse und Handlungen, die auf Testwerten und anderen Erfassungsmethoden aufbauen, zulässig und angemessen sind. Das Gütekriterium der Skalierung ist erfüllt, wenn die Testwerte, die man aufgrund von Verrechnungsvorschriften erhält, die empirischen Verhaltensrelationen adäquat abbilden. Die Normierung bezieht sich auf das Vorhandensein eines Bezugssystems, das es erlaubt, eine Merkmalsausprägung in Bezug auf die Verteilung des Merkmals in einer Referenzpopulation bzw. in Bezug auf die Erfüllung eines Kriteriums zu interpretieren. Das Kriterium der Testökonomie ist erfüllt, wenn ein Test wenige Ressourcen verbraucht. Das Gütekriterium der Nützlichkeit ist erfüllt, wenn das von dem Test erfasste Merkmal eine praktische Relevanz besitzt und die Entscheidungen bzw. Maßnahmen, die auf Grundlage des Testergebnisses getroffen werden, mehr Nutzen als Schaden erwarten lassen. Ein Test ist dann zumutbar, wenn er eine Person sowohl in zeitlicher als auch in psychischer und körperlicher Hinsicht nicht unverhältnismäßig belastet. Ein Test ist unverfälschbar, wenn Personen das Testergebnis durch ihr Testverhalten nicht verzerren können. Das Gütekriterium der Testfairness ist erfüllt, wenn bestimmte Personen anhand der Testergebnisse nicht systematisch benachteiligt werden.
Welche Strategien zur Untersuchung der Konstruktvalidität gibt es und was bedeuten sie?
Antwort zu Frage 3
Zur Untersuchung der Konstruktvalidität lassen sich fünf Strategien unterscheiden:
1. Analyse von Gruppenunterschieden
2. Zusammenhangsanalysen mit anderen Tests
3. Analyse der internen Struktur eines Tests
4. Analyse der Stabilität und Veränderungen von Testwerten
5. Prozessanalysen
Die Analyse von Gruppenunterschieden bezieht sich darauf, ob sich aufgrund theoretischer Überlegungen erwartbare Gruppenunterschiede in den Konstruktausprägungen bestätigen lassen. Zusammenhangsanalysen mit anderen Tests werden herangezogen, um zu überprüfen, ob der Test mit anderen Tests, die dasselbe oder ein ähnliches Konstrukt erfassen sollen, zusammenhängt bzw. mit Tests nicht zusammenhängt, die ein anderes Konstrukt erfassen, das nicht mit dem Konstrukt, das von Interesse ist, zusammenhängt. Die Analyse der internen Struktur eines Tests bezieht sich darauf, ob die Items eines Tests ein eindimensionales oder ein mehrdimensionales Konstrukt erfassen. Die Struktur des Tests muss der theoretisch erwarteten Struktur eines Konstruktes entsprechen. Die Analyse der Stabilität und Veränderung von Testwerten untersucht, ob sich die Testwerte in theoriekonformer Weise verändern oder stabil bleiben, d. h. ob beispielsweise Tests zur Erfassung fluktuierender Zustände eine geringe Stabilität der Testwerte aufweisen bzw. ob Experimente, die zur Induktion von Veränderungen durchgeführt werden, sich auch in veränderten Testwerten niederschlagen. Prozessanalysen beziehen sich auf Untersuchungen des Antwortprozesses. Sie gehen der Frage nach, wie die Lösung einer Aufgabe zustandekommt bzw. wie die Beantwortung einer Frage vonstatten geht. Hierzu kann man sich beispielweise der Methode des lauten Denkens bedienen.
Was versteht man unter einem nomologischen Netzwerk?
Antwort zu Frage 4
Unter einem nomologischen Netzwerk versteht man ein System miteinander verknüpfter Gesetze, die sich auf ein Konstrukt beziehen. Die Gesetze können sich auf den Zusammenhang zwischen mehreren beobachtbaren Variablen, zwischen Konstrukten und beobachtbaren Variablen oder zwischen mehreren Konstrukten beziehen. Sie können probabilistischer oder deterministischer Natur sein.
Welche Testkonstruktionsprinzipien lassen sich unterscheiden und wie geht man jeweils vor?
Antwort zu Frage 5
Es lassen sich die rationale, die kriteriumsorientierte, die induktive und die externale Konstruktionsmethode unterscheiden. Bei der rationalen Methode, die auch deduktive Methode der Testkonstruktion genannt wird, wird das Konstrukt zunächst definiert und es werden daraufhin Items auf der Grundlage theoretischer Überlegungen formuliert. Hierbei kann man sich an einer Konstruktkarte orientieren. Kriteriumsorientierte und induktive Testkonstruktionsmethoden orientieren sich an der Inhaltsvalidität. Bei der kriteriumsorientierten Testkonstruktion werden zunächst Lehrziele bzw. spezifische Kompetenzen definiert. Daraufhin wird ein Itemuniversum festgelegt und eine Zufallsstichprobe aus diesem Itemuniversum gezogen. Kann die Inhaltsvalidität nicht durch Zufallsauswahl der Items sichergestellt werden, greift man auf die Beurteilung von Experten zurück. Bei der induktiven Methode der Testkonstruktion erstellt man zunächst einen Itemsatz, der möglichst repräsentativ einen Merkmalsbereich erfassen soll. Daraufhin wird dieser Itemsatz durch dimensionsanalytische Verfahren, z. B. die exploratorische Faktorenanalyse, reduziert. Ein weiterer Ansatz der induktiven Testkonstruktion ist der sogenannte Prototypenansatz, bei dem Items danach ausgewählt werden, wie typisch sie für das zu erfassende Konstrukt sind. Externale Testkonstruktionsmethoden orientieren sich an der Kriteriumsvalidität. Items werden so ausgewählt, dass sie eine optimale Vorhersage eines Kriteriums, wie z. B. einer Gruppenzugehörigkeit, erlauben.
Was versteht man unter einem kriteriumsorientierten Test? Wie geht man bei seiner Konstruktion vor?
Ein Test ist kriteriumsorientiert, wenn er (a) inhaltsvalide ist, (b) zur Erfassung der Fähigkeit einer Person konstruiert wurde und (c) die Person anhand ihrer Fähigkeitsausprägung einer Klasse von Personen zuordnet. Um einen kriteriumsorientierten Test zu konstruieren, müssen zunächst die Fähigkeiten definiert werden. Daraufhin muss ein Itemuniversum zur Erfassung dieser Fähigkeiten bestimmt werden und eine Zufallsauswahl von Items aus diesem Itemuniversum vorgenommen werden.
Wie ist der wahre Wert (True-Score-Variable) in der KTT definiert?
Der wahre Wert ist als Erwartungswert einer intraindividuellen (personenspezifischen)Verteilung eines Merkmals definiert
-
- 1 / 18
-