Testtheorie und Testkonstruktion - 1. Termin
PHB WS 18/19
PHB WS 18/19
Kartei Details
Karten | 57 |
---|---|
Lernende | 14 |
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 12.02.2019 / 05.04.2021 |
Weblink |
https://card2brain.ch/box/20190212_testtheorie_und_testkonstruktion
|
Einbinden |
<iframe src="https://card2brain.ch/box/20190212_testtheorie_und_testkonstruktion/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Lernkarteien erstellen oder kopieren
Mit einem Upgrade kannst du unlimitiert Lernkarteien erstellen oder kopieren und viele Zusatzfunktionen mehr nutzen.
Melde dich an, um alle Karten zu sehen.
Was versteht man unter dem "Versuchsleitereffekt"?
Als Versuchsleitereffekt bezeichnet man die Beeinflussung (Verzerrung) der Testergebnisse durch das Verhältnis zwischen Versuchsleiter und Versuchsperson.
Wie lässt sich die Auswertungsobjektivität bestimmen?
Anhand der Übereinstimmung von verschiedenen Testauswertern.
Wann ist Interpretationsobjektivität gegeben?
→ Gegeben, wenn Schlussfolgerungen nicht vom Testanwender abhängen.
Wird durch Hilfestellungen im Testmanual erreicht.
Warum braucht man Reliabilität?
Um Verhaltensunterschiede zwischen Personen zuverlässig zu messen.
Wodurch ist die Retest-Reliabilität limitiert?
Restest-Reliabilität -> Wiederholung der Messung.
Je nach Zeitintervall sind unterschiedliche verzerrende Einflüsse mögliche:
- Übungs- und Erinnerungseffekte
- tatsächliche Veränderungen des Merkmals
Was ist der Königsweg der Reliabilitätsbestimmung?
Warum verwendet man zur Bestimmung der Testhalbierungs-Reliabilität die Spearman-Brown-Formel?
- mit der Spearman-Brown-Formel berrechnet man die korrigierte Korrelation der beiden Testergebnisse
- Korrektur ist nötig, weil die beiden Testhälften kürzer sind als der Test selbst
- ohne Korrektur wird Reliabilität des Tests unterschätzt !
Welche Methoden der Testhalbierung kennen Sie?
- Theoriegeleitete Zuweisung (z.B. nach Ähnlichkiet des Iteminhalts)
- Zufällige Zuweisung (z.B. Odd-Even-Methode)
- Empirische Zuweisung (z.B. faktoranalytisch durch Höhe der Faktorladungen)
Wie wird die interne Konsistenz (Cronbachs Alpha) bestimmt?
Cronbachs Alpha entspricht der Summe aller möglichen Split-Half-Reliabilitäten.
Welche Methoden zur Sicherung der Konstruktvalidität kennen Sie?
Gültigkeit des Messmodells: Gegeben, wenn sich die Testitems theoriekonform als Indikatoren eines gemeinsamen “latenten Faktors” nachweisen lassen
Konvergente Validität: Gegeben, wenn die Korrelation zwischen Testwerten, die das gleiche Merkmal (Konstrukt) messen sollen, hoch ist
Diskriminante Validität: Gegeben, wenn die Korrelation zwischen Testwerten, die verschiedene Merkmale (Konstrukt) erfassen sollen, gering ist
Was versteht man unter Konstruktvalidität?
Gegeben, wenn der Rückschluss vom Testergebnis auf das zugrundeliegende Merkmal wissenschaftlich fundiert ist.
Skalierung
Gegeben, wenn die Testwerte die empirischen Merkmalsrelationen adäquat abbilden.
Hängt somit vom Skalenniveau des Tests ab
- Abbildung von Größer/Kleiner Relationen zwischen Testpersonen → mindestens Ordinalskalenniveau
- Beurteilung der Größe von Unterschieden (Differenzen) → mindestens Intervallskalenniveau
Wird anhand von Messmodellen überprüft.
Normierung
Gegeben, wenn eine Bezugsnorm vorliegt, anhand der individuelle Testwerte verglichen und eindeutig interpretiert werden können.
Hierzu wird der Test (regelmäßig) in einer möglichst großen und repräsentativen Eichstichprobe angewendet
Welche Techniken gibt es zur Relativierung der Testergebnisse an der Eichstichprobe?
- Prozentrangnormen
- Standardnormen
Nennen Sie die Haupt- und Nebengütekriterien zur Beurteilung der Testqualität.
Hauptgütekriterien: Objektivität, Reliabilität, Validität
Nebengütekriterien:
1. Skalierung
2. Normierung
3. Testökonomie
4. Nützlichkeit
5. Zumutbarkeit
6. Unverfälschbarkeit
7. Fairness
Wie ist die Reliabilität definiert und welche Verfahren zur Bestimmung der Reliabilität kennen Sie?
Reliabilität bedeutet Messgenauigkeit und ist definiert als Anteil der wahren Varianz an der beobachteten Varianz. (Wertebereich [0;1] )
- Retest-Reliabilität
- Paralleltest-Reliabilität
- Testhalbierungs-Reliabilität
- Innere oder Interne Konsistenz
Nennen Sie die verschiedenen Facetten der Validität. Erläutern Sie eine Facette genauer.
Augenscheinvalidität
→ Gegeben, wenn der Validitätsanspruch eines Tests einem Laien gerechtfertigt erscheint.
Vor allem relevant bezüglich der Mitteilbarkeit der Ergebnisse und der Akzeptanz von Seiten der Testpersonen.
Aus wissenschaftlicher Sicht nicht ausreichend.
- Inhaltsvalidität
- Kriteriumsvalidität
- Konstruktvalidität
Wie wird die Qualität von psychologischen Tests im deutschsprachigen Raum sichergestellt?
Im deutschsprachigen Raum werden Tests im Auftrag des Diagnostik-und Testkuratoriums (DTK; Gremium des BDP und der DGPs) systematisch von jeweils zwei unabhängigen Gutachtern beurteilt.
Welche internationalen Standards zur Entwicklungen von psychologischen Tests kennen Sie?
AERA (American Educational Research Association)
APA (American Psychological Association)
NCME (National Council on Measurement in Education)
Womit beschäftigt sich die psychologische Diagnostik?
Definition nach Eid und Petermann (2006)
regelgeleitetes Sammeln und Verarbeiten von gezielt erhobenen Informationen
dient der Bearbeitung von Fragestellungen (eines Auftragsstellers) und der Entscheidungsfindung (Ziel: bestmögliche Entscheidung)
Prinzipien der Entscheidungsfindung müssen wissenschaftliche Kriterien erfüllen
Schritte müssen nachvollziehbar sein und die Schlußfolgerungen ethischen Standards genügen.
Was ist ein psychometrisches Modell?
In psychometrischen Modellen wird das beobachtbare Verhalten als Funktion eines latenten Personenmerkmals und eines Itemmerkmals dargestellt.
Ziel ist es, mittels solcher Modelle aufgrund von registrierten Verhaltensweisen die Merkmalsausprägungen einer Person auf einer latenten Variablen zu schätzen.
Die Funktion beschreibt einen nicht-deterministischen Zusammenhang → probabilistischer Zusammenhang (auf Wahrscheinlichkeiten basierend)
In psychometrischen Modellen werden Konstrukte als latente Variablen definiert.
Können zur Testkonstruktion herangezogen werden.
Was ist eine latente Variable (latentes Konstrukt)?
Ein Personenmerkmal, dessen Ausprägungen nicht direkt beobachtbar sind, sondern über beobachtbares Verhalten erschlossen wird.
Was ist eine manifeste Variable?
Im Gegensatz zu latenten Variablen sind die Ausprägungen einer latenten Variablen direkt beobachtbare Reaktionen (z.B. Lösen vs. Nichtlösen einer Aufgabe)
Was ist ein psychologischer Test?
Ein psychologischer Test besteht aus einer Menge von Reizen mit den zugehörigen zugelassenen Reaktionen und einer Vorschrift
MERKE:
→ Reize, die merkmalsrelevantes Verhalten provozieren
→ Reaktionsformen, anhand derer das Verhalten registriert werden kann
→ Psychometrisches Modell (d.h. Verbindung zwischen den beobachteten Reaktionen und dem latenten Merkmal)
Nennen Sie die Schritte der Testkonstruktion.
Schritt 1 der Testkonstruktion: Festlegung des zu erfassenden Konstrukts.
Um welche Art von Merkmal handelt es sich?
→ kontinuierliches (quantitatives) versus kategoriales (qualitatives) Merkmal
→ eindimensionales versus mehrdimensionales Merkmal
Was sind mögliche Gefahren für die Itemkonstruktion?
Unterrepräsentation des Konstrukts
→ Wichtige Facetten des Konstrukts fehlen
Kontrolle von konstruktirrelevanten Faktoren
→ Einflüsse, die nichts mit dem zu erfassenden Konstrukts zu tun haben, beeinflussen das Testverhalten
Welche Strategien für die Item- bzw. Testkonstruktion gibt es?
1. rationale Testkonstruktion
2. induktive sowie kriteriumsorientierte Testkonstruktion
3. externale Testkonstruktion
→ zählt zu Schritt 2 der Testkonstruktion: Erstellung eines Itempools
Was ist die rationale Strategie?
- auch deduktive Methode genannt
- Items werden eng an der Definition eines Konstrukts konstruiert
Vorgehen nach Wilson (2005):
Erstellen einer Konstruktkarte (z.B. für Emotionen: todunglücklich - traurig - betrübt - unwohl - wohl - froh - glücklich - euphorisch)
Konstruktion von Items (z.B. trifft nicht zu - trifft zu)
Kodierung von Antworten (z.B. 1 und 2)
Auswahl eines Messmodells (z.B. Rasch-Modell)
-
- 1 / 57
-