Lernkartei Testtheorie und Testkonstruktion

Karten	57
Lernende	14
Sprache	Deutsch
Kategorie	Psychologie
Stufe	Universität
Erstellt / Aktualisiert	12.02.2019 / 05.04.2021
Weblink	https://card2brain.ch/box/20190212_testtheorie_und_testkonstruktion
Einbinden	<iframe src="https://card2brain.ch/box/20190212_testtheorie_und_testkonstruktion/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was versteht man unter dem "Versuchsleitereffekt"?

Als Versuchsleitereffekt bezeichnet man die Beeinflussung (Verzerrung) der Testergebnisse durch das Verhältnis zwischen Versuchsleiter und Versuchsperson.

Wie lässt sich die Auswertungsobjektivität bestimmen?

Anhand der Übereinstimmung von verschiedenen Testauswertern.

Wann ist Interpretationsobjektivität gegeben?

→ Gegeben, wenn Schlussfolgerungen nicht vom Testanwender abhängen.

Wird durch Hilfestellungen im Testmanual erreicht.

Warum braucht man Reliabilität?

Um Verhaltensunterschiede zwischen Personen zuverlässig zu messen.

Beschreiben Sie kurz die Retest-Reliabilität.

- Wiederholung der Messung zu mind. zwei Messgelegenheiten

- Bestimmung der Reliabilität anhand der Korrelation zwischen beiden Testergebnissen

Wodurch ist die Retest-Reliabilität limitiert?

Restest-Reliabilität -> Wiederholung der Messung.

Je nach Zeitintervall sind unterschiedliche verzerrende Einflüsse mögliche:

- Übungs- und Erinnerungseffekte

- tatsächliche Veränderungen des Merkmals

Was ist der Königsweg der Reliabilitätsbestimmung?

Testhalbierungs-Reliabilität

Retest-Reliabilität

Paralleltest-Reliabilität

Cronbachs Alpha

Testhalbierungs-Reliabilität

Retest-Reliabilität

Paralleltest-Reliabilität

Cronbachs Alpha

Warum verwendet man zur Bestimmung der Testhalbierungs-Reliabilität die Spearman-Brown-Formel?

- mit der Spearman-Brown-Formel berrechnet man die korrigierte Korrelation der beiden Testergebnisse

- Korrektur ist nötig, weil die beiden Testhälften kürzer sind als der Test selbst

- ohne Korrektur wird Reliabilität des Tests unterschätzt !

Welche Methoden der Testhalbierung kennen Sie?

- Theoriegeleitete Zuweisung (z.B. nach Ähnlichkiet des Iteminhalts)

- Zufällige Zuweisung (z.B. Odd-Even-Methode)

- Empirische Zuweisung (z.B. faktoranalytisch durch Höhe der Faktorladungen)

Wie wird die interne Konsistenz (Cronbachs Alpha) bestimmt?

Cronbachs Alpha entspricht der Summe aller möglichen Split-Half-Reliabilitäten.

Welche Methoden zur Sicherung der Konstruktvalidität kennen Sie?

Gültigkeit des Messmodells: Gegeben, wenn sich die Testitems theoriekonform als Indikatoren eines gemeinsamen “latenten Faktors” nachweisen lassen

Konvergente Validität: Gegeben, wenn die Korrelation zwischen Testwerten, die das gleiche Merkmal (Konstrukt) messen sollen, hoch ist

Diskriminante Validität: Gegeben, wenn die Korrelation zwischen Testwerten, die verschiedene Merkmale (Konstrukt) erfassen sollen, gering ist

Was versteht man unter Konstruktvalidität?

Gegeben, wenn der Rückschluss vom Testergebnis auf das zugrundeliegende Merkmal wissenschaftlich fundiert ist.

Skalierung

Gegeben, wenn die Testwerte die empirischen Merkmalsrelationen adäquat abbilden.

Hängt somit vom Skalenniveau des Tests ab
- Abbildung von Größer/Kleiner Relationen zwischen Testpersonen → mindestens Ordinalskalenniveau
- Beurteilung der Größe von Unterschieden (Differenzen) → mindestens Intervallskalenniveau

Wird anhand von Messmodellen überprüft.

Normierung

Gegeben, wenn eine Bezugsnorm vorliegt, anhand der individuelle Testwerte verglichen und eindeutig interpretiert werden können.

Hierzu wird der Test (regelmäßig) in einer möglichst großen und repräsentativen Eichstichprobe angewendet

Welche Techniken gibt es zur Relativierung der Testergebnisse an der Eichstichprobe?

- Prozentrangnormen

- Standardnormen

Nennen Sie die Haupt- und Nebengütekriterien zur Beurteilung der Testqualität.

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Hauptgütekriterien: Objektivität, Reliabilität, Validität

Nebengütekriterien:

1. Skalierung 

2. Normierung 

3. Testökonomie 

4. Nützlichkeit 

5. Zumutbarkeit 

6. Unverfälschbarkeit

7. Fairness

Wie ist die Reliabilität definiert und welche Verfahren zur Bestimmung der Reliabilität kennen Sie?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Reliabilität bedeutet Messgenauigkeit und ist definiert als Anteil der wahren Varianz an der beobachteten Varianz. (Wertebereich [0;1] ) 

- Retest-Reliabilität  

- Paralleltest-Reliabilität 

- Testhalbierungs-Reliabilität

- Innere oder Interne Konsistenz  

Nennen Sie die verschiedenen Facetten der Validität. Erläutern Sie eine Facette genauer.

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Augenscheinvalidität

→ Gegeben, wenn der Validitätsanspruch eines Tests einem Laien gerechtfertigt erscheint.

Vor allem relevant bezüglich der Mitteilbarkeit der Ergebnisse und der Akzeptanz von Seiten der Testpersonen.  

Aus wissenschaftlicher Sicht nicht ausreichend.  

- Inhaltsvalidität

- Kriteriumsvalidität

- Konstruktvalidität

Wie wird die Qualität von psychologischen Tests im deutschsprachigen Raum sichergestellt?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Im deutschsprachigen Raum werden Tests im Auftrag des Diagnostik-und Testkuratoriums (DTK; Gremium des BDP und der DGPs) systematisch von jeweils zwei unabhängigen Gutachtern beurteilt.  

Welche internationalen Standards zur Entwicklungen von psychologischen Tests kennen Sie?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

AERA (American Educational Research Association)

APA (American Psychological Association)

NCME (National Council on Measurement in Education)

Womit beschäftigt sich die psychologische Diagnostik?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Definition nach Eid und Petermann (2006)

regelgeleitetes Sammeln und Verarbeiten von gezielt erhobenen Informationen
dient der Bearbeitung von Fragestellungen (eines Auftragsstellers) und der Entscheidungsfindung (Ziel: bestmögliche Entscheidung)
Prinzipien der Entscheidungsfindung müssen wissenschaftliche Kriterien erfüllen
Schritte müssen nachvollziehbar sein und die Schlußfolgerungen ethischen Standards genügen.

Was ist ein psychometrisches Modell?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

In psychometrischen Modellen wird das beobachtbare Verhalten als Funktion eines latenten Personenmerkmals und eines Itemmerkmals dargestellt.

Ziel ist es, mittels solcher Modelle aufgrund von registrierten Verhaltensweisen die Merkmalsausprägungen einer Person auf einer latenten Variablen zu schätzen.

Die Funktion beschreibt einen nicht-deterministischen Zusammenhang → probabilistischer Zusammenhang (auf Wahrscheinlichkeiten basierend)

In psychometrischen Modellen werden Konstrukte als latente Variablen definiert.

Können zur Testkonstruktion herangezogen werden.

Was ist eine latente Variable (latentes Konstrukt)?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Ein Personenmerkmal, dessen Ausprägungen nicht direkt beobachtbar sind, sondern über beobachtbares Verhalten erschlossen wird.

Was ist eine manifeste Variable?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Im Gegensatz zu latenten Variablen sind die Ausprägungen einer latenten Variablen direkt beobachtbare Reaktionen (z.B. Lösen vs. Nichtlösen einer Aufgabe)

Was ist ein psychologischer Test?

Tastatur-Befehle:

= drehen,

= vor-/rückwärts,

= scrollen

Ein psychologischer Test besteht aus einer Menge von Reizen mit den zugehörigen zugelassenen Reaktionen und einer Vorschrift

MERKE:

→ Reize, die merkmalsrelevantes Verhalten provozieren

→ Reaktionsformen, anhand derer das Verhalten registriert werden kann

→ Psychometrisches Modell (d.h. Verbindung zwischen den beobachteten Reaktionen und dem latenten Merkmal)

Nennen Sie die Schritte der Testkonstruktion.

1. Festlegung des zu erfassenden Konstrukts

2. Erstellung eines Itempools

3. Auswahl eines Antwortformats

4. Itemanalyse und -auswahl

5. Testanalyse

6. Skalierung und Normierung

7. Testdokumentation

8. Weitere Untersuchungen zur Güte des Verfahrens und Testrevision

Schritt 1 der Testkonstruktion: Festlegung des zu erfassenden Konstrukts.

Um welche Art von Merkmal handelt es sich?

→ kontinuierliches (quantitatives) versus kategoriales (qualitatives) Merkmal

→ eindimensionales versus mehrdimensionales Merkmal

Was sind mögliche Gefahren für die Itemkonstruktion?

Unterrepräsentation des Konstrukts

→ Wichtige Facetten des Konstrukts fehlen

Kontrolle von konstruktirrelevanten Faktoren

→ Einflüsse, die nichts mit dem zu erfassenden Konstrukts zu tun haben, beeinflussen das Testverhalten

Welche Strategien für die Item- bzw. Testkonstruktion gibt es?

1. rationale Testkonstruktion

2. induktive sowie kriteriumsorientierte Testkonstruktion

3. externale Testkonstruktion

→ zählt zu Schritt 2 der Testkonstruktion: Erstellung eines Itempools

Was ist die rationale Strategie?

- auch deduktive Methode genannt

- Items werden eng an der Definition eines Konstrukts konstruiert

Vorgehen nach Wilson (2005):

Erstellen einer Konstruktkarte (z.B. für Emotionen: todunglücklich - traurig - betrübt - unwohl - wohl - froh - glücklich - euphorisch)
Konstruktion von Items (z.B. trifft nicht zu - trifft zu)
Kodierung von Antworten (z.B. 1 und 2)
Auswahl eines Messmodells (z.B. Rasch-Modell)

Testtheorie und Testkonstruktion - 1. Termin

Lernkarteien erstellen oder kopieren

Lernkarteien erstellen oder kopieren

Melde dich an, um alle Karten zu sehen.

SWITCHaai

Office 365

Edulog

Apple ID

Google