M6 - Grundlagen der Testkonstruktion
Kapitel 2: Testkonstruktion: Von der Planung zum ersten Entwurf
Kapitel 2: Testkonstruktion: Von der Planung zum ersten Entwurf
Kartei Details
Karten | 42 |
---|---|
Lernende | 17 |
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 21.11.2011 / 12.02.2019 |
Weblink |
https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion2
|
Einbinden |
<iframe src="https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion2/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Welche Fragen sollten am Beginn der Testkonstruktion gestellt werden?
- Merkmalsbereich: Was soll der Test messen?
- Geltungsbereich: Wo, bei wem und wofür soll der Test eingesetzt werden?
Welche Hilfsmittel können zur Abgrenzung des Merkmalsbereichs heran gezogen werden?
- theoretische Ableitung
- Literaturrecherche
- explorative Verfahren zur Datenerhebung (z.B. Befragung von Experten mittels qualitativer Interviews
- strukturierte Varianten der Merkmalsabgrenzung: z.B. Facettentheorie, act frequnecy approach oder die Methode der kritischen Ereignisse
Was ist die Facettentheorie?
- eine Methode zur Systematisierung wissenschaftlicher Fragestellungen
- stellt Werkzeuge zur Verfügung, um einen Merkmalsbereich vollständig einzugrenzen, in einzelne Teilmerkmale (Facetten) und deren Ausprägungen zu zergliedern und die Beziehungen zwischen den Facetten darzustellen und anschließend auch empirisch zu skalieren
Was ist eine Arbeitsdefinition?
- bildet die Grundlage der Formulierung
- kann aus einer Liste konkurrierender Definitionen bestehen
Wie wird der Geltungsbereich eingegrenzt?
- oft schon durch die Vorgabe des Auftraggebers für den Test
- aber auch durch den Testentwickler selbst, denn er muss sich an ethische Richtlinien halten, etc.
Was ist der Ausgangspunkt der rationalen Testkonstruktion?
- eine operationale Definition des Zielkonstrukts, aus der der Testautor spezifische Indikatoren (deduktiv) ableitet, die sich direkt beobachten lassen
- es kann auch eine theoretische Auswahl aus einem Itempool getroffen werden
- der Schritt der Umsetzung von der theoretischen Definition in eine Messvorschrift bzw. konkrete Items ist oft nicht ohne ein hohes Maß an Intuition bzw. subjektiver Bewertung seitens des Testautors zu leisten
Was ist ein Beispiel für einen rational konstruierten Test mit einer komplexen theoretischen Grundlage?
- Berliner Intelligenzstruktur-Test (BIS-Test)
Wovon geht des BIS-Test aus?
- von einer hierarchischen Struktur der Intelligenz - d.h. es existieren unterscheidbare spezielle Fähigkeiten, deren gemeinsames Element auf einer höheren Ebene generelle Intelligenz ist
Wann wird die rationale Konstruktion einfacher?
- wenn es um eindimensionale Tests geht (im Gegensatz zum z.B. BIS-Test)
Ein Beispiel für die eindimensionale rationale Testkonstruktion?
Restrospective Behavioral Self-Control Scale (RBS)
Was steht bei der externalen Testkonstruktion bereits von Anfang an im Vordergrund (im Gegensatz zur rationalen Konstruktion)?
- empirische Daten
Was nennen Schmidt-Atzert und Amelang als kennzeichnend für die externale Strategie?
- das Vorliegen verschiedener Gruppen von Personen, die mit Hilfe des Tests unterschieden (in einem technischen Sinn diskriminiert) werden
Was ist ein typischer Anwendungsfall der externalen Konstruktion?
Unterscheidung des Vorliegens von Persönlichkeitsstörungen von deren Nichtvorliegen - dazu wird die Existenz von Gruppen nicht vorausgesetzt!
Was ist das Prinzip der externalen Konstruktion?
Tests, deren Items nach ihrer maximalen Korrelation mit dem kontinuierlichen verteilten Kriterium z.B.: Berufsleistung ausgewählt werden, sind external konstruiert
--> dafür kommt es allein auf die Auswahl der Items nach dem Prinzip der Maximierung des empirischen Zusammenhangs mit einem Kriterium an, wobei im Extremfall auf inhaltliche Erwägungen ganz verzichtet wird
Welche Probleme bringt die externale Konstruktion?
- atheoretische Anpassung an die Stichprobe, wie auch bei der Multiplen Regression
Folge:
- inhaltlich oft schwer interpretierbare Skalen
- Erfordernis großer und repräsentativer Stichproben bei der Entwicklung
Welche Vorteile hat die externale Konstruktion?
- setzt sachgemäße Anwendung voraus
- setzt acuh bei geringem theoretischem Vorwissen eine gewisse kriterienbezogene Validität voraus --> damit ist der praktische Nutzen gewährleistet
Welche Beispiele external konstruierter Tests gibt es?
- Minnesota Multiphasic Personality Inventory
- California Psychological Inventory (CPI)
Was ist das Prinzip der internalen Testkonstruktion?
es wird auf empirische Informationen zurückgegriffen, die sich nicht auf ein Außenkriterium, sondern auf die Binnenstruktur des Tests beziehen
- dazu Generierung eines Itempools, der einen sehr breiten Merkmalsbereich abdeckt
- dann werden die Itmes einer Stichprobe zur Bearbeitung vorgelegt und die Daten hinsichtlich der Korrelationsmuster zwischen den Items untersucht --> mittels explorativer Varianten der Faktorenanalyse
- Ergebnis: mehrdimensionale Inventare, deren Subskalen jeweils homogene Konstrukte messen, insgesamt aber einen breiten und heterogenen Merkmalsbereich abdecken
Für was bilden die Ergebnisse einer internalen Konstruktion die Grundlage?
- für spätere Modelle, i dem aus den spezifischen Daten induktiv auf ein allgemeines Modell geschlossen wird
Welche Beispiele gibt es für internale Testkonstruktionen?
- Primärfaktorenmodell der Intelligenz (Thurstone & Turstone)
- Inventare im Bereich der Persönlichkeitseigenschaften: klassische Modelle von Guilford, Eysenck sowie die unterschiedlichen Varianten des Fünf-Faktoren-Modells
Was ist die typologisiserende Strategie?
hier werden Elemente der externalen und der internalen Strategie verbunden
- es geht um die Identifikation von Gruppen von Personen oder Objekten auf der Grundlage empirischer Informationen
Was ist das dominierende statistische Verfahren bei der typologisierenden Strategie?
die Klassifikation von Personen aufgrund mehrerer, simultan erfasster Merkmale mittels der Clusteranalyse --> dabei werden Personen zu Gruppen zusammengefasst, die sich durch eine ähnliche Konfiguration von Ausprägungen auf mehreren Merkmalen auszeichnen
Was ist der Prototypenansatz?
hier wird die Ähnlichkeit mit einem als idealtypisch eingeschätzten Vertreter eines Typus oder auch einer Verhaltensweise als kognitiver Ankerreiz für die Einschätzung anderer Objekte vorgegeben wird
Welche Aspekte können bei der Itemgenerierung unterschieden werden?
- inhaltliche Aspekte (Was frage ich?)
- formale Aspekte (Wie frage ich?)
--> also die sprachlichen Aspekte der Itemformulierung und die Festlegung des Antwortformats
Was wird bei der Frage nach den Inhalten der Items unterschieden?
- ob objektive (Leistungstests) oder subjektive Informationen erhoben werden
- bei subjektiven Infos wird noch zwischen Selbst- und Fremdeinschätzungen unterschieden
Wonach richten sich Ordnungsschemata für Itemtypen meist aus?
- an formalen Aspekten und sie sind häufig auf Aufgaben in Fähigkeits- und Leistungstests zugeschnitten
Welche Kategorien von Persönlichkeitsitems haben Angleitner , John und Löhr vorgeschlagen?
1. Beschreibung von Reaktionen, darunter
a) offene, beobachtbare Handlungen (Bsp: Ich gehe oft auf Parties)
b) verborgene, interne Reaktionen (Bsp: Ich denke viel über mich selbst nach)
c) Symptome, physische Reaktionen (Bsp: ich schwitze viel)
2. Eigenschaftszuschreibungen (Bsp: ich habe gute schauspielerische Fähigkeiten)
3. Wünsche und Interessen (Bsp: Manchmal würde ich am liebsten laut fluchen)
4. Biografische Fakten (Bsp: ich hatte in meiner Jugend schon mal Ärger mit dem Gesetz)
5. Einstellungen und Überzeugungen (Bsp: Ich glaube Gesetzt sollten mit aller Härte druchgesetzt werden)
6. Reaktionen anderer auf die eigene Person (Bsp: Ich stehe auf Parties selten im Mittelpunkt)
7. Bizarre Items (Bsp: Jemand versucht mich zu vergiften)
Was erweist sich bei der Itemgenerierung als wesentlich?
- die Qualität der Arbeitsdefinition des Merkmalsbereichs
--> jedes einzelne Item sollte innerhalb des definierten Bereichs liegen und die Itemmenge sollte insgesamt diesen Bereich repräsentativ abdecken
- außerdem empfiehlt es sich ein Regelsystem für die spezifische Testentwicklung aufzustellen
Auf was können sich die Regeln bei der Testentwicklung beziehen?
- auf inhaltliche als auch auf formale Aspekte
Welche Hilfsmittel zur Itemgenerierung stehen zur Verfügung?
- AFA (act frequency approach)
- CIT (critical incident technique)
Was ist das Prinzip des AFAs?
- Dispositionen werden als kognitive Kategorien aufgefasst, in denen Verhaltensweisen nach der Häufigkeit ihres Auftretens ohne eigentlichen Erklärungswert zusammengefasst werden
- es gibt Handlungen, die für die Eigenschaft besonders zentral oder prototypisch sind und solche mit eher peripherer Zugehörigkeit zur Kategorie
- der AFA stellt eine Methodologie zur Verfügung, um solche Unterschiede aufzudecken und in ein Messinstrument umzusetzen
Wie ist die Vorgehensweise beim AFA?
siehe Seite 41
Was sind die Vorteile des AFAs?
erlaubt die Generierung und Zuordnung von Items zur Skalen bzw. von Verhalten zu Eigenschaften unabhängig von der Intuition des Autors
Was sind die Nachteile des AFAs?
Problem bei der Umsetzung in Selbstberichte im Befund sog. Aktivitätsfaktoren:
- manche Vpn neigen häufiger als andere dazu anzugeben, dass sie Verhalten jeglicher Art gezeigt haben, weshalb unterschiedl. Eigenschaften in nach AFA konstruierten Tests tendenziell höher miteinander korrelieren als bei konventionell konstruierten Persönlichkeitsinventaren
Wozu dient der CIT?
- der anforderungsanalytischen Fundierung zahlreicher Intsrumente der Arbeits- und Organisationspsychologie
Was ist der Ansatzpunkt der CIT?
gute oder unbefriedigende Leistungen schlagen sich in konkreten erfolgskritischen Ereignissen nieder
Woraus besteht ein Item grundsätzlich?
- Itemstamm: eigentliche Frage oder Aufgabe
- Vorgabe des Antwortformats bzw. den möglichen Reaktionen
Welche Richtlinien zur Formulierung von Itemstämmen gibt es?
die Richtlinien beziehen sich im Allgemeinen auf:
- die Förderung der Verständlichkeit
- die Eindeutigkeit der Formulierung
- die Vermeidung der Bevorzugung bestimmter Antwortalternativen