M6 Grundlagen der Testkonstruktion

Kapitel 2, Testkonstruktion: Von der Planung zum ersten Entwurf

Kapitel 2, Testkonstruktion: Von der Planung zum ersten Entwurf


Set of flashcards Details

Flashcards 134
Students 13
Language Deutsch
Category Psychology
Level University
Created / Updated 13.11.2011 / 10.09.2017
Weblink
https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion1
Embed
<iframe src="https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion1/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was ist trotz der Richtlinien zu Formulierung von Itemstämmen notwendig?

Es ist notwendig die Formulierungen einer Vorprüfung zu unterziehen.

Welche Typen von Antwortformaten lassen unterscheiden?

Gebundene Antworten

Offene Antworten

Was ist der Unterschied zwischen gebundenen und offenen Antwortformaten?

Bei gebundenen Antwortformaten sind konkrete Lösungsmöglichkeiten oder Antwortalternativen vorgegeben

Bei offenen Antwortformaten ist die Beantwortung nicht oder nur wenig durch Antwortvorgaben beschränkt.

Welche spezifischen Aufgabentypen unterscheiden Jonkisz und Moosbrugger (2007)?

1. Kurzaufsatzaufgaben

2. Ergänzungsaufgaben = freies Antwortformat

——————————————–———————————————–————

3. Ordnungsaufgaben

4. Auswahlaufgaben

5. Beurteilungsaufgaben

6. Zuordnungsaufgaben

7. Dichotome Aufgaben

8. Analogskalaaufgaben

9. Unordnungsaufgaben

10. Mehrfachwahlaufgaben

11. Ratingskalaaufgaben = gebundenes Antwortformat

—–——–————————————————————–——–———————————

12. Aufgaben mit atypischem Antwortformat

Bei welchen psychologischen Tests kommen Aufgaben mit freiem Antwortformat zum Einsatz?

-Fähigkeit- und Leistungstests ( hier gibt's eine endliche Zahl objektiv richtiger Lösungen)

- Projektive Verfahren bei Persönlichkeitstests ( außer semi- Projektiven Tests)

Was sind die Vorteile beim offenen Antwortformat?

- Zufallslösungen sind kaum möglich- evtl. ist aber Lösungsweg erkennbar

- Es kann eine qualitative Auswertung dieser Aufgaben vorgenommen werden.

- Inhaltlich besteht die Möglichkeit der Konstuktion komplexer Aufgaben

- unerlässlich bei: Erfassung stilistischer Begabnung, Reproduktion von Wissen nach Gedächtnistests

Was sind die Nachteile beim offenen Antwortformat?

- fehlende Standardisierung der Antworten

- Bei der Konstruktion dass Problem erschöpfender Musterlösungen

- Subjektive Elemente Fliesen mit in die Bewertung ein, weil ein Vergleich mehrerer Teilnehmer nicht möglich ist.

- Bei der Bearbeitung zusammenhängender Lückentexte kann es zu Folgefehlern kommen- also psychometrisch zu mangelhafter stochastische Unabhängigkeit der Items

- Die Auswertung projektiver Verrfahren muss in Zusatzausbildungen gelernt werden

- Objektivitätsproblem bislang nicht befriedigend gelöst

Was sind gebundene Antwortformate?

- Sie sind vollständig vom Testautors vorgegeben

- schnelle automatisierte Auswertung möglich ohne Interpretationsspielraum

Was ist eine Ratingskala?

Sie besteht aus mehr als zwei abgestuften Antwortkategorien und ermöglichen eine quantitative Beurteilung einer Merkmalsausprägung

Was muss vor der Konstruktion einer Ratingskala festgelegt werden?

Es wird festgelegt:

- wie differenziert die Abstufung erfolgen soll.

Abhängig von:

- wie genau können Probanden antworten

- wie genau will der Testautors zwischen den Probanden differenzieren

Welche Folge haben zu wenig oder zu viele Stufen in einer Ratingskala?

Zu wenig Stufen bedeuten den Verzicht auf Information und damit auf psychometrische Güte

Zu viele Stufen können Probanden überfordern und die Gütekriterien mindern

Wo liegt das psychometrische optimum für die Anzahl Abstufen in Ratingskalen?

bei 5- max 9 Abstufungen

Wie nennt sich eine stufenlos einstellbare Skala?

analogskala

Wann wird eine gerade bzw ungerade Anzahl Abstufungen in einer Ratingskala gewählt?

Ungerade Anzahl: wenn eine als neutral wahrgenommene Mittelkategorie vorgegeben werden soll

Eine gerade Anahl : wenn es keine neutral wahrgenommene Stufe geben soll und der Proband sich entscheiden soll

Was spricht für bzw. gegen die Verwendung einer Mittelkategorie in Ratingskalen?

Contra: manche Probanden nutzen sie als Ausweichoption

Pro: Der Zwang sich entscheiden zu müssen kann die Akzeptanz mindern.

Was sind unipolar vorgegebene Items?

sie haben ein logisches Minimum z.B. "NIE"

Was sind bipolar vorgegebene Items?

Extremausprägungen sind durch gegensätzliche Begriffe gekennzeichnet.

Wodurch kann jede einzelne Stufe oder nur die Enden der Skalen beschrieben werden?

durch numerische ( zb 0-4)

Durch verbale

Durch grafische, symbolische Verankerungen

Wozu führt nach Krosnik (1999) die Benennung jeder einzelnen Stufe bei einer Ratingskala?

zur Verbesserung der Reliabilität und Validität

Welches Skalenniveau haben Ratingskalen?

streng genommen erreichen sie nur Ordinalniveau

In welchen Fällen kann man einer Ratingskala am ehesten Intervallskalenniveau unterstellen?

- je mehr Skalanstufen je Item vorgegeben werden

- je mehr Items zu einem Testwert aggregiert werden

- je gleichmäßiger die Abstände zwischen den Skalenstufen von den Testteilnehmern empfunden werden

In welchen Fällen kann es gewollt sei, entlang der Ratingskala asymmetrische Abstufungen vorzusehen?

-Um bei seltenen oder sozial erwünschten Merkmalen in solchen Bereichen der Skala besser differenzieren zu können, in denen sich die Antworten sonst häufen würden

Welches sind die Kernprobleme von Ratingskalen?

- Die Frage nach dem Skalenniveau

- Die Anfälligkeit für Antworttendenzen

Was zählt zu der Anfälligkeit für Antworttendenzen?

1. Die Tendenz, bewusst oder unbewusst im Sinne sozialer Normen zu antworten

2. Die generelle Tendenz zur Zustimmung (aquieszenz) zu oder auch Ablehnung von Aussagen

3. Die Bevorzugung bestimmter Skalenbereiche wie der Mitte oder den Extremen

Was kann eine Mögliche Ursache für Antworttendenzen sein?

-Formulierungen werden von verschiedenen Personen unterschiedlich interpretiert ( zB unterschiedliche Auffassung von "selten" oder "oft"

Was sind dichotome Auswahlaufgaben?

sie geben genau zwei Antwortmöglichkeiten vor.

Wo werden dichotome Auswahlaufgaben angewendet?

- Leistungsaufgaben ( richtig- falsch Aufaben)

- Persönlichkeitstests (ja-nein, trifft zu- trifft nicht zu Aufgaben)

Was sind die Vorteile dichotomer Auswahlaufgaben?

- Es ist das einfachste Antwortformat

- die Auswertung und Beantwortung der Probanden ist einfach

- Popularität aus Prä-Computerära

- erleichtert die Anwendung der Probabilistischen Testtheorie erheblich

Was sind die Nachteile dichotomer Auswahlaufgaben?

- hoher Anteil Zufallslösungen möglich (50%)

- ja/nein-Skalen im Vergleich mit mehrstufigen Ratingskalen haben groden Informationsverlust

- Nachteile müssen durch längere Tests ( mehr Items) ausgeglichen werden

Was sind Mehrfachwahlaufgaben?

- haben mehr als zwei, meistens 4-5 Antwortaltnativen

- es existieren verschiedene Formen

- Leistungs- und Persönlichkeitstests ähneln sich formal

Welche Variante der Mehrfachwahlaufgaben kommt in Leistungstests zum Einsatz?

Multiple-Choice mit einer und mehrerer richtiger Lösungen

Was bedeutet es, wenn Antwortvorgaben disjunkt sind?

es bedeutet, dass keine inhaltliche Schnittmenge zwischen ihnen besteht

Worauf ist bei der Erstellung von Multiple- Choice -Aufgaben zu achten?

Die Stellung der richtigen Lösungen muss ausgewogen und unsystematisch über denn Test verteilt sein- damit Teilnehmer keinen Erfolg mit irrationalen Lösungswegen haben.

Was sind Distraktoren?

falsche Antwortalternativen

Inwiefern haben Distraktoren Einfluss auf die Schwierigkeit eines Items?

offensichtlich unsinnige Distraktoren erleichtern schwierige Fragen und hochplausibel erscheinende falsche Antworten erschweren die Fragen ( noch unter Zufallswahrscheinlichkeit)

Was sind Forced-Choice-Items?

- werden ei Persönlichkeits- und Einstellungstests verwendet

- formal nicht von multiple-Choice zu unterscheiden

- sollen Tendenzen zu sozial erwünschten Antwortverhalten entgegenwirken

Wie laufen Tests mit Forced-Choice-Items ab?

-Antwortalternativen , die bei freier Auswahl ähnlich häufig bevorzugt werden, werden zusammen gruppiert

- Proband soll die zutreffendste oder unzutreffendste auswählen oder die Antwortalternativen in eine Rangfolge bringen

Wie lautet die Annahme von Forced-Choice-Items?

da die Auswahlwahrscheinlichkeit in einer Normgruppe ( durch Pretest überprüft) gleich groß ist, wird die individuell passendste und nicht die sozial erwünschte Alternative gewählt

Was ist die Q-Sort-Technik?

- wird bei typologisierender Persönlichkeitsmessung verwendet

- ist Grundlage für das Prinzip der Rangordnung bei Forced-Choice-Items

Was ist eine ipsative Messung?

Wenn die Antwortalternativen nicht unterschiedlichen Graden der Ausprägung eines Merkmals zugeordnet, sondern verschiedenen Merkmalen in mehrdimensionalen Tests.