M6 - Grundlagen der Testkonstruktion

Kapitel 5: Evaluation psychologischer Testverfahren

Kapitel 5: Evaluation psychologischer Testverfahren

Judit KLjlskjkj

Judit KLjlskjkj

Set of flashcards Details

Flashcards 34
Students 18
Language Deutsch
Category Psychology
Level University
Created / Updated 27.01.2012 / 10.09.2017
Weblink
https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion7
Embed
<iframe src="https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion7/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Welche Richtlinien und Beurteilungssysteme für Tests gibt es?

siehe Tabelle ab Seite 168

Wann ist ein Test objektiv?

ein Test ist in dem Maße objektiv, in dem die Testergebnisse unabhängig vom Untersucher zustande kommen

Wie lässt sich Objektivität unterteilen?

- Durchführungsobjektivität

- Auswertungsobjektivität

- Interpretationsobjektivität

Was ist Durchführungsobjektivität?

das Ausmaß, in dem Testergebnisse frei von schwankungen zwischen den Bedinungungen unterschiedlicher Durchführungsgelegenheiten zustande kommen

Was ist Auswertungsobjektivität?

das Ausmaß, in dem verschiedene Auswerter desselben Testbogens zu denselben Ergebnissen kommen

Was ist Interpretationsobjektivität?

das Ausmaß der Übereinstimmung in der Interpretation aufgrund gleicher Testergebnisse

Wie kann die Reliabilität empirisch bestimmt werden?

durch verschiedene Arten der Reliabilitätsschätzung

Welche verschiedenen Arten der Reliabilitätsschätzung gibt es?

- interne Konsistenz

- Retest-Reliabilität

- Paralleltest-Reliabilität

- Interrater-Reliabilität

Was ist interne Konsistenz?

Bei der Bestimmung der internen Konsistenz entstehen die

miteinander korrelierten Messreihen, indem ein Test zwar nur einmal erhoben,

aber dann so aufgeteilt wird, dass die Testteile korreliert werden können. Die verschiedenen Konsistenzkoeffizienten schätzen also das Ausmaß der Gemeinsamkeiten der Testteile (im Gegensatz zu deren Spezifität) ab.

Was ist die einfachste Aufteilung eines Tests?

die Split-Half-Reliabilität ein Spezialfall der internen Konsistenz, deren einziger

Vorteil gegenüber den weiter unten dargestellten Verallgemeinerungen die einfachere

Berechnung ist

Wie lautet die Korrekturformel zur Ermittlung der Reliabilität bei Verlängerung eines Tests um einen parallelen Faktor k?

Spearman-Brown-Formel:

rtt = k ⋅ r12 / (1 + (k −1) ⋅ r12),

Was ist Cronbach-alpha?

Cronbach-α handelt es sich um

eine Generalisierung der Testhalbierungsmethode, die im Grunde einen Mittelwert

der Konsistenzkoeffizienten über alle denkbaren Aufteilungen des Tests

(i.d.R. mit den einzelnen Items als Einheit) darstellt.

Worauf bezieht sich der Retest-Koeffizient?

auf die Erfassung der Reliabilität als zeitliche Stabilität der

Messungen.

Wie kann Validität differenziert werden?

- Inhaltsvalidität

- Konstruktvalidität

- kriterienbezogene Validität

Worauf bezieht sich die Inhaltsvalidität?

auf die Übereinstimmung der Testinhalte mit dem zugrunde liegenden Merkmal des Tests

Was ist Konstruktvalidität?

die Interpretation von Testergebnissen als Indikatoren theoretischer Konstrukte

Was ist Konstruktvalidität?

die Interpretation von Testergebnissen als Indikatoren theoretischer Konstrukte

Welche Strategien der Konstruktvalidierung nennt Cronbach?

- das logisch-argumentative Vorgehen

- die experimentelle Prüfung

- korrelative Analysen

Was ist die faktorielle Validität?

damit ist die Bestätigung der intendierten faktoriellen Struktur eines Tests gemeint

Was ist die konvergente Validität?

geht es also um den Aspekt der theoretisch erwarteten Übereinstimmung,

Was ist die diskriminante Validität?

es geht um die empirische Abgrenzung von theoretisch distinkten Konstrukten

Welche Verfahren stehen für die Prüfung der diskriminanten und konvergenten Validität zur Verfügung?

- bivariate Korrelationen

Wie kann man die Konstruktvalidität prüfen?

- gemeinsame Faktorenanalyse

- Multi-Trait-Multi-Method Matrix (MTMM-Ansatz)

Wie ist das Prinzip der MTMM-Matrix?

werden Konstrukte und Methoden einander gegenüber gestellt

Was versteht man unter Kriteriumsvalidität?

sämtliche Hinweise auf Validität aufgrund des beobachteten Zusammenhangs

mit externen Variablen, für die theoretisch ein Zusammenhang zu erwarten

ist

Was ist die Effektstärke d?

- zur Klassifikation von Personen in Gruppen

- gibt den Mittelwertsunterschied in den Testwerten der beiden Gruppen in Einheiten der Standardabweichung an

Was ist die Effektstärke d?

- zur Klassifikation von Personen in Gruppen

- gibt den Mittelwertsunterschied in den Testwerten der beiden Gruppen in Einheiten der Standardabweichung an

Wie kann man die bivariaten Effektsträken beurteilen?

• Schwacher Effekt: r = .10; d = .20

• Mittlerer Effekt: r = .30; d = .50

• Starker Effekt: r = .50; d = .80

Welche Varianten der Kriteriumsvalidität kann man nach dem Erhebungszeitpunkt unterscheiden?

- retrospektive Validität: Kriterium wird vor dem Test erhoben

- konkurrente Validität: Kriterium wird gleichzeitig zum Test erhoben

- prädiktive oder prognostische Validität: Kriterium wird nach dem Test erhoben

Welche Testgütekriterien mit vorwiegend praktischem Anwendungsbezug gitb es?

- Kosten-Nutzen-Relation

- Testökonomie

Wie sieht die Methode der Konstruktion gegen Erwünschtheitstendenzen immuner Tests zur Kontrolle sozialer Erwünschtheit aus?

- subtile Items (Items so formulieren, dass ihre Zielrichtung möglichst undurchschaubar wird)

- forced choice (aus mehreren gleich erwünscht scheinenden Antwortmöglichkeiten wählen)

- Test als objektive Tests konstruieren

Was ist ein zweiter Ansatz zur Kontrolle sozialer Erwünschtheit in Tests?

liegt darin, die Testteilnehmer z.B. durch Instruktionen, Warnungen vor der Aufdeckung von Verfälschungstendenzen oder gar den Anschluss an eine Art simulierten Lügendetektor (bogus pipeline) zu einer Verhaltensänderung im Sinne „ehrlicher“ Antworten zu veranlassen.

Was ist ein dritter Ansatz zur Kontrolle sozialer Erwünschtheit in Tests?

liegt im Versuch der Kontrolle und nachträglichen Korrektur von Erwünschtheitstendenzen, indem entsprechende Tendenzen durch Erwünschtheitsskalen oder durch die Frage nach Kenntnissen oder Erfahrungen mit nicht existenten Gegenständen (bogus items) erfasst und auffällige Testwerte anschließend entweder korrigiert oder ganz eliminiert werden.

Für welche Methode zur Kontrolle sozialer Erwünschtheit liegen derzeit positive Hinweise auf Validitätsverbesserung vor?

bogus items