UNIT 2

Cornelia M. Contini

Cornelia M. Contini

Kartei Details

Karten 72
Lernende 17
Sprache Deutsch
Kategorie Psychologie
Stufe Universität
Erstellt / Aktualisiert 19.10.2017 / 30.05.2022
Weblink
https://card2brain.ch/box/20171019_m6a_wise_1718_fuh_testguetekriterien
Einbinden
<iframe src="https://card2brain.ch/box/20171019_m6a_wise_1718_fuh_testguetekriterien/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

die 7 Nebengütekriterien sind:

  1. Skalierung
  2. Normeirung (Eichung)
  3. Testökonomie
  4. Nützlichkeit
  5. Zumutbarkeit
  6. Unverfälschbarkeit
  7. Fairness

Welches sind die Hauptgütekriterien nach Prof. Christ?

Objektivität - Definition

Ein Test ist dann objektiv, wenn er dasjenige Merkmal, das er misst, unabhängig von Testleiter und Testauswerter misst.

Außerdem müssen klare und anwenderunabhängige Regeln für die Ergebnisinterpretation vorliegen.

Objektivität hat 3 Aspekte, welche?

Was bedeutet Durchfürhungsobjektivität?

Kontrollierte Durchführungsbedingungen und Standardisierung

Durchführungsobjektivität - kontrollierte Durchführungsbedingungen beinhalten ...

Standardisierung - Durchführungsbedingungen sind im Testmanual vom Testautor bzw. Herausgeber festgelegt. Anweisungen im Testmanual erstrecken sich  über Testmaterial, etwaige Zeitbegrenzungen und auf die Instruktionen. Auch ob und wie etwaige Fragen der Testpersonen zum Test behandelt werden sollen -> Verweis auf die Instruktion

Durchführungsobjektivität - Was bedeutet eine optimale Standardisierung des Tests

... die Testperson stellt die einzige Variationsquelle dar.

Alle anderen Bedigungen sollten konstant und kontrolliert sein

!! verbal conditioning!! -> Versuchsleitereffekt

Auswertungsobjektivität ist erfüllt, wenn ....

das Testergebnis nicht von der Person des Testauswerters abhängt.

Ist die Auswertungsobjektivität bei Multiple Choice Aufgaben/Mehrfachwahlaugaben erfüllt?

im Allgemeinen ist diese Problemlos zu erreichen

Wie sieht es mit der Auswertungsobjektivität bei Tests/Fragebogen mit offenem Antwortformat aus?

es müssen detaillierte Auswertungsregeln vorliegen, deren einheitliche Anwendung empirisch überprüft werden muss.

Die Auswertungsobjektivität kann mit welchem Maß angegeben werden und wie wird es gemessen?

  1. Konkordanzkoeffizient W (nach Kendall, 1962) uvm.
  2. gemessen wird der Grad der Übereinstimmung, die von verschiedenen Testauswertern bei der Auswerrtung einer bestimmten Testleistung erreicht wird
    ► je einheitlicher die Auswertungsregeln von verschiedenen Testauswertern angewendet werden

Interpretationsobjektivität bedeutet?

  • klare Regeln für die Testinterpretation
  • verschiedene Testanwender kommen bei Testpersonen mit demselben Testwert zu denselben Schlussfolgerungen
  • Hilfestellungen im Testmanual (Normtabellen) aus der sog. Eichstichprobe zum Vergleich

Fazit - Das Gütekriterium der Objektivität ist dann erfüllt, wenn der Test ...

bestehend aus Testunterlagen, Testdarbietung, Testauswertung und Testinterpretation so genau festgelegt ist, dass der Test unabhängig von Ort, Zeit, Testleiter und Auswerter durchgeführt werden könnte und für  eine bestimmte Testperson bzgl. des untersuchten Merkmals dennoch dasselbe Ergebnis zeigen würde.

Was bedeutet Reliabilität?

Messgenauigkeit eines Tests

Reliabilität - Definition

Ein Test ist dann reliabel (zuverlässig), wenn er das Merkmal, das er misst, exakt, d.h. ohne Messfehler, misst.

Reliabilität - Worüber wird das Ausmaß der Reliabilität erfasst?

Über den Reliabilitätskoeffizienten (Rel) der einen Wert zwischen 0 und 1  annehmen kann   ( \(0 \leq Rel \leq 1\))

Reliabilität - Welchen Wert hat der Reliabiliätskoeffizient und was bedeutet dieser?

Rel hat einen Wert zwischen 0 und 1 ( \(0 \le Rel \le 1\)) ⇒guter Test \(0,7\ge Rel \le 1\)

1 = Freisein von Messfehlern / völlige Reliabilität / ein Test für 2x exakt zu gleichen Ergebnis

0 = Testergebnis ist ausschließlich aus Messfehlern zustande gekommen

Reliabilität - Wie wird der Reliabiltätskoeffizient formell definiert?

Als Anteil der wahren Varianz an der Gesamtvarianz der Testwerte

- wahre Varianz misst die Merkmalsstreuung der "wahren" Testwerte

- verbleibende Teil repräsentiert dei "Unreliabiltät" oder die Messfehlerbehaftetheit eines Messinstruments

Reliabilität - die 4 Vorgehensweisen im Rahmen der KTT

  1. Retest-Reliabilität
  2. Paralleltest-Reliabilität
  3. Testhalbierungs-Reliabilität
  4. Innere Konsistenz

Reliabilität - Wie wird ein Retest-Verfahren durchgeführt?

einund derselbe Test wird zu zwei verschiedenen Zeitpunkten vorgelegt (unter der idealen Annahme, dass sich das zu messende Merkmal selbst nicht verändert hat)

Reliabilität wird als Korrelation zwischen den beiden Testergebnissen ermittelt

!!! ermittelte Korrelation in Abhängigkeit vom Zeitintervall kann zwischen beiden Testungen variieren
- Übungseffekte
- Erinnerungseffekte
- sich tatsächlich verändertes Persönlichkeitsmerkmal

diese Veränderungen können als "Spezifität" mittels sog. Latent-State-Trait-Modelle (Steyer, 1987) explizit identifiziert und berücksichtigt werden

Reliabilität - Das Paralleltest-Verfahren bedeutet?

Parallel sind zwei Testformen dann, wenn sie trotz nicht identischer Itemstichprobenzu gleichen wahren Werten und Varianzen der Testwerte führen.
-> wird als "Königsweg" der Reliabilitätsbestimmung bezeichnet

Vorteile:
- etliche reliabilitätsverändernde Einflüsse können eliminiert bzw. kontrolliert werden (Übungs- u. Erinnerungseffekte, Merkmalsveränderungen)
- Korrelation wird zwischen den beobachteten Testwerden in zwei "parallelen Testformen" (mit sog. Itemzwillingen) berechnet

Reliabilität - Was ist die Testhalbierungs-Reliabilität?

Ein Test wird in 2 möglichst parallele Testhälften geteilt
die "Testhalbierungs-Reliabilität" (Split-Half-Reliabilität) als Korrelation der beiden Testhälften bestimmt
-> Korrekturfaktor berücksichtigen:
   die verminderte Split-Half-Reliabiltät wird wieder auf die ursprüngliche Testlänge hochgerechnet,
   das führt zu einer Aufwertung der Testhalbierungs-Reliabilität

Reliabilität - die Innere Konsistenz

Konsistenzanalyse

ist eine Verallgmeinerung der Testhalbierungs-Methode

! Jedes ITEM eines Tests wird als eigener TESTTEIL betrachtet

Je stärker die Testteile untereinander positiv korrelieren, desto höher ist die interne Konsistenz des Verfahrens (Cronbach-alpha-Koeffizient der Reliabilität; Cronbach, 1951)

Validität - Definition?

Ein Test gilt dann als valide ("gültig"), wenn er das Merkmal, das er messen soll, auch wirklich misst und nicht irgendein anderes. (Moosbrugger & Kelava, S. 13)

Validität - welche Bedeutung hat die Validität in der Testpraxis?

- gilt als das wichtigste Gütekriterium überhaupt

- Objektivität und Reliabilität ermöglichen eine hohe Messgenauigkeit, liefern aber nur die günstigen Voraussetzungen für das Erreichen einer hohen Validität,

- da ein Test, der eine niedrige Reliabilität aufweist, keine hohe Validität haben kann.

Validität - Formale Definition (Moosbrugger & Kelava, S. 13)

Validität definiert sich als Korrelation der Testwerte in  der Testsituation mit einem korrespondierenden Verhalten außerhalb der Testsituation (Kriterium).

Validität - Wie wird die Validität anwendungspraktisch ausgedrückt?

Nicht nur in einer einzigen Korrelation

=> VORALLEM über das Ausmaß, in dem die Angemessenheit und die Güte von Interpretationen und Maßnahmen auf Basis von Testwerten oder anderen diagnostischen Verfahren durch empirische Belege und theoretische Argumente gestützt sind (S. 14)

Validität - Welches sind die 4 Aspekte der Validität nach Moosbrugger und Kelava (S. 15)

Validität - Wie lautet die Definition der Inhaltsvalidität?

Unter Inhaltsvalidität versteht man, inwieweit ein Test oder ein Testitem das zu messende Merkmal repräsentativ erfasst.

Validität - Was ist der Repräsentationsschluss bzgl. der Inhaltsvalidität?

die Testitems stellen eine repräsentative Stichprobe aus dem Itmuniversum dar, mit dem das interessierende Merkmal erfasst werden kann

Validität - wie wird die Inhaltsvalidität bestimmt?

aufgrung "logischer und fachlicher Überlegungen" (vgl. Cronbach& Meehl, 1955; Michel & Conrad, 1982)

- nicht numerisch anhand eines Maßes bzw. Kennwertes

Einfachste Art die Inhaltsvalidität zu klären:

- wenn die einzelnen Items einen unmitelbaren Ausschnitt aus dem Verhaltensbereich darstellen (zB Diktat für Rechtschreibkenntnisse)

Validität - Augenscheinvalidität ist wie definiert?

Augenscheinvalidität gibt an, inwieweit der Validitätsanspruch eines Tests, vom bloßen Augenschein her einem Laien gerechtfertigt erscheint. (Moosbrugger & Kelava, S. 15

Validität - in welchem Sinne ist die Augenscheinvalidität erheblich von Bedeutung?

- Mitteilbarkeit der Ergebnisse

- Akzeptanz von Seiten der Testperson

 

wissenschaftlich gesehen ist die Augenscheinvalidität nicht immer zufriedenstellend (empirisch belegt durch Kennwerte)

Validität - Definition Konstruktvalidität

Ein Test weist Konstruktionsvalidität auf, wenn der Rückschluss vom Verhalten der Testperson innerhalb der Testsituation auf zugrunde liegende psychologische Persönlichkeitsmerkmale ("Konstrukte", "latente Variablen", "Traits") wie Fähigkeiten, Dispositionen, Charakterzüge, Einstellungen wissenschaftlich fundiert ist. Die Enge dieser Beziehung wird aufgrund von testheoretischen Annahmen und Modellen überprüft.

Moossbrugger & Kelava, S. 16

Validität - Konstruktvalidität beschäftigt sich womit?

mit der theoretischen Fundierung des von einem Test tatsächlich gemessenen Merkmals

 

zB messen die Testaufgaben im Intelligenztest tatsächlich das Konstrukt "Intelligenz" oder eher die "Gewissenhaftigkeit"

Validität - Was sind die 2 Ansätze der Konstruktvalidität?

1) Struktursuchendes Vorgehen

2) Strukturprüfendes Vorgehen

Validität - Beschreibe die struktursuchende deskriptive Vorgehensweise der Konstruktvalidität

- Zur Gewinnung von Hypothesen über die ein- oder mehrdimensionale Merkmalsstruktur der Testitems werden EXPLORATIVE FAKTORENANALYSEN (EFA) zum Einsatz gebracht

- Innerhalb der einzelnen Merkmale geben die Faktorenladungen in Analogie zu den Trennschärfekoeffizienten einer Itemanalyse Auskunft über die Homogenität der Testitems

- Die solchermaßen gewonnenen Merkmalsdimensionen erlauben eine erste deskriptive Einordnung in ein bestehendes theoretisches Gefüge theoretischer Konstrukte. Dabei kann z.B. die Bildung eines "nomologischen Netzwerkes" nützlich sein

Validität - was ist ein Nomologisches Netzwerk

Bei der Bildung eines "nomologischen Netzwerkes " steht die Betrachtung theoriekonformer Zusammenhänge zu anderen Tests im Vordergrund

 

1) Bildung einer a priori theoriegeleitete Erwartungen über den Zusammenhang des vorliegenden Tests bzw. des/der von ihm erfassten Merkamals/-e mit konstruktverwandten und konstruktfremden bereits bestehenden Tests

2) empirisches vergleichen des voliegenden Tests hinsichtlich Ähnlichkeit bzw. Unähnlichkeit mit andern Tests

3) unterscheidung zwischen konvergenter und divergenter/diskriminanter Validität 

Validität - Konstruktvalidität - was ist die konvergente Validität?

Es wird das Ausmaß der Übereinstimmung mit Ergebnissen aus Tests für gleiche oder ähnliche Merkmale ermittelt, hinsichtilch dessen wie gut der Test das zu messende Merkmal misst.

Validität - Konstruktvalidität - was ist Diskriminante bzw. divergente Validität?

Der Test sollte  von Tests für andere Merkmale klar abgrenzbar sein, sprich niedrige korrelative Zusammenhänge

 

Der Test muss nicht nur mit konstruktfernen Test verglichen werden, sondern vorallem auch zu relativ konstruktnahen Tests in Beziehung gesetzt werden