M6 - Grundlagen der Testkonstruktion
Kapitel 5: Evaluation psychologischer Testverfahren
Kapitel 5: Evaluation psychologischer Testverfahren
Set of flashcards Details
Flashcards | 34 |
---|---|
Students | 18 |
Language | Deutsch |
Category | Psychology |
Level | University |
Created / Updated | 27.01.2012 / 10.09.2017 |
Weblink |
https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion7
|
Embed |
<iframe src="https://card2brain.ch/box/m6_grundlagen_der_testkonstruktion7/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Welche Richtlinien und Beurteilungssysteme für Tests gibt es?
siehe Tabelle ab Seite 168
Wann ist ein Test objektiv?
ein Test ist in dem Maße objektiv, in dem die Testergebnisse unabhängig vom Untersucher zustande kommen
Wie lässt sich Objektivität unterteilen?
- Durchführungsobjektivität
- Auswertungsobjektivität
- Interpretationsobjektivität
Was ist Durchführungsobjektivität?
das Ausmaß, in dem Testergebnisse frei von schwankungen zwischen den Bedinungungen unterschiedlicher Durchführungsgelegenheiten zustande kommen
Was ist Auswertungsobjektivität?
das Ausmaß, in dem verschiedene Auswerter desselben Testbogens zu denselben Ergebnissen kommen
Was ist Interpretationsobjektivität?
das Ausmaß der Übereinstimmung in der Interpretation aufgrund gleicher Testergebnisse
Wie kann die Reliabilität empirisch bestimmt werden?
durch verschiedene Arten der Reliabilitätsschätzung
Welche verschiedenen Arten der Reliabilitätsschätzung gibt es?
- interne Konsistenz
- Retest-Reliabilität
- Paralleltest-Reliabilität
- Interrater-Reliabilität
Was ist interne Konsistenz?
Bei der Bestimmung der internen Konsistenz entstehen die
miteinander korrelierten Messreihen, indem ein Test zwar nur einmal erhoben,
aber dann so aufgeteilt wird, dass die Testteile korreliert werden können. Die verschiedenen Konsistenzkoeffizienten schätzen also das Ausmaß der Gemeinsamkeiten der Testteile (im Gegensatz zu deren Spezifität) ab.
Was ist die einfachste Aufteilung eines Tests?
die Split-Half-Reliabilität ein Spezialfall der internen Konsistenz, deren einziger
Vorteil gegenüber den weiter unten dargestellten Verallgemeinerungen die einfachere
Berechnung ist
Wie lautet die Korrekturformel zur Ermittlung der Reliabilität bei Verlängerung eines Tests um einen parallelen Faktor k?
Spearman-Brown-Formel:
rtt = k ⋅ r12 / (1 + (k −1) ⋅ r12),
Was ist Cronbach-alpha?
Cronbach-α handelt es sich um
eine Generalisierung der Testhalbierungsmethode, die im Grunde einen Mittelwert
der Konsistenzkoeffizienten über alle denkbaren Aufteilungen des Tests
(i.d.R. mit den einzelnen Items als Einheit) darstellt.
Worauf bezieht sich der Retest-Koeffizient?
auf die Erfassung der Reliabilität als zeitliche Stabilität der
Messungen.
Wie kann Validität differenziert werden?
- Inhaltsvalidität
- Konstruktvalidität
- kriterienbezogene Validität
Worauf bezieht sich die Inhaltsvalidität?
auf die Übereinstimmung der Testinhalte mit dem zugrunde liegenden Merkmal des Tests
Was ist Konstruktvalidität?
die Interpretation von Testergebnissen als Indikatoren theoretischer Konstrukte
Was ist Konstruktvalidität?
die Interpretation von Testergebnissen als Indikatoren theoretischer Konstrukte
Welche Strategien der Konstruktvalidierung nennt Cronbach?
- das logisch-argumentative Vorgehen
- die experimentelle Prüfung
- korrelative Analysen
Was ist die faktorielle Validität?
damit ist die Bestätigung der intendierten faktoriellen Struktur eines Tests gemeint
Was ist die konvergente Validität?
geht es also um den Aspekt der theoretisch erwarteten Übereinstimmung,
Was ist die diskriminante Validität?
es geht um die empirische Abgrenzung von theoretisch distinkten Konstrukten
Welche Verfahren stehen für die Prüfung der diskriminanten und konvergenten Validität zur Verfügung?
- bivariate Korrelationen
Wie kann man die Konstruktvalidität prüfen?
- gemeinsame Faktorenanalyse
- Multi-Trait-Multi-Method Matrix (MTMM-Ansatz)
Wie ist das Prinzip der MTMM-Matrix?
werden Konstrukte und Methoden einander gegenüber gestellt
Was versteht man unter Kriteriumsvalidität?
sämtliche Hinweise auf Validität aufgrund des beobachteten Zusammenhangs
mit externen Variablen, für die theoretisch ein Zusammenhang zu erwarten
ist
Was ist die Effektstärke d?
- zur Klassifikation von Personen in Gruppen
- gibt den Mittelwertsunterschied in den Testwerten der beiden Gruppen in Einheiten der Standardabweichung an
Was ist die Effektstärke d?
- zur Klassifikation von Personen in Gruppen
- gibt den Mittelwertsunterschied in den Testwerten der beiden Gruppen in Einheiten der Standardabweichung an
Wie kann man die bivariaten Effektsträken beurteilen?
• Schwacher Effekt: r = .10; d = .20
• Mittlerer Effekt: r = .30; d = .50
• Starker Effekt: r = .50; d = .80
Welche Varianten der Kriteriumsvalidität kann man nach dem Erhebungszeitpunkt unterscheiden?
- retrospektive Validität: Kriterium wird vor dem Test erhoben
- konkurrente Validität: Kriterium wird gleichzeitig zum Test erhoben
- prädiktive oder prognostische Validität: Kriterium wird nach dem Test erhoben
Welche Testgütekriterien mit vorwiegend praktischem Anwendungsbezug gitb es?
- Kosten-Nutzen-Relation
- Testökonomie
Wie sieht die Methode der Konstruktion gegen Erwünschtheitstendenzen immuner Tests zur Kontrolle sozialer Erwünschtheit aus?
- subtile Items (Items so formulieren, dass ihre Zielrichtung möglichst undurchschaubar wird)
- forced choice (aus mehreren gleich erwünscht scheinenden Antwortmöglichkeiten wählen)
- Test als objektive Tests konstruieren
Was ist ein zweiter Ansatz zur Kontrolle sozialer Erwünschtheit in Tests?
liegt darin, die Testteilnehmer z.B. durch Instruktionen, Warnungen vor der Aufdeckung von Verfälschungstendenzen oder gar den Anschluss an eine Art simulierten Lügendetektor (bogus pipeline) zu einer Verhaltensänderung im Sinne „ehrlicher“ Antworten zu veranlassen.
Was ist ein dritter Ansatz zur Kontrolle sozialer Erwünschtheit in Tests?
liegt im Versuch der Kontrolle und nachträglichen Korrektur von Erwünschtheitstendenzen, indem entsprechende Tendenzen durch Erwünschtheitsskalen oder durch die Frage nach Kenntnissen oder Erfahrungen mit nicht existenten Gegenständen (bogus items) erfasst und auffällige Testwerte anschließend entweder korrigiert oder ganz eliminiert werden.
Für welche Methode zur Kontrolle sozialer Erwünschtheit liegen derzeit positive Hinweise auf Validitätsverbesserung vor?
bogus items