Bodeneffekte
Prüfung mit vielen Bodeneffekten...
Prüfung mit vielen Bodeneffekten...
Fichier Détails
Cartes-fiches | 323 |
---|---|
Langue | Deutsch |
Catégorie | Matières relative au métier |
Niveau | Université |
Crée / Actualisé | 26.05.2013 / 18.08.2013 |
Lien de web |
https://card2brain.ch/box/bodeneffekte
|
Intégrer |
<iframe src="https://card2brain.ch/box/bodeneffekte/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was sind Ursachen für Abweichungen von der Normalverteilung?
mangelhafte Konstruktion des Tests
- linksschief: Test zu einfach
- rechtsschief: Test zu schwierig
Korrektur: Ergänzung von Items im unterrepräsentierten Schwierigkeitsbereich oder Normalisierung
heterogene Stichprobe
Merkmal in Population nicht normalverteilt
Was ist die Annahme der Normalisierung?
Merkmal ist normalverteilt
Was macht die Normalisierung?
Testwerte xv werden so transformiert, daß die Testwertverteilung der transformierten Testwerte xv´ einer Normalverteilung folgt
Welche Verfahren der Normalisierun gibt es?
Flächentransformation
Nichtlineare Transformationen, wenn rechtsschief (zu schwierig)
- Logarithmierung
- Square Root
- Reziprok
Was ist die klassische Testtheorie (KTT)?
- Testtheorien befassen sich mit der Frage, wie die empirischen Testwerte und die zu messenden (tatsächlichen) Merkmalsausprägungen zusammenhängen
- Theorien sollen vor allem erklären, nicht nur beschreiben
- Psychologisches Konstrukt beeinflußt Testverhalten, das Testverhalten wiederum die Testauswertung und darüber auch das psychologische Konstrukt
- KTT befaßt sich mit der Messung und deren Ungenauigkeit
Die KTT ist eine Meßfehlertheorie:
Meßwert (x) = wahrer Wert (τ) + zufälliger Meßfehler (ε)
wahrer Wert konstant, Meßfehler variiert
Reliabilität/Präzision eines Tests läßt sich sowohl als Meßgenauigkeit als auch als Meßfehler betrachten
Meßfehlertheorie macht aber keine Aussage darüber, wie Leistung oder Antworten zustandekommen
Stellt keine direkte Verbindung her zwischen Fähigkeit, Merkmal oder Eigenschaft und Itembeantwortung
Axiome der Klassischen Testtheorie:
1. Existenzaxiom
Es existiert ein wahrer Testwert (true score) τvi als Erwartungswert einer Messung xvi:
τvi = E (xvi)
τvi = wahrer Wert (true score) einer Person v im Item i eines Tests
xvi = Meßwert einer Person v im Item i eines Tests
Erwartungswert E = Mittelwert einer theoretischen Verteilung
Axiome der Klassischen Testtheorie:
2. Verknüpfungsaxiom
Ein beobachteter Meßwert x setzt sich zusammen aus einem konstanten wahren Wert τ und einem zufälligen Fehlerwert ε.
xvi = τvi + εvi
εvi = Meßfehler der Messung mit Item i an Person v
Axiome der Klassischen Testtheorie:
Umkehrung des 2. Axiom der KTT
Der zufällige Fehlerwert ε ist die Differenz zwischen beobachtetem Testwert x und dem wahren Wert τ einer Person. Er repräsentiert alle unkontrollierbaren, unsystematischen (!) Störeinflüsse:
εvi = xvi – τvi
Axiome der Klassischen Testtheorie:
Verbindung von 1. und 2. Axiom
Bekannte Größe in Axiom 1 und 2: beobachteter Wert xvi
Unbekannte Größen in Axiom 1 und 2: wahrer Wert τvi und Fehlerwert εvi (Fehlervarianz σ²), können aus den Beobachtungen nicht direkt erschlossen werden, sind aber schätzbar
Aus der Kombination von Existenz- und Verknüpfungsaxiom ergibt sich, daß der Erwartungswert des Zufallsfehlers εvi gleich null ist:
E (εvi) = 0
Auch Summe und Mittelwert der Fehler sind gleich null
Der Erwartungswert des Testwertes einer Person (Summe aller Items eines Tests) ist der wahre Wert (Summe der wahren Werte der Items)
E(xv) = τv
Axiome der Klassischen Testtheorie:
3. Unabhängigkeitsaxiom
Meßfehler und wahrer Wert korrelieren nicht systematisch miteinander („Nullkorrelation“):
Corr (τvi, εvi) = 0
Die Höhe des Meßfehlers ε ist unabhängig vom wahren Ausprägungsgrad τ des getesteten Merkmals
Axiome der Klassischen Testtheorie:
4. Zusatzannahmen
Die Meßfehler einzelner Items und Personen sind unkorreliert
Die Meßfehler der Messungen mit den Items i und j von derselben Person v sind unabhängig voneinander:
Corr (εvi, εvj) = 0
Die Meßfehler der Messungen mit demselben Item i von den Personen v und w sind unabhängig voneinander:
Corr (εvi, εwi) = 0
Reliabilität als Kernkonzept der KTT: Reliabilitätsquotient τ/x
Testwertstabilität
(inkl. Behelfslösung)
Was ist der Standardmeßfehler?
Zur Beurteilung, wie gut die Schätzung des wahren Wertes ist, wird die Meßfehlervarianz bzw. Reliabilität benötigt
Damit ist die Berechnung des Standardmeßfehlers möglich, der es erlaubt, ein Konfidenzintervall um den beobachteten Wert zu bilden
In diesem Bereich befindet sich der wahre Wert mit der zuvor bestimmten Wahrscheinlichkeit
Definition Standardmeßfehler SMF: Anteil an der Standardabweichung eines Tests, der zu Lasten seiner Unreliabilität (1 – Rel) geht.
Standardabweichung der Verteilung der zufälligen unsystematischen Meßfehler um den wahren Wert
Was ist das Konfidenzintervall?
kennzeichnet den Bereich eines Merkmals, in dem sich 95% (bzw. 99%) aller möglichen Populationsparameter befinden, die den empirisch ermittelten Stichprobenkennwert erzeugt haben könnten.
Die angenommene Irrtumswahrscheinlichkeit meist 5%, sodaß zα/2 = 1.96 bei zweiseitiger Fragestellung
Je geringer der Standardmeßfehler, desto größer die Reliabilität und desto schmaler das Konfidenzintervall
Wie berechnet man die Konfidenzintervall-Breite (KIB)?
Streuung in eine Richtung mal zwei
Kritik an der KTT
2+ / 7-
+ KTT hat sich in der Praxis bewährt, über 95 % der Testverfahren beruhen auf ihr
+ ökonomisch und praktisch
- reine Meßfehlertheorie
- setzt Intervallskalierung voraus
- Grundannahme (x = τ + ε) ist nicht empirisch überprüfbar
- der wahre Wert wird idealtypisch als invariant betrachtet
- Eindimensionalität kann nicht nachgewiesen werden
- keine Stellungnahme zur Konstruktvalidität
- Kennwerte stichprobenabhängig
Welche Methoden der Reliabilitätsbestimmung gibt es?
- Test-Retest-Reliabilität (Testwiederholung)
- Paralleltest-Reliabilität (dieselbe Personenstichprobe bearbeitet zwei ähnliche Testversionen)
- Split-half-/Testhalbierungsreliabilität (Items werden nachträglich in zwei Testhälften geteilt)
- Interne Konsistenz/Cronbachs alpha (jedes Item wird als eigenständiger Testteil betrachtet, Verallgemeinerung der Split-half-Reliabilität)
Was ist die Test-Retest-Reliabilität?
Ausmaß, in dem bei denselben Vpn und mit demselben Test die Ergebnisse mehrerer Messungen miteinander korrelieren (Autokorrelation)
Wie berechnet man die Test-Retest-Reliabilität?
Welche Probleme gibt es bei der Berechnung der Test-Retest-Reliabilität?
Zeitaufwendig und teuer
Einflußfaktoren
- Testabstand (Retest-Intervall)
- falls zu kurz, höhere Wahrscheinlichkeit für Carry-over-Effekte
- falls zu lang, sind Merkmalsveränderungen möglich
- Carry-over-Effekte (Transfereffekte)
- Gedächtniseffekte
- Übungs- und Lerneffekte
Merkmalsfluktuation:
- iedrige Reliabilität, wenn das Merkmal nicht stabil ist, aber: kein Einfluß auf Retest-Reliabilität bei systematischer Merkmalsveränderung (Linien verlaufen parallel von 1. Testzeitpunkt zu 2. Testzeitpunkt)
Was ist die Paralleltest-Reliabilität?
Korrelation zwischen Test A und seinem Paralleltest B bei denselben Probanden (!)
Anwendung bei Power-/Niveautests und Speedtests, für Persönlichkeitstests zu aufwendig zu konstruieren
Welche Voraussetzungen gibt es für die Paralleltest-Reliabilität?
Test A und B sind äquivalent
- Gleiche Testwertvarianz
- Gleiche Fehlervarianz
- Das gleiche Merkmal wird mit der gleichen Genauigkeit (Reliabilität) und der gleichen Validität gemessen
Welche Probleme gibt es bei der Paralleltest-Reliabilität?
Schwierigkeit, einen äquivalenten Test zu konstruieren
- Deskriptive Überprüfung, ob die wichtigsten Kennwerte äquivalent sind: Verteilungskennwerte (Mittelwerte, Varianzen, Kovarianzen) sowie Reliabilität und Validität der Einzeltests
- Besser: konfirmatorische Faktorenanalyse
Einflußfaktoren:
- Carry-over-Effekte vermindert, dennoch Übertragen von Lösungsprinzipien möglich: Testvorgabe ausbalancieren, Gruppe 1 erst Test A, dann Test B, Gruppe 2 umgekehrt
- Item-Unterschiede: dasselbe Merkmal mit ähnlichen, aber nicht identischen Items messen
- Testabstand: sollte eher kurz sein
- Reliabilität der einzelnen Testformen
Zusammenhang zwischen Reliabilität und Reliabilität der einzelnen Tests, Testformen oder Testteile
Reliabilität kann nur so hoch sein wie die Reliabilität der einzelnen Tests oder Testformen
Maximal mögliche Korrelation zwischen zwei Tests/Merkmalen
Falls einer der beiden Tests weniger reliabel wäre, würde die Reliabilität der Parallelformen niedriger werden, und die tatsächliche Reliabilität der Testformen würde unterschätzt
Es ist möglich, daß die Paralleltest-Reliabilität niedriger ausfällt als jede der beiden Testformen
Was ist Split-half-(Testhalbierungs-)Reliabilität?
Korrelation zwischen zwei Hälften desselben Tests bei denselben Vpn
- Vorgabe eines einzigen Tests (einmalige Durchführung)
- Bildung von zwei Testhälften
- Bildung eines Test-Scores je Vp und Testhälfte
- Korrelation der zwei Test-Scores
Anwendung oft bei Speedtests, wenn Retest- und Paralleltest-Reliabilität unpraktisch sind
Welche Methoden der Aufteilung gibt es bei der Split-half-(Testhalbierungs-)Reliabilität?
- Zufällig (bei homogenen Items)
- Itemzwillinge (bei heterogenen Items)
- Odd-even (Item 1 in Test A, Item 2 in Test B usw.)
- Aufteilung nach Testzeit (Vpn sollen markieren, wieviele Items sie geschafft haben, Aufteilung nach gleicher Testzeit)
Wie berechnet man die Split-half-(Testhalbierungs-)Reliabilität?
Korrelation der Testhälften
Spearman-Brown-Korrektur
Was ist die Spearman-Brown-Korrektur?
Aufwertung der Korrelation (weil jede Hälfte nur die halbe Aussagekraft des ganzen Tests hat; Halbtestkorrelation entspricht nur der Reliabilität eines Tests halber Länge, Reliabilität wird geringer bei niedrigerer Itemanzahl)
ohne Korrektur wird die Reliabilität bei der Split-half-Methode unterschätzt
Was ist die Interne Konsistenz/Cronbachs alpha?
- Ausmaß, in dem eine Vp alle Items in gleicher Weise beantwortet
- Erweiterung der Split-half-Reliabilität
- Ein Test wird in so viele Teile wie Items zerlegt, jedes Item wird als Testteil betrachtet
Was ist die Interne Konsistenz/Cronbachs alpha?
- Ausmaß, in dem eine Vp alle Items in gleicher Weise beantwortet
- Erweiterung der Split-half-Reliabilität
- Ein Test wird in so viele Teile wie Items zerlegt, jedes Item wird als Testteil betrachtet
Wie berechnet man die Interne Konsistenz/Cronbachs alpha?