Testtheorie und -praxis
Diagnostik VL Psychologie Master
Diagnostik VL Psychologie Master
Fichier Détails
Cartes-fiches | 57 |
---|---|
Langue | Deutsch |
Catégorie | Psychologie |
Niveau | Université |
Crée / Actualisé | 25.04.2017 / 25.11.2023 |
Lien de web |
https://card2brain.ch/box/20170425_testtheorie_und_praxis
|
Intégrer |
<iframe src="https://card2brain.ch/box/20170425_testtheorie_und_praxis/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Créer ou copier des fichiers d'apprentissage
Avec un upgrade tu peux créer ou copier des fichiers d'apprentissage sans limite et utiliser de nombreuses fonctions supplémentaires.
Connecte-toi pour voir toutes les cartes.
Reliabilität bei Verdopplung der Testlänge (l) und Verlängerung um den Faktor K (4)
Reliabilität Rel bei verdoppelter Testlänge l:
\(Rel (2l) = {2xRel \over 1+Rel}\)
-> Warum steht unten 1+Rel?
Resultierende Reliabilität eines Tests der Länge l durch Verlängerung um Faktor k kann durch die Spearman-Brown-Formel ausgedrückt werden:
\(Rel (kxl) = {kxRel \over 1+(k-1)xRel}\)
Reliabilität bei Verdopplung der Testlänge (l) und Verlängerung um den Faktor k - Anwendung
Anwendung:
- Um wie viele parallele Tests müsste ein Test verlängert werden, um seine Reliabilität auf eine bestimmten Wert anzuheben?
- Aufwertung von Split-Half-Reliabilitäten zur Schätzung der Gesamttest-Reliabilität
Standardmessfehler für Tv - Voraussetzungen, Berechnung (5)
Voraussetzungen: Reliabilität und Testwertevarianz müssen bekannt sein
Berechnung:
- Testwertevarianz Var(x) kann in Anteile der Reliabilität und sich selbst zerlegt werden
Var(x) = Rel x Var(x) + (1-Rel) x Var(x)
- Dies kann zu wahrer Varianz Var(T) und Fehlervarianz Var(E) umgeformt werden
Var(x) = Var(T) + Var(E)
- Diese Gleichung kann nach Var(E) umgestellt werden:
Var(E) = Var(x) - Rel x Var(x)
Var(E) = Var(x) x (1-Rel) -> Var(E) stellt den unerklärten Varianzanteil der Testwertevarianz Var(x) dar (?)
- Durch Wurzelziehen erhält man den Standardmessfehler: Sozusagen die Standardabweichung der Fehlervarianz
SD(E) = SD(x) x \(\sqrt{1-Rel}\)
- Je höher die Reliabilität, desto kleiner der Standardmessfehler
Konfidenzintervall für Tv - Definition
Das Konfidenzintervall umfasst denjenigen Bereich eines Merkmals, in dem sich 95% bzw 99% aller möglichen wahren Werte Tv befinden, die den Stichprobenwert ^Tv erzeugt haben können
Konfidenzintervall für Tv - Voraussetzung, Berechnung (4)
Voraussetzung: Normalverteilung der Fehler
Berechnung:
- einseitige Testung: ^Tv - z1 - a x SD(E) <= Tv <= ^Tv + z1 - a x SD(E)
- zweiseitige Testung: ^Tv - z1 - a/2 x SD(E) <= T <= ^Tv + z1 - a/2 x SD(E)
- untere Schranke <= Tv(wahrer Wert) <= obere Schranke
- d.h. wahrer Wert -/+ z-Wert aus Tabelle x Standardmessfehler
Konfidenzintervall für Tv - Bedeutung
Bedeutung: Der wahre Wert Tv liegt mit einer Wahrscheinlichkeit von (1-a, also 99%/95%) in diesem Intervall (a=0.05 bzw 0..01)
BSP Konfidenzintervall einer Intelligenzmessung: In einem Intelligenztest mit MWx= 100 und SD(x)= 15 erzielte ein Proband einen Testwert (IQ) von xv= 111. Die Reliabilität (Cronbachs Alpha) des Tests beträgt .94. Der Testanwender möchte wissen, in welchem Bereich der wahre Wert des Probanden mit einer Wahrscheinlichkeit von 95% liegt.
Rel = 0.94 -> SD(E) = 15 x \(\sqrt{1-0.94}\) = 3.67
- Mit SD(E) lässt sich nun ein Konfidenzintervall berechnen, in dem der wahre Wert mit einer Wahrscheinlichkeit von (1-a = 1 - 0.05 = .95 also 95%) liegt
111 - 1.96 x 3.67 <= Tv <= 111 + 1.96 x 3.67
103.8 <= Tv <= 118.2
- Der wahre IQ des Pbn liegt mit 95%iger Whrschk zwischen diesen Werten
BSP Konfidenzintervall einer Messung von Hochbegabung: Der wahre Wert des Probanden liegt mit 95%iger Whrschk zwischen 121.75 und 138.25
- Welchen Testwert müsste der Proband bei Rel = .89 erzielen, um mit statistischer Sicherheit hochbegabt zu sein?
- Welchen Testwert müsste er bei Rel = .96 erzielen?
- Tv kann auch unter 130 liegen -> Es kann nicht mit statistischer Sicherheit gesagt werden, ob es sich um Hochbegabung handelt
- Bei x>= 139 würde die untere Grenze des Konfidenzintervalls (^Tv-2 x SD(E)) keinen IQ unter 130 umfassen
- Bei Rel = .96 reicht ein x>=135, damit die unter Grenze nicht unter 130 fällt
Konfidenzintervall: Was passiert bei Rel = 0? (4)
- Standardmessfehler = Standardabweichung der Testwerte
SD(E) = SD(x)
- Die Breite des Konfidenzintervalls würde sich auf 49.5 vergrößern
2 x z1 - a x SD(x) = 2 x 1,65 x 15 = 49.5
- Je kleiner die Reliabilität, desto breiter wird das Konfidenzintervall
- Da bei sinkender Reliabilität auch die Punktschätzungen ungenau werden, sollten Tests mit Rel < .80 für die Individualdiagnostik nicht verwendet werden
Grenzen der KTT - Skalierung (2)
- Annahme, dass beobachtete Werte = wahrer Wert + Fehlerwert kann nicht empirisch überprüft werden, da die Größen nicht direkt beobachtbar sind
- Intervallskalenniveau als Voraussetzung kann bei den tatsächlichen vorliegenden Testwerten nicht überprüft werden
Grenzen der KTT - Konstruktvalidität (2)
- Homogenität der Testitems bezüglich des untersuchten Merkmals nicht überprüfbar
- Merkmale können nur operational definiert werden
Grenzen der KTT - Stichprobenabhängigkeit (2)
- Kennwerte der KTT sind stichprobenabhängig (Itemschwierigkeit, Trennschärfe, Reliabilität etc.)
- Generalisierbarkeit der Ereignisse unklar
Warum sind die meisten Testverfahren nach KTT konstruiert? (2)
- Bewährter Ansatz zur Beurteilung der Reliabilität von Tests und Fragebögen
- Ökonomische und praktische Handhabung
Welche Theorien überwinden die Grenzen der KTT?
Item-Response-Theory (IRT):
- strengere Annahmen
- Beschreibung des Reaktionsverhaltens der Pbn durch Personen- und Itemparameter
- Probalistischer Zusammenhang zwischen Merkmalsausprägungen und beobachteten Messweren
Testgütekriterien - Was ist ihr Zweck? Wie viele gibt es?
Zweck: Instrument der Qualitätsbeurteilung psychologischer Tests
1. Objektivität
2. Reliabilität
3. Validität
4. Skalierung
5. Normierung (Eichung)
6. Testökonomie
7. Nützlichkeit
8. Zumutbarkeit
9. Unverfälschbarkeit
10. Fairness
Objektivität - Zweck, Definition, 3 Aspekte
Zweck: Stellt die Vergleichbarkeit von Testleistungen verschiedener Testpersonen sicher
Definition: Ein Test ist dann objektiv, wenn er dasjenige Merkmal, das er misst, unabhängig von Testleiter und Testauswerter misst
3 Aspekte: Durchführungs-, Auswertungs-, Interpretationsobjektivität
Durchführungsobjektivität - Vorliegen, Bedingungen, Optimal
Vorliegen: Wenn das Testergebnis nicht davon abhängt, welcher Testleiter den Test durchführt
Bedingung: Standardisierung der Durchführungsbedingungen durch die Testautoren im Testmanual
Optimal: Wenn die Merkmalsausprägung der Testperson die einzige Variationsquelle in der Testsituation darstellt
Auswertungsobjektivität - Vorliegen, Bedingung, Messung, statistische Kennzahl
Vorliegen: Wenn bei vorliegendem Testprotokoll (Antworten der Testperson auf die Items) das Testergebnis nicht von der Person des Auswerters abhängt
Bedingung: Ggf. detaillierte Auswertungsregeln
Messung: Grad der Übereinstimmung verschiedener Auswerter bei der Auswertung einer bestimmten Testleistung
statistische Kennzahl: Konkordanzkoeffizient W (Kendall, 1962)
Interpretationsobjektivität - Vorliegen, Bedingung
Vorliegen: Wenn verschiedene Testanwender bei Testpersonen mit demselben Testwert zu denselben Schlussfolgerungen kommen
Bedingung: Angabe von Ergebnissen aus Eichstichprobe (Normtabellen), um VGL der Testperson mit relevanten Bezugsgruppen zu ermöglichen
Reliabilität - Definition, Reliabilitätskoeffizient, Varianzanteile, Verfahren, Einschränkung
Definition: Ein Test ist reliabel (zuverlässig), wenn er das Merkmal, das er misst exakt, d.h. ohne Messfehler, misst
Reliabilitätskoeffizient (Rel): Wert zwischen 0 und 1 (0<=Rel<=1)
- 1 bezeichnet das Freisein von Messfehlern -> Test führt an derselben Person immer zum gleichen Ergebnis
- 0 zeigt, dass das Testergebnis ausschließlich aus Messfehler besteht
- Test sollte Wert von 0.7 nicht unterschreiten
Varianzanteile:
- Reliabilität ist Anteil der wahren Varianz an der Gesamtvarianz der Testwerte, die Merkmalsstreuung der wahren Testwerte
- Unreliabilität ist restlicher Anteil an Gesamtvarianz der Messwerte, die Messfehlerbehaftetheit eines Messinstruments
Bestimmungsverfahren: Retest-Reliabilität, Paralleltest-Reliabilität, Testhalbierungs-Reliabilität, Innere Konsistenz
Einschränkung: Nur für Tests, die nach der KTT konstruiert wurden! Bei Tests nach der Item-Response-Theory andere Genauigkeitsbeurteilung der Testwerte möglich
Retest-Relabilität - Durchführung, Annahme, Zeitintervall
Durchführung: Derselbe Test wird zu zwei verschiedenen Zeitpunkten vorgelegt, Reliabilität ist Korrelation der Ergebnisse
Annahme: Merkmal selbst hat sich nicht verändert
Zeitintervall: Korrelation kann sich durch Ürbungs/Erinnerungseffekte verändern, oder durch Veränderung des Merkmals selbst (Identifizierung als Spezifität mittels Latent-State-Trait-Modelle möglich)
Paralleltest-Reliabilität - Königsweg, Berechnung, parallele Testformen
Königsweg: kann etliche reliabilitätsverändernde Einflüsse kontrollieren (Übungs/Lerneffekte, Merkmalsveränderungen)
Berechnung: Korrelation zwischen Testwerten in zwei parallelen Testformen, die aus inhaltlich möglichst ähnlichen Items (Itemzwillingen) bestehen
Parallele Tests: Führen trotz nicht identischer Itemstichproben zu gleichen wahren Werten und Varianzen der Testwerte
Testhalbierungs-Reliabilität - Berechnung, Korrekturfaktor
Berechnung: Test in zwei möglichst parallele Hälften teilen, Korrelation dieser Hälften berechnen
Korrekturfaktor: Wird brücksichtigt, um die verminderte Split-Half-Reliabilität wieder auf die ursprüngliche Testlänge hochzurechnen
Innere Konsistenz
- Jedes Item wird als eigenständiger Testteil betrachtet
- Je stärker diese untereinander korrelieren, desto höher ist die interne Konsistenz (Cronbach-a-Koeffizient; Cronbach, 1951)
Validität - Definition, Zusammenhänge, Interpretation, Anwendung, Aspekte
Definition: Test ist valide (gültig), wenn er das Merkmal, das er messen soll, wirklich misst und kein aderes
Zusammenhänge: wichtigstes Gütekriterium, Objektivität und Reliabilität sind nur günstige Voraussetzungen, ABER ohne hohe Reliabilität keine hohe Validität
Interpretation: Validität eines Tests ist Korrelation der Testwerte in der Testsituation mit einem korrespondierenden Verhalten außerhalb der Testsituation (Kriterium)
Anwendung: Validität ist das Ausmaß, in dem Angemessenheit und Güte von Interpretation und Maßnahmen auf Basis der Testwerte durch Empirie belegt werden
Validitätsaspekte: Inhalts-, Augenschein-, Konstrukt-, Kirteriumsvalidität
Inhaltsvalidität - Definition, Bestimmung, Items
Definition: Inwieweit ein Test oder ein Item das zu messende Merkmal repräsentativ erfassen
Bestimmung: Aufgrund logischer Überlegungen, Expertenurteile - NICHT numerisch
Items: Sollten unmittelbaren Ausschnitt aus Verhaltensbereich darstellen, über den Aussage getroffen werden soll
Augenscheinvalidität - Definition, Bedeutung
Definition: Gibt an, inwieweit der Validitätsanspruch eines Tests, vom bloßen Augenschein her einem Laien gerechtfertigt erscheint
Bedeutung: wichtig für Mittelbarkeit der Ergebnisse, Akzeptanz durch Testpersonen, ABER wissenschaftlich nicht zufriedenstellend
Konstruktvalidität - Definition, Beurteilung, konvergente und diskriminante Validität
Definition: Wenn der Rückschluss vom Verhalten der Testperson in der Testsituation auf zugrunde liegende psychologische Persönlichkeitsmerkmale (Konstrukte, latente Variablen, Traits) wissenschaftlich fundiert ist, Überprüfung durch theoretische Annahmen und Modelle
Beurteilung Konstruktvalidität: struktursuchende (EFA) und strukturüberprüfende Ansätze (CFA, nur bei Testmodellen mit latenten Variablen (?), Multitrait-Multimethod-Analysen)
Konvergente und diskriminante Validität:
- Formulierung von theoriegeleiteten Hypothesen über Zusammenhänge des vorliegenden mit konstruktverwandten oder -fremden Tests
- Vorliegender Test wird empirisch (Berechnung Korrelationen) mit den anderen Tests auf Un/Ähnlichkeit verglichen
- Entstehung eines nomologischen Netzwerkes
Kriteriumsvalidität - Definition, BSP, Übereinstimmungsvalidität, Vorhersagevalidität
Definition: Wenn vom Verhalten der Testperson innerhalb der Testsituation erfolgreich auf ein Kriterium (Verhalten außerhalb der Testsituation) geschlossen werden kann. Enge dieser Beziehung ist das Ausmaß an Kriteriumsvalidität (Korrelationsschluss).
Z.B.: Kind ist im Schulreifetest gut und ist auch in der Schule leistungsfähig
Übereinstimmungsvalidität/konkurrente Validität: Zusammenhang Testwert und zeitgleich existierendes Kriterium
Vorhersagevalidität: Zusammenhang Testwert und zukünftige Ausprägung eines Merkmals
-
- 1 / 57
-