Testaufbau und -analyse
Dozent Thomas Gatzka
Dozent Thomas Gatzka
Kartei Details
Karten | 71 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Andere |
Erstellt / Aktualisiert | 09.06.2019 / 24.06.2024 |
Weblink |
https://card2brain.ch/box/20190609_testaufbau_und_analyse
|
Einbinden |
<iframe src="https://card2brain.ch/box/20190609_testaufbau_und_analyse/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Wie lautet die Definition von Messen?
Messen ist die Zuordnung von Zahlen zu Objekten oder Ereignissen bezüglich der Ausprägung eines Merkmals oder einer Eigenschaft, sodass bestimmte Relationen zwischen den Zahlen (numerisches Relativ) vorhandene Relationen zwischen den Objekten oder Ereignissen (empirisches Relativ) homomorph abbilden.
Wie lautet die Definition eines psychologischen Tests?
Ein Test ist ein wissenschaftliches Routineverfahren zur Erfassung eines oder mehrerer empirisch abgrenzbarer psychologischer Merkmale mit dem Ziel einer möglichst genauen quantitativen Aussage über den Grad der individuellen Merkmalsausprägung.
Was ist die Varianz?
- Die Varianz ist das Mass der Variabilität.
- Streuungsmass
- Informiert über die Unterschiedlichkeit / Verteilung der Messwerte
Was ist die Standardabweichung?
- Quadratwurzel der Varianz
- Streuungsmass
- Repräsentative Abweichung vom Zentrum der Verteilung
In einem Intelligenztest hat eine Person 130 Punkte erreicht. Der Mittelwert bei diesem Verfahren liegt beiI 100 Punkten und die Standardabweichung beträgt 10. Hat diese Person eine hohe oder tiefe Punktzahl erreicht und wie viele Personen waren schlechter oder besser als sie?
Wertebereich:
- M +/- 1 SD: 68%
- M +/- 2 SD: 95%
- M +/- 3 SD: >99%
Die Person ist 3 Standardabweichungen über dem Mittelwert. Das heisst, sie hat einen höheren Wert als 99% aller Personen.
Was macht die z-Transformation?
Jede Normalverteilung lässt sich durch die z-Transformation in eine Standardnormalverteilung transformieren. Die entstandenen z-Werte sind nichts anderes, als die gleichen Werte ohne Mittelwert.
Was ist die Grundlage von 95% aller Tests?
Die klassische Testtheorie KTT
Was beschreibt die klassische Testtheorie?
Den Zusammenhang zwischen Testergebniss und Zielmerkmal / Merkmalsausprägung.
Was ist eine manifeste Variable?
Ein direkt beobachtbares Items
Die KTT basiert auf einigen wenigen Axiomen, aus denen sich zahlreiche Prinzipien und Berechnungen ableiten lassen. Was ist die Definition eines Axioms?
Ein Axiom ist ein Grundsatz einer wissenschaftlichen Theorie, der nicht aus anderen Aussagen abgeleitet ist und dessen Gültigkeit angenommen wird (nicht beweisbar).
Beispiel: Man kann nicht nicht kommunizieren.
Was gibt es für Arten von Axiomen?
Was ist ein Verknüpfungsaxiom?
X = T + E
Jeder beobachtete Wert X setzt sich zusammen aus einem wahren Wert T (True) und einem unkontrollierten, unsystematischen (unbekannte Grösse, Richtung) Messfehler E (Error).
Was sagt das Existenzaxiom aus?
E(X) = T > E(E) = 0
Der Erwartungswert des beobachteten Werts entspricht dem wahren Wert. Folglich ist der Erwartungswert des Messfehlers 0. Der Erwartungswert ist der Mittelwert bei unendlich vielen Messwiederholungen. Der Messfehler mittelt sich über mehrere Messungen aus.
Was sagt das Unabhängigkeitsaxiom?
corr(T,E) = 0
Es gibt keinen Zusammenhang zwischen Messfehlern und wahren Werten.
Korrelieren die Messfehler von zwei Messungen miteinander?
corr(Ea, Eb) = 0
Die Messfehler von zwei Messungen korrelieren nicht miteinander. Der Messfehler korreliert mit gar nicht! Eine Korrelation von zwei beobachteten Testwerten kann nur durch eine Korrelation der beiden wahren Werte zustande kommen.
Was ist der Standardmessfehler SE?
Der Standardmessfehler SE ist die Standardabweichung des Messfehlers (repräsentative Abweichung der Testwerte von den wahren Werten). Er ist abhängig von den beobachteten Testwerten und von der Reliabilität des Tests. Eine tiefe Reliabilität ergibt einen höheren Standardmessfehler.
Was gibt die kritische Differenz an?
Sie gibt an, wie sehr sich zwei Werte mindestens unterscheiden müssen, damit der Unterschied nicht mehr alleine durch Messfehler erklärt werden kann (Dkrit).
Für was braucht man die Minderungskorrektur?
Je grösser bei einem Test der Messfehleranteil bei den beobachteten Werten ist, desto geringer fällt die Korrelation aus. Mit der Formel der Minderungskorrektur können wir die schlechte Reliablität (z.B. der Leistungsbeurteilung der Firma, die den Test verwendet) rausrechnen und erhalten die richtige Korrelation unseres Tests.
Was kann man mit der Spearman-Brown-Formel machen?
Mit der Spearman-Brown-Formel kann man berechnen, wie sehr man einen Test kürzen oder verlängern kann, ohne dass dabei die Reliabilität abnimmt. Oder man kann berechnen, wie stark man die Testlänge ändern muss, damit die Reliabilität erhöht wird.
Was ist die Definition von Reliabilität?
Grad der Genauigkeit, mit dem ein Test ein bestimmtes Persönlichkeits- oder Verhaltensmerkmal misst (Messzuverläsigkeit, Messgenauigkeit).
Der Reliabilitätskoeffizient gibt an, wieviel Prozent der Varianz der beobachteten Testwerte auf echte Merkmalsunterschiede zwischen den Testpersonen und wieviel auf Fehlereinflüsse zurückzuführen ist. Was kann anhand der Reliabilität gemacht werden?
Gibt es einen Zusammenhang zwischen der Kovarianz und der Korrelation?
Ja, die Korrelation ist eine standardisierte Kovarianz. Der Korrelationskoeffizient berechnet sich daher wie bei der Kovarianz aus der Abweichung der beiden Variablen vom Mittelwert jedoch in Standardabweichungen.
Müssen wir den wahren Wert T kennen, um die Reliabilität eines Tests zu berechnen?
Nein. Die Reliabilität eines Tests lässt sich aus der Korrelation von den beobachteten Werten X1 und X2 berechnen. Einzige Bedingung ist, dass Messwiederholungen unter den genau gleichen Voraussetzungen durchgeführt werden (T1=T2).
Was ist ein Retest?
Eine wiederholte Darbietung desselben Tests an derselben Stichprobe in zeitlichem Abstand.
Welche weiteren Möglichkeiten für eine Messwiederholung gibt es nebst dem Retest?
- Paralleltest (zwei parallele Testss an derselben Stichprobe)
- Testhalbierung (ein Test mit vielen Items, der in zwei Hälften aufgeteilt wird)
- Interne Konsistenz (Verallgemeinerung der Testhalbierungsmethode auf beliebig viele Testteile)
Welche 3 Methoden gibt es bei der Testhalbierung?
- Odd-Even-Methode: Ungerade vs. gerade Items (z.B. i1, i3, i5 vs. i2, i4, i6)
- Zeitpartitionierungsmethode: 50% Bearbeitungsdauer. Bei Speed-Tests.
- Methode der Item-Zwilinge: Statistisch ähnliche Item-Paare. Bei heterogenen Tests.
Was steigert die Reliabilität?
- Item-Homogenität
- Hohe Item Streuung
- Testlänge
- Klare Testinstruktion
- Klare Item Formulierungen
- Klare Auswertungsregeln
Wie lautet die Definition der Validität?
Die Validität gibt an, ob der Test das auch wirklich misst, was er zu messen beansprucht (Gültigkeit der Messergebnisse).
Was sagt die Inhaltsvalidität aus?
Unter Inhaltsvalidität versteht man, wie repräsentativ die Items eines Tests für das zu messende Merkmal sind. Einzige Validitätsform, die man nicht berechnen kann.
Wie lautet die Definition von Konstruktvalidität und was ist die Voraussetzung?
Unter Konstruktvalidität versteht man empirische Belege dafür, dass ein Test das Konstrukt erfasst, welches er erfassen soll und nicht ein anderes. Es ist die wichtigste Validität. Voraussetzung ist die Faktorenanalyse.
Ein nomologisches Netzwerk in der Konstruktvalidität. Auf der Theorie Ebene gibt es bestimmte Zusammenhänge. Auf der Beobachtungsebene sollten sich die genau gleichen Zusammenhänge zeigen. Wenn die Ebenen nicht überein stimmen, stimmt etwas nicht (z.B. auf der Beobachtungsebene die Messinstrumente.
Bei der Konstruktvalidität prüft man Zusammenhänge zwischen den beobachtbaren Variablen und den Zusammenhängen auf der theoretischen Ebene. Welche 2 korrelativen Bestimmungen gibt es?
- Konvergente Konstruktvalidität (Hohe Korrelation mit den Testwerten aus anderen konstruktverwandten Tests)
- Divergente Validität (Keine Korrelationen mit den Testwerten aus konstruktfremden Tests)
Wie lautet die Definition der Kriteriumsvalidität?
Kriteriumsvalidität bedeutet, dass von einem Testergebnis auf ein für diagnostische Entscheidungen praktisch relevantes Kriterium (direkt messbare Leistung, Verhalten) ausserhalb der Testsituation geschlossen werden kann.
Was ist ein Prozentrangnorm?
Die gebräuchlichste nicht-lineare Testwerttransformation. Ein Prozentrang gibt an, wie viel Prozent der Referenzgruppe einen Testwert erzielten, der niedriger oder maximal ebenso hoch ist wie ein Testwert X (kumulierte prozentuale Häufigkeit).
Was kann bei den Prozentrangwerten eine Konsequenz der nicht-linearen Transformation sein?
Bei hoher Testwertdichte werden Unterschiede übermässig betont und bei geringer Testwertdichte weitgehend aufgehoben. Mit Prozentrangwerten dürfen wir nicht rechnen, sondern nur eine Aussage über höhere oder niedrige Werte machen.
Was sind z-Normwerte?
Der z-Normwert gibt an, wie stark der Testwert einer Testperson vom Mittelwert der Verteilung der Bezugsgruppe in Einheiten der Standardabweichung der Verteilung der Bezugsgruppe abweicht. Der z-Normwert ist eine lineare Testwerttransformation. z-Normwerte haben immer einen Mittelwert von 0 und eine SD von 1.
Was sind Standardnormwerte?
Ist eine weitere lineare Transformation. Da z-Normen durch negative Vorzeichen und Dezimalstellen unandlich sind, addieren wir den Wert 100 und multiplizieren mit einem gewissen Wert (z.B. IQ: z * 15 + 100).
Welche weiteren Gütekriterien gibt es neben den Hauptgütekriterien Reliabilität und Validität?
Weiteres Hauptgütekriterium: Objektivität
Nebengütekriterien: Skalierung, Normierung, Zumutbarkeit, Nützlichkeit, Unverfälschbarkeit, Fairness, Testökonomie