M6a Psychologie
Testkonstruktion
Testkonstruktion
Kartei Details
Karten | 130 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 21.01.2020 / 12.02.2025 |
Weblink |
https://card2brain.ch/box/20200121_m6a_psychologie
|
Einbinden |
<iframe src="https://card2brain.ch/box/20200121_m6a_psychologie/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Wie erfolgt die Arbeitsdefinition bei der Testkonstruktion?
verschiedene Möglichkeit je nach Merkmalsabgrenzung:
- sollen definierte psychologische Konstrukte (wie z.B. Fähigkeiten) gemessen werden, kann diese aus einer überschaubaren Liste konkurierender Definitionen bestehen
- Bei kriterienorientierten Tests ist der Merkmalsbereich durch Inhalt und Umfang der Lernziele definiert
- Bei Tests zur Vorhersage bestimmter Verhaltensbereiche muss das zu prognostizierende Verhalten definitorisch eingegrenzt werden
Welche Aussagen zur externalen Testkonstruktion sind korrekt?
Welche Aussagen bezüglicher der unterschiedlichen Verfahren der Testkonstruktion sind korrekt?
Wiederholung Statistik: Was sind Prädiktor- und Kriteriumsvariable?
Prädiktor:
Variable, von der ein Einfluss auf eine andere angenommen wird.
Kriterium:
Die beeinflusste Variable.
Beispiel: Schulnoten und Intelligenz als Prädiktoren für beruflichen Erfolg.
Wie wirken sich die Reliabilitäten auf das Vertrauensintervall bei Äquivalenz- und Regressionshypothese aus?
- bei hohen Reliabilitäten führen Äquivalenz- und Regressionshypothese zu ähnlichen Ergebnissen
- bei niedrigen Reliabilitäten und extremen Werten verschiebt die Regressionshypothese das Vertrauensintervall näher zur Mitte
Was sind Profilgestalt und Profilhöhe?
Profilgestalt:
relative Position der Profilmerkmale zueinander (Rangreihe)
Stabilität der relativen Positionen über die Zeit
= ipsativ - differentielle Stabilität
Profilhöhe:
mögliche absolute Differenzen zw. den einzelnen wiederholt gemessenen Profilmerkmalen
= ipsativ - absolute Stabilität
Was ist ein polarisierter Profilverlauf?
Wie ist damit umzugehen?
Liegt vor, wenn Einzeltests, gemessen zur mittleren Profilhöhe, hohe oder niedrige Ausprägungen haben - z.B. bei einem IQ Test einige Subtests extrem gut, andere extrem schlecht ausfallen
-> genaue und kritische Bewertung der Gesamtwerte
-> Ursachenforschung
-> im Befund auf jeden Fall vermerken
Was besagt der Reliable Change Index (RCI) und aus welchen Werten wird er berechnet?
= ein Test der feststellen soll, ob eine beobachtete Veränderung (vor allem in der klinischen Psychologie) tatsächlich stattgefunden hat, oder nur durch Messfehler erklärbar ist.
- stellt einen z-Wert dar
- benötigt werden: Retest Reliabilität, Standardabweichung der Normstichprobe, Messwerte der Person in Prä- und Postmessung
=> entspricht der Wert des RCI dem kritischen z-Wert (z1-a/2) oder liegt darüber, ist die Veränderung nicht auf Messungenauigkeit zurück zu führen
Wie verläuft die zweistufige Absicherung von Testwertdifferenzen nach Huber?
1. Testen, ob Unterschiede in Messwerten auf Messfehler zurückzuführen sind (=messfehlerkristische Absicherung)
2. Testen, ob eine beobachtete Differenz unter Berücksichtigung der Korrelation (Validität) beider Skalenwerte selten vorkommt (valenzkritische Absicherung) (durch Bildung kritischer Differenz und Vergleich mit beobachterer Differenz)
- bei hoher Korrelation ist eine Differenz eher unwahrscheinlich, da beide dasselbe messen
Welche Voraussetzungen müssen zusätzlich zu denen der Äquivalenzhypothese bei der Verwendung des Standardschätzfehlers auf Basis der Regressionshypothese noch vorliegen?
eine bivariate Normalverteilung der Messfehler und der wahren Werte, die jedoch unkorreliert sein müssen
Wie wird unter der Regressionshypothese der wahre Wert einer Person ermittelt (Standardschätzfehler)?
mithilfe des beobachteten Wertes, der Reliabilität und dem Mittelwert der Rohwerte bzw. Normwerte
- bei Reliabilität = 1 entspricht der beobachtete Wert dem wahren Wert
- ist der Wert nicht perfekt messgenau, variiert er um den wahren Wert
- Wahrscheinlichkeit am höchsten, dass der wahre Wert sich um den Mittelwert der Population bewegt
Welche 2 Grundannahmen liegen der Äquivalenzhypothese (Standardmessfehler) zugrunde?
1. der beobachtete Wert stellt eine gute Schätzung des wahren Wertes dar
2. Der Messfehler fällt für jede Person gleich groß aus (unabhängig von Fähigkeits- oder Eigenschaftsausprägungen)
Was versteht man unter dem Phänomen "Regression zur Mitte"? (Vertrauensintervall)
- Korrektur zur Mitte im Rahmen der Regressionshypothese
- bei extremen Werten ist bei Messwiederholung mit weniger extremen Werten zu rechnen
- je unreliabler der Messwert, desto stärker fällt die Korrektur zur Mitte aus
Wodurch lässt sich die Größe des Vertrauensintervalls vor der Berechnung beeinflussen?
1. Art des Vertrauensintervalls (nach Regressionshypothese schmaler als nach Äquivalenzhypothese)
2. Wahl der Sicherheitswahrscheinlichkeit (ein- oder zweiseitige Fragestellung - bei einseitiger Testung kleineres Vertrauensintervall)
3. Wahl des geeigneten Reliabilitätskoeffizienten (bei Prognose Retest-Korrelation oder ggf. interne Konsistenz. Bei Statustest interne Konsistenz oder Split-Half oder Paralleltestkorrelation)
Welche der folgenden Aussage zur Faktorenanalyse sind korrekt?
Was ist die Sicherheitswahrscheinlichkeit und wie kann man sie durch den alpha- und beta- Fehler beeinflussen?
Sicherheitswahrscheinlichkeit bezieht sich darauf, wie verlässlich das geschätzte Vertrauensintervall den wahren Wert überdeckt.
Je nach zu erwartender Konsequenz ist es sinnvoller:
a. den Alphafehler zu minimieren und somit eine hohe Sicherheitswahrscheinlichkeit anzustregen
oder
b. den Betafehler zu minimieren und eine geringere Sicherheitswahrscheinlichkeit wählen
(Alphafehler = falsch positive ; Betafehler = falsch negativ)
Welche zwei Methoden stehen in der KTT zur Absicherung von beobachteten Testwerten zur Verfügung?
1. Absicherung des individuellen Testergebnisses mithilfe des Standardmessfehlers auf Basis der Äquivalenzhypothese (die davon ausgeht, dass der beobachtete Wert eine gute Annährung an den wahren Wert darstellt).
2. Absicherung des individuellen Testergebnisses mithilfe des Standardschätzfehlers auf Basis der Regressionshypothese (die davon ausgeht, dass der wahre Wert erst aus dem beobachteten Wert geschätzt werden muss)
Welche Form der Varianzanalyse wird im Rahmen der ICC durchgeführt?
- Regelfall: Alle beurteilten Personen / Objekte wurden durch alle Rater beurteilt => zweifaktorielle Varianzanalys
- wird jede Person nur von einem Teil der Rater beurteilt => einfaktorielle Varianzanalyse möglich
Was ist Kriteriumsvalidität und welche zeitlichen Komponenten werden unterschieden?
= wenn vom Verhalten der Testperson innerhalb der Testsituation erfolgreich auf ein Kriterium (Verhalten außerhalb der Testsituation) geschlossen werden kann
Abhängig von zeitlicher Verfügbarkeit unterscheidet man:
1. Übereinstimmungsvalidität (konkurrente Validität) wenn Kriterium in Gegenwart vorliegt
2. Vorhersagevalidität (prognostische Validität) wenn es erst in Zukunft gemessen werden kann
Was unterscheidet Faktorenanalytische Methoden i.e.S. (z.B. PAF) vom Komponentenmodell, welches der PCA zugrunde liegt?
- Faktorenanalytische Methoden i.e.S. gehen davon aus, dass sich die Ausprägungen einer Person auf einer beobachteten Variable (z.B. einem Item) aus einer gewichteten Kombination von Ausprägungen auf latenten Variablen plus Fehlerterm zusammen setzt.
- in Komponentenmodell entfällt Fehlerterm.
Was sind Quantitaitve, was qualitative Merkmale?
Qualitativ = Person lässt sich bezüglich der Ausprägung zumindest in Kategorien einteilen
Messungen auf Nominalskalenniveau
Quantitativ = Kategorien lassen sich graduell abstufen
Messungen auf Ordinal-, Intervall- oder Verhältnisskalenniveau
Welche Aussagen zu den unterschiedlichen Testarten sind korrekt?
Welche Aussagen zu Testlänge und Testzeit sind korrekt?
Welche Aussagen zu Reihenfolgeeffekten bei Fragebögen sind korrekt?
Welche der folgenden Punkte sollten bei der Erstellung eines wissenschaftlichen Fragebogens (neben den generellen Konstruktionsvorgaben) beachtet werden?
Welche Aussagen zu Schiefe und Exzess sind korrekt?
Welcher spezifische Vorteil ergibt sich aus der Anwendung des Verfahrens der Paralleltest-Reliabilität?
Nach welchen Kriterien lassen sich Merkmale kategorisieren?
Eine alternative Bezeichnung für die internale Konstruktionsstrategie ist
Was trifft auf die Itemschwierigkeit zu?
In welchem Fall ist eine Anwendung der so genannten Ratekorrektur innerhalb der deskriptivstatistischen Evaluation denkbar?
Eine alternative Beschreibung für den Messfehler (E) einer Person innerhalb der KTT (Klassische Testtheorie) ist:
Definition: Reliabilität
Wann ist ein Testverfahren perfekt reliabel?
Unter Reliabilität wird die Genauigkeit einer Messung verstanden.
Ein Testverfahren ist perfekt reliabel, wenn die damit erhaltenen Testwerte frei von zufälligen Messfehlern sind.
Welche Aussagen zur Reliabilität sind korrekt?
Wann ist die Retest-Reliabilität hoch?
Die Retest-Reliablilität ist hoch, wenn zwei Messungen mit diesem Test zu unterschiedlichen Messzeitpunkten hoch miteinander korrelieren.
Wie sollten die Abstände zwischen den Testungen bei der Retest-Reliabilität sein?
Je instabiler das getestete Merkmal ist, desto kürzer sollten die Abstände sein.
Je stabilder das Merkmal ist und je größer das Risiko von Erinnerungs- und kurzzeitigen Übungseffekten erscheint, desto längere Intervalle bieten sich an.
Wann ist die Paralleltest-Reliabilität hoch?
Die Paralleltest-Reliabilität ist hoch, wenn zwei prarallele Testformen dieses Verfahrens (die gleiche wahren Werte und gleiche Fehlervarianzen aufweisen) hoch miteinander korrelieren.
Welche Aussagen zur Paralleltest-Reliabilität sind korrekt?
Welche Aussagen zur Splithalf-Reliabilität sind korrekt?
Welche Aussagen zu Cronbachs Alpha sind korrekt?