Testtheorie und Fragebogenkonstruktion
Testtheorie und Fragebogenkonstruktion
Testtheorie und Fragebogenkonstruktion
Set of flashcards Details
Flashcards | 71 |
---|---|
Language | Deutsch |
Category | Psychology |
Level | University |
Created / Updated | 24.04.2017 / 27.12.2024 |
Weblink |
https://card2brain.ch/box/20170424_testtheorie_und_fragebogenkonstruktion
|
Embed |
<iframe src="https://card2brain.ch/box/20170424_testtheorie_und_fragebogenkonstruktion/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Create or copy sets of flashcards
With an upgrade you can create or copy an unlimited number of sets and use many more additional features.
Log in to see all the cards.
Was bedeutet Itemhomogenität?
Antwortverhalten nur von der latenten Variablen und keinem anderen Merkmal abhängig
• Konsequenz:
Manifeste Variablen müssen Bedingung der lokalen stochastischen Unabhängigkeit genügen, damit man von Itemhomogenität ausgehen kann
• Untersuchbar anhand von Korrelationen
- Latente Variable ξ wird auf einem bestimmten Wert (der lokalen Stufe ξv) konstant gehalten
- Wenn dann die Korrelationen zwischen den Antwortvariablen verschwinden: lokale stochastische Unabhängigkeit --> Itemhomogenität
Was bedeutet spezifische Objektivität? (Rasch-Modell)
-Vergleiche zwischen Aufgaben/Personen immer unabhängig von Personen/Aufgabe
-->
-Unterschied zwischen 2 Itemschwierigkeiten ist immer gleich, egal mit welcher Person
-Unterschied zwischen 2 Personenfähigkeiten immer gleich, egal mit welcher Aufgabe
Überprüfung: Produkt der Einzelwahrscheinlichkeit muss Wahrscheinlichkeit entsprechen beide Items zusammen zu lösen
Wie kann die individuelle Testgenauigkeit gesteigert werden?
-Steigerung der Itemzahl
-Geeignete Itemauswahl (Items mit hohen individuellen Informationsbeiträgen)
Was sind Vorteile und Nachteile der Birnbaum-Modell?
• In den Birnbaum-Modellen werden „vorteilhafte“ Eigenschaften aufgegeben (z.B. spezifische Objektivität), das könnte aber auch realistischer in der Abbildung von Itemeigenschaften sein.
• Empirische .berprüfung ausschließlich mit „Anpassungstests“ (sog. Goodness-of-Fit-Maßen), die feststellen, wie gut die beobachteten Daten zum postulierten Modell passen, ohne aber einen sicheren Rückschluss auf die Geltung der Modellimplikationen zu erlauben.
• Beim Raschmodell können diese Implikationen (z.B. spezifische Objektivität, Stichprobenunabhängigkeit, Intervallskalierung, Summenwerte als erschöpfende Statistik) teilweise mit Modelltests überprüft werden.
Definition adaptives Testen
- expliziter, vorab festgelegter adaptiver Algorithmus zur Itemauswahl
- Items entsprechen den Annahmen eines ad.quaten Messmodells
Voraussetzung für das Nutzen der Items zum adaptivem Testen?
• Menge aller Testitems (der sog. Itempool) weist Konformität mit den Annahmen des verwendeten IRT-Modells auf
• für IRT-konforme Items wird lokale stochastische Unabhängigkeit angenommen
Mehrstudige Strategien des adaptiven Testens, welche 2 Formen gibt es ? + Beschreibe sie
- fest verzweigte Strategie (.fixed-branched strategy.)
• Beginn: Item mittlerer Schwierigkeit für alle
• Danach: je nach Antwort schwierigeres oder leichteres Item (bereits vor Testbeginn festgelegt, welches)
• Ende: Schätzung der individuellen Merkmalsauspr.gung (Schwierigkeit des Items, das als nächstes vorgelegt worden w.re oder mittlere Schwierigkeit aller im Testverlauf vorgelegten Items inkl. des Items, das als nächstes vorgelegt worden w.re, aber ohne das erste Item, das für alle Probanden identisch war)
- maßgeschneiderte Strategien (.tailored strategy.)
• Sehr feine Anpassung der vorzugebenden Items an das Antwortverhalten der Probanden möglich
• Setzt Computer voraus
• Verzweigung ergibt sich erst w.hrend der Testung (.variable branched tests.)
Welche sind mögliche Abbruchkriterium für eine Beedigung eines adaptiven Testes?
- eine bestimmte Anzahl von Items vorgelegt wurde und/oder
- der Standardfehler der Personenparametersch.tzung hinreichend klein ist und/oder
- eine maximale Testzeit erreicht wurde oder
- alle im Itempool verfügbaren Items vorgelegt wurden
Vorteile computerbasierte Testadministraion
+ hohe Testsicherheit
+ standardisierter Testablauf
+ probandenbestimmte Testgeschwindigkeit
+ schnelle und fehlerfreie Testwertbestimmung
+ Auswertung ohne psychometrisches Fachwissen
+ schnelle Ergebnisrückmeldung
+ Möglichkeit zur Verwendung innovativer Itemformate
Nachteile computerbasierter Testadministration
- hoher Entwicklungsaufwand
- Aufwand durch die Bereitstellung von Computern am Testort
- teilweise höhere Kosten
- problematische Fairness hinsichtlich computerbezogener Personenmerkmale (z. B. Erfahrung, .ngstlichkeit)
Was passiert bei der Verdopplung der Testlänge?
DIe Fehlervarianz verdoppelt sich + eine Vervierfachung der wahren Varianz
Welche zwei Arten der Testwertinterpretation gibt es ?
Normorientiert und kriteriumsorientiert
Was besagt der Prozentrang einer Testperson?
Prozentualer Flächenanteil der Häufigkeitsverteilung der Bezugsgruppe vom unteren Skalenende bis zum Testwert. --> wie viel Prozent der Bezugsgruppe hat einen Testwert erzielten der niedriger oder ebenso hoch ist wie der Wert der Testperson
Was gibt das Perzentil an?
Welcher Testwert dem korrepsondierenden Prozentrang entspricht
Vorteil und Nachteil von Prozenträngen?
+-auch für nicht normalverteilte Variablen ermittelbar
-- immer ordinalskaliert --> PR-Differenzen sind nicht aussagekräftig
Wofür braucht man den Standardmessfehler und Standardschätzfehler?
Um das Vertrauens/Konfidenzintervall zu berechnen (Statistische Absicherung von beobachteten Testwerten)
Was ist der Unterschied zwischen dem Standardmessfehler und dem Standardschätzfehler?
Standardmessfehler: Ausgangspunkt: Äquivalenzhypothese: Beobachteter Wert des Probanden ist gute Annährerung an den wahren Wert des Probanden (Keine Korrektur zur Mitte, aber ein breiteres KI bei Extremwerten = bessere Schätzung des KI für Extremwerte)
Standardschätzfehler: Ausgangspunkt: Regressionshypothese: Wahrer Wert des Probanden muss aus beobachtetem Wert erst geschätzt werden, Korrektur zur Mitte: bei extremen beob. Werten ist bei Messwiederholung weniger extremer Wert zu erwarten
Vertrauensintervall nach Regressionshypothese schmaler als nach Äquivalenzhypothese --> aber bei hohen Reliabilität = ähnliche Ergebnisse
Erforderliche Festlegungen der EFA:
1). Art der Extraktionsmethode (z.B. Hauptskomponenten- oder Hauptachsenmethode)
2). die Wahl des Abbruchkriteriums (z.B. Scree-Test oder Parallelanalyse)
3). die Methode der Faktorenrotation (z.B. orthogonal oder oblique Rotation)
Was sind Faktorladungen?
Ausmaß, wie stark die Ausprägung der Itemantwort von einem oder mehreren Faktoren beeinflusst wird (wie stark hängt individuelles Item mit Faktor zusammen.
-zwischen -1 und +1
-Bei unkorrelierten Faktoren: Korrelation: Item-Faktor
-Bei korrelierten Faktoren: semipartielles Regressionsgewicht
Was ist der Faktorwert?
Ausprägung einer Person auf einem Faktor
Was ist der Eigenwert eines Faktors und was bedeutet er im Kontext der PFA und der PCA?
Die durch den Faktor erklärte Varianz aller Items --> zeigt die Wichtigkeit des Faktors
-bei unkorrelierten Faktoren: quadierte Faktorladungen aller Variablen aufsummiert (spaltenweise)
-Variablen sind z-standardisert: Varianz von 1, dementsprechend immer wenn > 1, dann erklärt Faktor mehr Varianz als eine einzelne Variable
Was ist die Kommunalität einer Variable und was bedeutet sie im Kontext der PFA und PCA
die durch alle Faktoren aufgeklärte Varianz einer Variable
-bei unkorrelierten Faktoren: Summe der quadrierten Ladungen über alle Faktoren (zeilenweise)
PCA: max. 1, da die Variablen z-standardisiert sind
PFA: max. so groß wie die Reliabilität der Variablen
bei niedriger Kommunlalität: misst etwas anderes als das Konstrukt, jängt nicht gut den anderen Faktoren zusammen
Was ist die Einzigartigkeit ?
- 1-h2
- Varianz eines Items, die das Item mit keinem anderen teilt
- Setzt sich aus Spezifität (systematischer Varianzanteil, der nicht durch andere Faktoren erklärt werden kann) und Messfehler des Items zusammen)
Extraktionsmethoden (3)
-Hauptkomponentenanalyse, PCA
- Hauptachsenanalyse PFA
- Maximum-Likelihood-Faktorenanalyse
-
- 1 / 71
-