Kapitel 4, TTFK


Kartei Details

Karten 40
Sprache Deutsch
Kategorie Spanisch
Stufe Andere
Erstellt / Aktualisiert 05.04.2013 / 07.06.2013
Weblink
https://card2brain.ch/box/9783642200717_kapitel_4
Einbinden
<iframe src="https://card2brain.ch/box/9783642200717_kapitel_4/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was wird unter dem Begriff der "Itemanalyse" verstanden?

Die Items an einer für die Zielgruppe möglichst repräsentativen Stichprobe einer deksriptivstatistischen Evaluation zu unterziehen

Welche sechs deskriptivstatistische Untersuchungsschrite gehören zur Itemanalyse?

  1. Analyse der Itemschwierigkeit
  2. Bestimmung der Itemvarianzen
  3. Trennschärfeanalyse der Items
  4. Itemselektion und Testrevision
  5. Testwertermittlung
  6. Bestimmung der Testvertverteilung und ggf. Normalisierung

Was versteht man unter dem Schwierigkeitsindex Pi und wie lautet die Formel dazu?

Der Schwierigkeitsindes Pi eines Items ist der Quotient aus der bei diesem Item tatsächlich erreichten Punktsumme aller n Probanden und der maximal erreichbaren Punktsumme, multipliziert mit 100

Wie ist das Resultat des Schwierigkeitsindexes Pi zu interpretieren?

Durch die Multiplikation mit 100 erhält man stets einen Wertebereich von 0 bis 100. Je höher die Zahl, desto einfacher die Aufgabe.

Daher gilt eher: Schwierigkeitsindex = "Leichtigskeitsindex"

Wie muss die Formel des Schwierigkeitsindex Pi abgeändert werden, wenn aufgrund der Ratingskala der kleinste Wert einer Antwort nicht 0 sondern z.B. 1 ist?

Im Zähler müssen von jeder erreichten Antwort jedes einzelnen Probanden, die minimal erreichbare Punktezahl abgezogen werden (also z.B. -1)

Im Nenner muss von der maximal möglichen Punktsumme aller n Probanden, die minimal mögliche Punktsumme aller n Probanden abgezogen werden

Gegeben sei ein Item (z.B. Wie oft fahren sie Velo?) bei einem Speedtest:

Welche Funktion haben in diesem Fall nR, nF, nA und nU  und in was drückt sie Summer dieser Elemente aus?

nR, nF, nA und nU : Der Niedergestellte Buchstabe bezeichnet jeweils die Antwort der n Probanden:

R= Richtig beantwortet, F= Falsch, A= Ausgelassen, U= Unbeantwortet

Wenn mann diese vier Elemente addiert, zeigt die Summe die Anzahl Probanden an, welche dieses Item bearbeitet haben

Was drückt nB bei der Itemanalyse eines Speedtests aus?

 

nB setzt sich wie folgt zusammen: n+ n+ nA = nB

Es drückt aus, wie viele Probanden die Aufgabe bearbeitet haben (egal ob richtig, falsch oder ausgelassen)

Wie lautet die Formel für die Bestimmung des Schwierigkeitsindexes eines Speedtests und wieso wird nB verwendet?

Um die Schwierigkeit eines Items in einem Speedtest zu bestimmen werden die Anzahl richtigen Antworten im Item mit 100 mulltipliziert und anschliessend durch die Summe der richtigen, faschen und ausgelassenen Antworten bei diesem Item dividiert.

Die Unbeantworteten Fragen werden nicht miteinbezogen, um die Schwierigkei nicht zu überschätzen

Weshalb gibt es in einem Niveautest (Powertest) keine unbeantworteten Aufgaben?

Der Test wird ohne Zeitbeschränkung gemacht; d.h. der Proband hat die Aufgabe nicht mangels Zeit, sondern aufgrund der Schwierigkeit ausgelassen

Wie wird der Schwierigkeitsindex eines Items in einem Niveautest (Speedtest) berrechnet ohne das "Problem des Ratens" zu berücksichtigen?

Die Anzahl richtigen Antworten werden mit 100 multipliziert und anschliessend durch die Anzahl aller Probanden geteilt.

Wie lautet die Formel zur Bestimmung des Schwierigkeitsindexes eines Niveautests (Powertests) unter der Berücksichtigung, dass auch geraten werden könnte?

Von der Anzahl richtiger Antworten wir der Quotient der Anzahl falscher Antworten und Anzahl Antwortalternativen minus eins subtrahiert; dieses Ergebnis wird wieder mit 100 multipliziert und alles durch die Anzahl Probanden dividiert

Wann kann die Formel ohne die Korrektur des Ratens bei der Itemanalyse von Niveautests (Powertests) angewandt werden?

  1. Bei MC-Tests mit mehr als vier Antwortalternativen
  2. Bei Persönlichkeitstests

In einem Persönlichkeitstest gibt es grundsätzlich keine richtigen und falschen Antworten.

Wozu dient der Schwierigkeistindex trotzdem, bzw. wofür steht er?

Bei der Itemanalyse eines Persönlichkeitstests wird zwischen symptomatischer und unsymptomatischer Antwort unterschieden. Eine Zustimmung bedeutet in der Regel Symptomatisch, eine gewisse Merkmalsausprägung zu besitzen, auser bei invertierten Items (umgepolte Items)

Wie wird der Schwierigkeitsindex bei einem Persönlichkeitstest bestimmt, wenn es nur zwei Antwortkategorien zur Auswahl gibt?

Die Summe der Anzahl richtigen Antworten (in diesem Fall symptomatischen Antworten) wird mit 100 multipliziert und anschliessend durch die Anzahl Probanden die dieses Item bearbeitet haben dividiert

(Formel Analog zu Schwierigkeitsindex bei Niveautest ohne Berücksichtigung des "Problems des Ratens")

Wie kann der Schwierigkeitsindex  bei Persönlichkeitstests mit mehr als 2 Antwortalternativen bestimmt werden?

Die Anzahl erreichte Punkte in einem Item über alle Probanden hinweg multipliziert mit 100, dividiert durch die Anzahl maximal möglicher Punkte über alle Probanden hinweg

Wie kann der Schwierigkeitsinex in einem Persönlichkeitstest interpretiert werden?

Möglicher Wertebereich des Index liegt zwischen 0 und 100. Je höher der Wert eines Items, desto einfacher fällt es den Probanden die für die gesuchte Merkmalsausprägung symptomatische Antwort zu finden

Wie wird die Varianz (ganz allgemein) berrechnet?

 

Die Varianz ist die Summe der quadrierten Abweichung aller Messwerte vom arithmetischen Mittelwert, dividiert durch die Anzahl aller Messwerte. 

n-1, weil es sich in diesem Fall um eine Stichprobe handelt

Wie wird die Standardabweichung berrechnet?

Standardabweichung = Wurzel aus der Varianz

Was versteht man unter Itemvarianz?

Itemvarianz: Die Differenzierungsfähigkeit eines Items i hinsichtlich der untersuchten Probandenstichprobe. Liegt die Schwierigkeit eines Items fest, so ist die mögliche Ausprägung seiner Varianz begrenzt

Was versteht man unter der Differenzierungsfähigkeit eines Items?

Items mittlerer Schwierigkeit leisten viele Differenzierungen, Items extrem hoher oder extrem tiefer Schwierigkeit leisten kaum Differenzierung (da entweder fast alle oder fast niemand richtig bzw falsch antwortet)

Welche grundsätzlichen "Regekln" gibt es bezüglich des Schwierigkeitsindexes (wie schwer/leicht soll ein Item wann sein, etc.)?

  1. Allgemein grösste Differenzierungsfähigkeit bei mittlerer Schwierigkeit
  2. Oft Items mit unterschiedlicher Schwierigkeit gewünscht, da dadurch Diskirminierung auf verschiedenen Stufen (Pi zwischen 5 und 95)
  3. Bei der Erfassung von extremen Merkmalsuausprägungen extrem leichte bzw. extrem schwierige Items
  4. Speedtests: Grosse Anzahl leichter Items
  5. Bei Powertests: Manchmal Anordnung nach ansteigender Schiwerigkeit

Wie wird die Itemvarianz eines Items mit mehr als 2 Antwortstufen berrechnet?

Erreichte Puntsumme aller Probanden minus dem Produkt zwischen pi und k-1 im Quadrat, dividiert durch die Anzahl Probanden, welche dieses Item gelöst haben

pi = Pi : 100

k = Anzahl Antwortstufen im Item

Wie kann die Itemvarianz berrechnet werden, wenn das Item nur zwei Stufen aufweist?

pi mal (1 minus pi) ergibt die Itemvarianz in einem zweistufigen Item

Welchen offensichtlichen Zusammenhang weisen Itemvarianz und Itemschwierigkeit bei dichotomen Aufgaben auf?

Die Itemvarianz hat ihr maximum bei genau mittlerer Itemschwierigkeit ( also 50), d.h. bei dichotomen Items die grösste Differenzierung bei einer Itemschwierigkeit von

Pi = pi mal 100 = 50 erreicht wird

Wazu dient die Itemtrennschärfe?

Wichtigster Itemkennwert! Drückt inhaltlich aus, wie gut in Item das gleiche Merkmal (Eigenschaft oder Fähigkeit) misst, wie der Rest des Tests

  1. Klärt wie gut ein Item den Gesamttest/skala, der/die aus den restlichen Items gebildet wird, wiederspiegelt
  2. Index inwiefern die Löser über die Items hinweg identisch/konstant bleiben
  3. Wie gut das gesamte TEstergebnis aufgrund dieses einzelnen Items vorhersagbar ist
  4. Wie stark die Differenzierung des hweiligen Items mit der Differenzierung der Gesamtskala (Kriterium) übereinstimmt

Welche "Korrelations-Art" gibt die Trennschärfe bei intervallskalierten Items und Skalen an?

Die Produkt-Moment-Korrelatio bestimmt die Trennschärfe bei einem Item und Skala, welches intervallskaliert ist

Welche "Korrelations-Art" gibt die Trennschärfe bei dichotomen Items und intervallskalierten Skalen an?

Die Punktbiseriale-Korrelation

Wie wird die Kovarianz zweier Items/Variablen berrechnet und daher auch die Korrelation dieser?

Siehe Bild

Was muss bei der Berrechnung der Trennschärfe beachtet werden?

Dass die Itemhomogenität gewährleistet ist; sonst ensteht das Problem der Autokorrelation bei der Berechnung der Trennschärfe: Der Wert des Items geht zweimal in die Berechnung ein, d.h. die Trennschärfe wird erhöht

Dieses Problem kann mit der Teil-Ganz-Korrektur (Part-whole-Korrektur) behoben werden

Wie kann der Einfluss der Part-Whole-Korrektur grundsätzlich vermindert werden? (also das man diese Korrektur im Idealfall gar nicht anwenden müsste?)

 

-Steigende Anzahl der Items, Abnahme des Einflusses der Korrektur

-Homogenität der Skala

Wie lautet die Formel zur part-whole-korrektur bei Intervallskaliertem Item und Skala?

Siehe Bild

Wie lautet die Formel zur Punkt-biserialen Korrelation?

 

(Wird bei der Bestimmung der Trennschärfe von Dichotomen Items angewandt)

Wie lauten die Abstufungen zur Beurteilung der berechneten Trennschärfe?

Gemäss Buch ist eine Trennschärfe zwischen .40 und .70 "gut"

Was bedeutet eie "höher" werdende Trennschärfe und was sagt eine negative Trennschärfe aus?

Je höher die Trennschärfe eines Items, desto mehr wird das Item von Probanden mit hohem Testwert gelöst / symptomatisch beantwortet (Item misst, was der Test messen sollte)

Negative Trennschärfe bedeutet, dass das Item von Probanden mit niedrigen Testwerten gelöst / symptomatisch beantwortet wurde (Item misst nicht, was der Test messen sollte)

In welchem Zusammenhang stehen Itemvarianz und und Trennschärfe?

 

Eine hohe Itemvarianz begünstigt eine hohe Trennschärfe

In welchem Zusammenhang stehen Trennschärfe und Item-Interkorrelation?

  1. Hohe Trennschärfen setzen hohe Item.Interkorrelationen voraus
  2. Die Variation von Itemschwierigkeiten führt zu einer Abnahme der Interkorrelationen (Homogenität) zwischen den Items und zu einer Abnahme der Trennschärfe 

 

Wofür steht die Homogenität von mehreren Items?

Verschiedene Items messen verschiedene Facetten; Homogenität drückt aus, wie stark sich diese Items überlappen, inwiefern also diese Items eines Tests diesselben Eigenschaften erfassen

Homogenität ist Voraussetzung für eine hohe Trennschärfe, aber nicht für einen Test!

Wie kann die Homogenität der Items berrechnet werden?

Durch die Berechnung der Interkorrelation; Mittelwert der Korrelation entspricht der Homogenität

Homogene Items laden auf denselben Faktor vergleichsweise hoch

Welche Punkte sollten bei der Itemselektion berücksichtigt werden?

  1. Perspektiven (Konstrukt, Zumutbarkeit, Effizienz)
  2. Statistische Kriterien (Reliabilität, Validität, Schwierigkeitsindex, Trennschärfe)
  3. Inhaltliche Kriterien

Welche weitergehenden Überlegungen sollten bezüglich der Itemselektion gemacht werden?

  1. Item bei Trennschärfe unter .30 i.d.R eliminieren
  2. bei zu hoher oder niedriger Schwierigkeit ebenfalls eliminieren
  3. Ebenfalls bei einer deutlich niedrigeren Streuung als andere Items
  4. Häufen sich die Items in einem unerwünschten Schwierigkeitsbereich an (z.B. 60 < Pi < 80)?
  5. Powertest: Sind schwierige und leichte Items im gleichen Umfang vorhanden
  6. Sind die Übergänge von Einfach zu Schwierig nicht zu gross?