Diagnostik

Vorlesungsinhalte WS18/19

Vorlesungsinhalte WS18/19


Set of flashcards Details

Flashcards 256
Students 25
Language Deutsch
Category Psychology
Level University
Created / Updated 17.02.2019 / 20.02.2025
Weblink
https://card2brain.ch/box/20190217_diagnostik
Embed
<iframe src="https://card2brain.ch/box/20190217_diagnostik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Ist die KTT überholt?  - Item Response Theory

 

die KTT sagt...

...bei einer Testgenauigkeit von Rel=1 wird die Person immer den gleichen Testscore erreichen. Das Ergebnis des Tests wäre determiniert. > Deterministisches Modell

Rasch-Modell für dichotome Antworten

 

Die IRT sagt...

...weder das Ergebnis des Tests, noch die Antwort auf ein Item ist determiniert. Beides tritt nur mit einer gewissen Wahrscheinlichkeit auf. Diese gilt es mithilfe von Modellen zu bestimmen. > Probabilistische Modelle
Das bekannteste probabilistische Modell ist das Rasch-Modell.

 

Item Characteristic Curve

Die Itemschwierigkeit wird bestimmt durch...

Um Personenparameter und Itemparameter zu ermitteln,...

 

Voraussetzung Itemhomogenität

Ausgangspunkt: Die Testitems in einer ganz normalen Stichprobe werden interkorrelieren, denn sie sind stochastisch abhängig auf dem Merkmal Extraversion!
Vorgehen:

1) Man nehme sich zwei Stichproben und deren Werte durch einen bereits existierenden Test. Die Personen innerhalb der Gruppen sollten alle einen gleich hohen Extraversionswert haben. Die Leute in der Gruppe 1 alle einen hohen Wert zB 42. Gruppe 2 einen niedrigen Wert zB 10.

2) Lasse beide Gruppen alle Items unseres neuen Extraversion-Itemsatzes beantworten

3) Wenn alle  gleichen Extraversionswert in einer Gruppe haben, dann wird es keine Varianz geben. Keine Varianz - keine Korrelation. Alle Items unseres Tests, die vorgeben NUR Extraversion zu messen sollten nun nicht mehr korrelieren.

4) Korrelieren sie dennoch, so gibt es einen anderen systematischen Einfluss. SCHLECHT. 

Itemhomogenität berechnen

suffiziente Statistiken - Was ist das?

Eine suffiziente Statistik ist eine Statistik, in der alle relevante Information enthalten ist.

> So ist der Mittelwert aller Personen einer Stichprobe von 100 Leuten ein suffizienter Schätzer für den Erwartungswert der Personen.

> Ein Mittelwert aus Person 1,2,3,4,5 wäre ein Schätzer, aber kein suffizienter Schätzer für die 100-Personen-Stichprobe.

Wir entnehmen die suffizienten Statistiken aus den Randsummen:

>In einer Zeilensumme ist alle Information über eine Person enthalten.

>In einer Spaltensumme ist alle Information über ein Item enthalten.

 

 

Was berechnet die Likelihood Funktion?

Sie berechnet wie wahrscheinlich die Daten (PP und IP) sind unter der Annahme, dass ein gewisses Modell gilt.

 

 

 

Likelihoodfunktion

Bedingte LH-Schätzung:
Wie soll man aber hier den einen Parameter schätzen, ohne den anderen zu wissen?

Was bedeutet das nun, wenn es zulässig ist, statt den einzelnen Antworten eine summierte Randstatistik zu benutzen?

 

Welche Aussage ist wahr?

Informationskurve

Spezifische Objektivität: 

Würde bedeuten, ich kann auch 100 unglaublich schwere Items verwenden und es macht keinen Unterschied!

Technisch Ja – Praktisch Nein.


Der untere Graph ist die Iteminformationsfunktion: Die Informationsausbeute ist am höchsten, wenn Itemschwierigkeit und Personenfähigkeit übereinstimmen. Wenn die Person also eine 50%-Chance hat das Item zu lösen oder nicht.

>Ich erhalte mehr Informationen, wenn ich ein Item wähle, dass der Fähigkeit der Person entspricht bei 50% Lösewahrscheinlichkeit

Adaptives Testen
 

 

Idee:
Die Person bekommt nur Items präsentiert, die ihrer Fähigkeit entsprechen

> Meist nur mithilfe von Computern möglich, die bereits zwischenzeitlich den Personenparameter schätzen und entsprechende Items selektieren

> Notwendige Items um eine hohe Testgesamtinformation zu erreichen verringert sich drastisch 

> Sehr hohe Testökonomie!

Zur Info: Auswertungen nach der KTT erfordern immer einen Testscore und keine Itemscores.

Mehrparametermodelle

2 Parameter Modell

Hier ist aber nun schon wichtig, welche der Items gelöst wurden.

> Randsummen sind nicht mehr suffizient → keine spez. Objektivität

> Sich schneidende ICCs als Indiz für mind. Zwei-Parameter-Modell

 

Welche Aussage zu KTT und IRT ist/sind richtig?
 

Was alles kann ich an einer ICC ablesen?
 

Zwei Stichproben mit unterschiedlicher Merkmalsausprägung nutzt man zur Ermittlung der…?
 

Dichotomes Rasch Modell

Was kann man an einer Grafik, die mehrere Kategorien abdeckt sehen?

Jede Kategorie deckt einen Teil der Dimension ab. In diesem Teil hat sie die höchste Kategoriewahrscheinlichkeit.

Schnittpunkte sind Schwellen

 

Abszissenwert ist Schwellenparameter τ

Schwellen zwischen nicht-benachbarten Kategorien sind nicht relevant

 

Was ist px im dichotomen Raschmodell?

Die Wahrscheinlichkeit in der oberen Kategorie zu landen

Wie wird diese Kategoriewahrscheinlichkeit für dichotome Antwort Formate modelliert

Durch das dichotome Rasch-Modell.

 

Wahrscheinlichkeit über eine Schwelle zu treten

für dichotome Antworten

Anteil der oberen Kategoriewahrscheinlichkeit an der Summenwahrscheinlichkeit der zwei Kategorienachbarn

qx=px/(px-1+px)

bzw.

Wenn die Antwort in der x-ten oder (x-1)ten Kategorie liegt, wie hoch ist die Wahrscheinlichkeit, in der oberen (xten) Kategorie zu landen?

qx=p(xIx-1)

Die Formel im dichotomen Raschmodell

Ordinales Rasch Modell

Partial Credit Modell

Nutzt die Schwellenwahrscheinlichkeiten, um die Kategoriewahrscheinlichkeit zu berechnen! 

aufsummierten Schwellenparameter aller unteren Schwellen, einschließlich der aktuellen

 

Das Partial-Credit-Modell ist ein sehr allgemeines Modell, das fast alle Daten modellieren kann.

➢Die Abstände zwischen den Schwellen innerhalb eines Items  können egal wie groß sein

➢Die Abstände zwischen den Schwellen können bei jedem Item andere sein

Dadurch beschreibt das PCM die Daten meist am besten und erlaubt die beste Parameterbestimmung!

Dennoch ist stets (fächerübergreifend) das Modell das Beste, das möglichst einfach ist und doch vieles erklärt. (Paradebeispiel: Einsteins Relativitätstheorie)

→ Das PCM ist sehr komplex, aber modelliert sehr genau

 

Rating Skalen Modell


Grundgedanke: Bei einer 4-fachen Likert-Rating-Skala interpretieren die Personen die Likert-Stufen bei jedem Item gleich.
> Hier ist der absolute Abstand zwischen den Schwellen ist über jedes Items gleich!
> Aber: Der absolute Abstand zwischen den Schwellen innerhalb der Items muss nicht gleich groß sein!

Die inneritem-Abstände sind über jedes Item gleich

> Natürlich können sich die Items bzw. Kateogiren trotzdem auf der Merkmalsdimension verschieben! 

Äquidistanz-Modell
 

 

Grundgedanke: Die Personen interpretieren die Stufen einer Likert-Skala so, dass immer der gleiche Abstand zwischen den Schwellen liegt.


Aber: Dieser Abstand kann von Item zu Item unterschiedlich groß sein

Der Abstand zwischen den Stufenschwellen ist innerhalb jedes Items jeweils gleich groß

 

Dispersions-Modell
 

 

Kombiniert Ratingskalen-Modell und Äquidistanz-Modell
➢Es wird jeweils der Mittelwert der ersten, zweiten,…. Schwellendistanzen gebildet

➢Jedes Item hat 2 Distanzen, deren Abstand nun mit dem Mittelwert beschrieben werden können

Latent-Class-Modelle
 

 

Hiermit kann man die Daten nach Antwortmustern scannen und entsprechende Klassen erfassen.
➢ zB Personen, die niemals „lehne völlig ab“ ankreuzen

➢ zB Personen, die nur in den Extremen antworten alle Schwellen liegen sehr nah beinander

Was gilt im dichotomen Rasch-Modell?
 

Was bedeuten die einzelnen Variablen im Partial-Credit-Modell?

 

P(X=x) : Wahrscheinlichkeit in der xten von insgesamt X Kategorien zu landen

 

sigma: ist/sind die aufsummierten Schwellenparameter aller unteren Schwellen, einschließlich der aktuellenHier 

sigma0=0

s taff: Hier steht s und kein x, weil der Nennerexp(….)-Term für jede Schwelle gerechnet wird und dann aufsummiert wird. > Bei jeder schwelle ist s ein anderer Wert. 0,1,2,3,…s > x hingegen ist der Wert der betrachteten Schwelle

Arten der Beobachtung
 

Selbstbeobachtung- Introspektion Gefühle, Motive, Ziele,…

vs.

Verhaltensbeobachtung- Fremdbeobachtung: Meist Beobachtung von Verhaltensweisen Aggressives Verhalten, dominantes Verhalten,…

 

Begleiten- immer vorhanden z.B. während einem diagnostischen Interview

vs.

Selbstständig- Zielgerichtete Wahrnehmung auf Konkretes Beobachtung auffälliger Verhaltensweisen von Kleinkindern

Was kann man beobachten?

 

Tatsächlich beobachtbar sind nur simpelste Verhaltensweisen! 

Wie können wir (mehr oder weniger) sicherstellen, dass wir richtig ableiten aus dem, was wir beobachten?
1. Der Diagnostiker begründet nach nachvollziehbaren Regeln seine Interpretation
2. Der Proband wird zusätzlich nach seiner Einschätzung gefragt

 

Was möchten wir beobachten?

 

Was sind Beobachtungseinheiten?

Beobachtungseinheit= Das was beobachten. Dieses kann unterschiedlich festgelegt werden.

Am Beispiel Aggressivität untersuchen

Deduktiv-Theoretischer Zugang


➢ Zunächst informiert man sich über die einzelnen Ansätze und Theorien über Aggressivität und assoziiertes Verhalten

➢ Anschließend wählt man eine (oder mehrere) und definiert anhand dieser die Beobachtungseinheit.

Induktiv-empirischer Zugang


➢ Zunächst sammelt man ein Spektrum an Verhaltensweisen, die relevant sein könnten

➢ Anschließend auf Modell- bzw. Theoriekonformität überprüfen


Diese beiden Ansätze lassen sich sehr gut integrieren!

 

Festlegung von Beobachtungseinheiten
 

1) Beobachtungseinheiten eindeutig abgrenzen

> Einmal durch eine genaue Definition --- besonderes Problem: Sprache

> Andererseits auch durch gekonnte Beobachtung, die eine gute Abgrenzung ermöglicht → Beobachterschulungen und Trainings

2) Natürliche und künstliche Einheiten unterscheiden

> Natürliche Szenen mit natürlichen Anfang, Ende und Ursache

> Künstliche Einheiten im Sinne eines Experiments mit Manipulation etc.

3) Relevante Verhaltensweisen auswählen

> Auch bei höchster Genauigkeit ist es fast unmöglich alle Verhaltensweisen zu registrieren

> Beobachter muss im Einzelfall irrelevante von für die Fragestellung relevanten Verhaltensweisen unterscheiden und aussortieren 

4) Zunächst Beschreiben, anschließend abstrahieren

> um ausschweifende Spontaninterpretation vorzubeugen sollte zunächst nur beschrieben werden.

> Anschließend kann diese Darstellung von unterschiedlichen Personen abstrahiert und interpretiert werden

5) Breite einer Beobachtungseinheit festlegen

> Abstrakte und breite Beobachtungseinheiten wählen? → Konstrukte wie spontane Agg., Impulsive Agg., → könnte zu erhöhtem Interpretationsspielraum führen
> Konkrete und schmale Beobachtungseinheiten wählen? → zB brüllen, beschimpfen, schlagen → könnte zu erschwertem Zusammenfassen führen

6) Disjunkte Beobachtungseinheiten anstreben

> Stichwort Eindimensionalität

> Einheiten sollten nicht überlappen und jede Einheit sollte zusätzliche Info bieten

> Auch mithilfe statistischer Verfahren identifizierbar (Faktorenanalyse)

7) Vollständigkeit anstreben

> In dem letztlichen Beobachtungssystem sollten alle relevanten Verhaltensweisen vollständig vertreten sein