Diagnostik

Vorlesungsinhalte WS18/19

Vorlesungsinhalte WS18/19


Fichier Détails

Cartes-fiches 256
Utilisateurs 25
Langue Deutsch
Catégorie Psychologie
Niveau Université
Crée / Actualisé 17.02.2019 / 20.02.2025
Lien de web
https://card2brain.ch/box/20190217_diagnostik
Intégrer
<iframe src="https://card2brain.ch/box/20190217_diagnostik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Eine Itemschwierigkeit von P=99 bedeutet?

 

Die Trennschärfe….
 

Welche Aussage ist richtig?
 

Hauptgütekriterien der 2. Datenerhebung

Welche Objektivtätarten gibt es?

Durchführungsobjektivität

 

Durchführungsobjektivität durch entsprechende Maßnahmen (z.B. Standardisierung) erzeugen

Quantitative Bestimmung der Durchführungsobjektivität: Man lässt bei der gleichen VP den Test von unterschiedlichen Testleitern durchführen und korreliert die einzelnen Testergebnisse dieser VP.

! Testwiederholungs-Effekten: wenig sinnvoll

je nach Durchführungsperson sollte immer das gleiche Ergenis erzielt werden

Auswertungsobjektivität

Objektmenge

Wertemenge

 

Objektmenge bedeutet wie sich die Person empirisch verhält.

Wertemenge bedeutet, welche Testwerte letztlich das Verhalten repräsentieren.

Man gibt die beantworteten Testbögen verschiedenen Auswertern. Dann berechnet man die Intraklassen-korrelation zwischen den errechneten Testwerten.

Mit jeder Auswertungsperson sollte immer das gleiche Ergebnis erzielt werden.

 

Reliabilität

Wert zwischen 0 und 1 

Berechnet durch KTT

Verlässlichkeit der Variable

Einen Test, bei dem Ergebnisunterschiede zwischen den Personen zustandekommen durch deren unterschiedliche Truescores, und nicht durch Messfehler.

Rel(Y)= var (��) /var (Y)

„Zu welchem Anteil bestimmt die Truescorevarianz die Testwertvarianz“

 

Variable 1: „Lass Sigmund unendlich oft den Extraversionstest machen. Mittele die Testwerte. Das ist sein wahre Extraversion. Das ist sein….“

Variable 2: „Keine Messung ist perfekt. Nimm den wahren Wert und vergleiche ihn mit dem aktuellen Testwert. Die Differenz ist der…“

 

Der Testwert setzt sich zusammen aus

Warum ist es problematisch die Reliabilität zu berechnen? Welche 1. Annahme wid von der KTT postuliert?

Aus der 1. Annahme resultiert

Welche 2. Annahme wid von der KTT postuliert?

Der Truescore bleibt zeitlich gleich.

t=t1=t2=...

mehrere Messungen werden benötigt

.Außerdem Varianz einer Variable= Kovarianz einer Variable mit sich selbst

 

 

In welchem Modell übt tau unterschiedliche Einflüsse auf den Testwert aus?

Verletzungen von Annahme 1

Verletzungen von Annahme 2

Re-Test Reliabilität

Paraleltest

Pobleme?

 

Die Parallelversion des Tests wird erstellt, sie misst den exakt gleichen Truescore. Beide gibt man den VPs. Anschließend korreliert man beide Testergebnisse. Das ist die Reliabilität.

1) Tests müssen tatsächlich parallel sein (MW und SD gleich)

2) und doch so verschieden, dass keine Übungseffekte etc. auftreten

Ausnahme: Speedtests (Präsentaton direkt hintereinander)

Split Half

Man halbiert den Test, gibt ihn den VP zum bearbeiten und korreliert die Ergebnisse beider Hälften miteinander.

Auswahl der Items für die Hälften:

1) Split-half

2) Odd-Even-Split (Zunächst Nummerierung der Items: ungerade in eine Hälfte, gerade in andere.)

3) Random-Split

4) Itemkennwert-Split (Man sucht 2 Items mit ähnlicher Trennschärfe und Schwierigkeit. Das eine Item kommt in die eine Hälfte, das andere in die Andere)

 

Probleme Split Half.

Lösung?

Statt der Gesamtzahl an Items, haben wir nur die Hälfte

Reliabilität wird unterschätzt!

Deswegen benötigen wir die Spearman Brown Formel zu Lösung

Rel(Test)= [2*Rel(Y1&2)]/[1+Rel(Y1&2)]

Testverlängerung nach Spearman

Allgemeine Formel

Wofür steht k?

k= Verlängerungsfaktor

Mit wie viel müssen wir die aktuele Itemanzahl verlängern (multiplizieren), um die gewünschte Reliabilität zu erreichen.

 

Split-Half-Rel-Sonderfall: Interne Konsistenz

 

Man teilt den Test nicht in zwei Hälften auf sondern in so viele Teile wie es Items gibt.
„Wie sehr messen die Items den gleichen Truescore?“

Interne Konsistenz= Konsistenz der Items

Grundlage ist das einfache Konsistenzmaß, das ist:
Anteil der Summe aller Kovarianzen von allen Items - an der Varianz des Testscores

K-R-Formula 20
 

Cronbach Alpha

Welche der Formulierungen ist/sind Teil der KTT Modell 1?

 

 

Die Reliabilität…?
 

Die Spearman-Brown-Formel…?
 

Welche Aussage/n zur internen Konsistenz ist/ sind richtig?

Strukturgleichungsmodell=

Strukturmodell

Messmodelle

Unsere Statistiksoftware berechnet kreuzquer, ob die Daten überhaupt in irgendein Modell zu packen sind. Dabei stellt sie alle möglichen zufälligen Modelle auf und überprüft ob die Daten passen könnten. Passt ein generiertes Modell, werden Schritt für Schritt die Modellparameter weiter so vom Programm verändert, dass am Ende ein Modell mit der bestmöglichen Passung resultiert.

Welche Aussage/n ist/sind richtig?
 

Welche Aussage/n ist/sind richtig?
 

Welche Aussage ist falsch?

Validität

Kriteriumsvalidität

 

Kann der Test Verhalten vorhersagen?

Ein Kriterium ist ein bestimmtes Verhalten in der Realität. Das kann quasi alles sein. Es muss nur Sinn machen. Autoren geben begründet an, warum sie Kriterium XYZ gewählt haben.

>Kann der IQ-Test Schulerfolg vorhersagen?

>Kann der Integritätstest Krankheitstage vorhersagen?

>Kann der Depressionstest die Tage in der Klinik vorhersagen?

Streng genommen darf ein Kriterium darf kein Konstrukt wie zB Impulsivität oder Extraversion oder Intelligenz sein. (später: Konstruktvalidität!)

Messung:

- zur gleichen Zeit wie der Test → Übereinstimmungsvalidität (konkurrente Validität)
- nach einem gewissen Zeitraum → Vorhersagevalidität (prädiktive Validität) wichtiger, da Kriterien vorhergesagt werden

Anschließend wird Test mit Kriterium korreliert.

Kriterien

Echte Kriterien und Quasi Kriterium: Zusammenhänge/ Unterschiede?

Zusammenhang:

Kriterium stimmt mit dem theoretischen Fundament des Tests überein

Unterschied:

>Echtes Kriterium: ist verlässlich und entscheidungsrelevant (hoher Status) > Bsp: „echte“ Gewalttätigkeit als Kriterium für Aggressionstest (Prädiktor)

>Quasi-Kriterium: ist nicht verlässlich und nicht  entscheidungsrelevant (niedriger Status) > Bsp. Aggressivitätsfragebogen mit Aggressivitätsfragebogen (Das Buch sagt soetwas ist ein sehr schwacher Validitätsbeleg)