Cartes mémoires Diagnostik (Seite 2 von 7)

Cartes-fiches	256
Utilisateurs	25
Langue	Deutsch
Catégorie	Psychologie
Niveau	Université
Crée / Actualisé	17.02.2019 / 20.02.2025
Lien de web	https://card2brain.ch/box/20190217_diagnostik
Intégrer	<iframe src="https://card2brain.ch/box/20190217_diagnostik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Eine Itemschwierigkeit von P=99 bedeutet?

Dass das Item von 99% der Probanden richtig beantwortet werden kann.

Dass die Zufallskorrektur vergessen wurde.

Eigentlich 100, aber die Itemschwierigkeit kann faktisch nie 100 werden.

Gibt es nicht. Es ist whsl. Itemschwierigkeit P=0,99 gemeint.

Die Trennschärfe….

Wird auf verschiedene Arten berechnet.

Korreliert hoch mit der Homogenität eines Items.

Ist wenn man die Punkt-biseriale-Korrelation berechnet tendenziell kleiner.

Steht in keinem Zusammenhang mit der Itemschwierigkeit.

Welche Aussage ist richtig?

Je größer der Itemselektionskennwert, desto geeigneter ist das Item unseres Tests.

Die Standardabweichung eines dichotomen Items kann aus der Schwierigkeit geschlossen werden.

Die externale Methode erzeugt besonders homogene Skalen.

Die Itemhomogenität berechnet sich anhand Cronbachs alpha.

Hauptgütekriterien der 2. Datenerhebung

Objektivität

Reliabilität

Validität

Trennschärfe

Schwierigkeit bei der Testkonstruktion

Welche Objektivtätarten gibt es?

Durchführungs-

Auswertungs-

Interpretations-

Bewertungs-

Beobachtungs-

Durchführungsobjektivität

Durchführungsobjektivität durch entsprechende Maßnahmen (z.B. Standardisierung) erzeugen

Quantitative Bestimmung der Durchführungsobjektivität: Man lässt bei der gleichen VP den Test von unterschiedlichen Testleitern durchführen und korreliert die einzelnen Testergebnisse dieser VP.

! Testwiederholungs-Effekten: wenig sinnvoll

je nach Durchführungsperson sollte immer das gleiche Ergenis erzielt werden

Auswertungsobjektivität

Objektmenge

Wertemenge

Objektmenge bedeutet wie sich die Person empirisch verhält.

Wertemenge bedeutet, welche Testwerte letztlich das Verhalten repräsentieren.

Man gibt die beantworteten Testbögen verschiedenen Auswertern. Dann berechnet man die Intraklassen-korrelation zwischen den errechneten Testwerten.

Mit jeder Auswertungsperson sollte immer das gleiche Ergebnis erzielt werden.

Reliabilität

Wert zwischen 0 und 1

Berechnet durch KTT

Verlässlichkeit der Variable

Einen Test, bei dem Ergebnisunterschiede zwischen den Personen zustandekommen durch deren unterschiedliche Truescores, und nicht durch Messfehler.

Rel(Y)= var (��) /var (Y)

„Zu welchem Anteil bestimmt die Truescorevarianz die Testwertvarianz“

Variable 1: „Lass Sigmund unendlich oft den Extraversionstest machen. Mittele die Testwerte. Das ist sein wahre Extraversion. Das ist sein….“

true score

Messfehler

Testwert

Abweichung

wahrer Wert

Variable 2: „Keine Messung ist perfekt. Nimm den wahren Wert und vergleiche ihn mit dem aktuellen Testwert. Die Differenz ist der…“

Truescore

Messfehler

Abweichung

Testwert

Messfehler kann positiv oder negativ sein

Der Testwert setzt sich zusammen aus

Y= τ + ε

Y=τ * ε

P=τ * ε

Y=τ - ε

Warum ist es problematisch die Reliabilität zu berechnen? Welche 1. Annahme wid von der KTT postuliert?

der Messfehler ist unsystematisch

der Messfehler ist immer gleich, bei jeder Messung und jeder VP

E(ε)=0

Es gibt niemals einen Zusammenhang des Messfehlers mit irgendwas

Rel (Y)= var(truescore)/var(Messfehler)

Aus der 1. Annahme resultiert

Ist die Varianz des Messfehlers = 0 wird die Reliabilität 1

Ist die Varianz des Messfehlers = unendlich groß wird die Rel= 0

Ist die Varianz des Messfehlers = 0 wird die Reliabilität 0

Ist die Varianz des Messfehlers = unendlich groß wird die Rel= 1

Welche 2. Annahme wid von der KTT postuliert?

Der Truescore bleibt zeitlich gleich.

t=t1=t2=...

mehrere Messungen werden benötigt

.Außerdem Varianz einer Variable= Kovarianz einer Variable mit sich selbst

In welchem Modell übt tau unterschiedliche Einflüsse auf den Testwert aus?

Modell essentiell-tau-äquivalenter Variablen

Modell Tau-kongenerischer Variablen

Modell Tau-äquivalenter Variablen

Verletzungen von Annahme 1

Messfehler ist systematisch

Reliabilität wird unterschätzt

Reliabilität wird überschätzt

vorher-nachher korreliert

unser Test misst nicht nur...sondern auch...

Verletzungen von Annahme 2

Reliabilität wird unterschätzt

Reliabilität wird überschätzt

z.B. durch schwankende Konstrukte

unsystematische Veränderung von Zeitpunkt 1 zu 2, 3,...

Re-Test Reliabilität

man präsentiert den Test zweimal und korreliert die Ergenisse miteinander

durch besonders kurze Zeitintervalle umgeht man Erinnerungs- und Übungseffekte

die KTT nimmt an, dass der truescore gleich bleibt, bei States ist das nicht der Fall -> kurze Zeitintervalle wählen

das Dilemma, besteht aus der Wahl eines kurzen vs langen Zeitintervalls

Paraleltest

Pobleme?

Die Parallelversion des Tests wird erstellt, sie misst den exakt gleichen Truescore. Beide gibt man den VPs. Anschließend korreliert man beide Testergebnisse. Das ist die Reliabilität.

1) Tests müssen tatsächlich parallel sein (MW und SD gleich)

2) und doch so verschieden, dass keine Übungseffekte etc. auftreten

Ausnahme: Speedtests (Präsentaton direkt hintereinander)

Split Half

Man halbiert den Test, gibt ihn den VP zum bearbeiten und korreliert die Ergebnisse beider Hälften miteinander.

Auswahl der Items für die Hälften:

1) Split-half

2) Odd-Even-Split (Zunächst Nummerierung der Items: ungerade in eine Hälfte, gerade in andere.)

3) Random-Split

4) Itemkennwert-Split (Man sucht 2 Items mit ähnlicher Trennschärfe und Schwierigkeit. Das eine Item kommt in die eine Hälfte, das andere in die Andere)

Probleme Split Half.

Lösung?

Statt der Gesamtzahl an Items, haben wir nur die Hälfte

Reliabilität wird unterschätzt!

Deswegen benötigen wir die Spearman Brown Formel zu Lösung

Rel(Test)= [2*Rel(Y1&2)]/[1+Rel(Y1&2)]

Testverlängerung nach Spearman

Allgemeine Formel

Wofür steht k?

k= Verlängerungsfaktor

Mit wie viel müssen wir die aktuele Itemanzahl verlängern (multiplizieren), um die gewünschte Reliabilität zu erreichen.

Split-Half-Rel-Sonderfall: Interne Konsistenz

Man teilt den Test nicht in zwei Hälften auf sondern in so viele Teile wie es Items gibt.
„Wie sehr messen die Items den gleichen Truescore?“

Interne Konsistenz= Konsistenz der Items

Grundlage ist das einfache Konsistenzmaß, das ist:
Anteil der Summe aller Kovarianzen von allen Items - an der Varianz des Testscores

K-R-Formula 20

Zur Berechnung der internen Konsistenz bei dichotomen Items

m = Anzahl der Items

pq = Varianz der Summe der Items

Cronbach Alpha

für gestufte Items

Kon nahe 1 bedeutet: Hohe Konsistenz und gute Reliabilität

Kon nahe 0 bedeuten: Geringe Rel und hohe Konsistenz

Danke dieser Reliabilitätsschätzer benötige ich keinen zweiten Datensatz

Der Konsistenzwert ist die niedrigstmögliche Reliabilität des Tests

Welche der Formulierungen ist/sind Teil der KTT Modell 1?

Ein Messfehler hängt nie mit einem anderen Messfehler zusammen.

Der tatsächliche Messfehler einer Messung ist immer zwischen -1 und +1.

Ein Truescore verändert sich nicht.

Ein Messfehler kovariert manchmal mit anderen Messfehlern

In der Theorie wird der Testscore nicht vom Messfehler beeinflusst.

Die Reliabilität…?

Wird in Ausnahmefällen größer 1.

Ist der Anteil der Truescore-Varianz an der Testwert-Varianz.

Setzt im Idealfall 2 Messungen voraus.

Kann man nicht schätzen.

Die Spearman-Brown-Formel…?

Berechnet die tatsächliche Reliabilität aus zwei Rel-Schätzungen.

Kommt bei der Paralleltest-Reliabilitätsschätzung zum Einsatz

Wird zum Itemzählen verwendet.

Wird beispielhaft in den Folien von Prof. Hewig berechnet. Und das ist wichtig.

Welche Aussage/n zur internen Konsistenz ist/ sind richtig?

Eine hohe interne Konsistenz ist ein starkes Indiz für eine hohe Reliabilität.

Ist das gleiche wie Konsistenz der Items.

Eine hohe interne Konsistenz geht stets mit homogenen Items einher.

Sie ist der Anteil der Kovarianz der Items an der Varianz des Testscores.

Strukturgleichungsmodell=

Mesmodell

Stukturmodell

Messmodell= manifeste& endogene manifeste Variable

UV = exogene latente Variable

AV = endogene manifeste Variable

Strukturmodell

Endogene latenten Variable

Exogene latenten Variable

Endogene manifeste Variable

Exogene manifeste Variable

Korrelationen zwischen Exogenen und Endogenen Variablen

Messmodelle

Messfehler

Endogene latente Variable

manifeste Variable

3 im Strukturmodell

Unsere Statistiksoftware berechnet kreuzquer, ob die Daten überhaupt in irgendein Modell zu packen sind. Dabei stellt sie alle möglichen zufälligen Modelle auf und überprüft ob die Daten passen könnten. Passt ein generiertes Modell, werden Schritt für Schritt die Modellparameter weiter so vom Programm verändert, dass am Ende ein Modell mit der bestmöglichen Passung resultiert.

Konfirmatorische FA

Explorative FA

iterativ Modell an Daten anpassen

ausgedrückt durch Kreispfeil + usw.

Welche Aussage/n ist/sind richtig?

Ein Messmodell modelliert latente und manifeste Variablen.

Ein Strukturgleichungsmodell modelliert nur die latenten Variablen.

Exogene latente Variablen sollen durch das Modell erklärt werden.

Auf endogene, latente Variablen kann kein Pfeil zeigen.

Auf exogene, latente Variablen kann kein Pfeil zeigen.

Welche Aussage/n ist/sind richtig?

Die Reliabilitätsschätzung wäre durch vorher aufgestellte Annahmen nicht möglich.

Das Modell essentiell-tau-äquivalenter /essentiell-tau-kongenerischer Variablen ist ein Messmodell.

Die Messung ist eine manifeste Variable.

In beiden Modellen zeigen vom Truescore Pfeile weg, aber keine hin.

Der Truescore ist eine latente Variable.

Welche Aussage ist falsch?

Validität gibt Aussage über das Verhalten/Eigenschaft einer Person

Reliabilität gibt Aussage über das Verhalten/Eigenschaft einer Person

Validität misst, wie genau der Test misst

Reliabilität misst, ob der Test misst, was er vorgibt zu messen

Validität misst, ob der Test misst, was er vorgibt zu messen

Validität

nicht ausreichend mit 0-1 zu beschreiben

Inhalts-, Kriteriums-, Konstruktvalidität

Durchführungs-, Auswertungs-, Interpretationsvalidität

ist nicht vielfältig

Kriteriumsvalidität

Kann der Test Verhalten vorhersagen?

Ein Kriterium ist ein bestimmtes Verhalten in der Realität. Das kann quasi alles sein. Es muss nur Sinn machen. Autoren geben begründet an, warum sie Kriterium XYZ gewählt haben.

>Kann der IQ-Test Schulerfolg vorhersagen?

>Kann der Integritätstest Krankheitstage vorhersagen?

>Kann der Depressionstest die Tage in der Klinik vorhersagen?

Streng genommen darf ein Kriterium darf kein Konstrukt wie zB Impulsivität oder Extraversion oder Intelligenz sein. (später: Konstruktvalidität!)

Messung:

- zur gleichen Zeit wie der Test → Übereinstimmungsvalidität (konkurrente Validität)
- nach einem gewissen Zeitraum → Vorhersagevalidität (prädiktive Validität) wichtiger, da Kriterien vorhergesagt werden

Anschließend wird Test mit Kriterium korreliert.

Kriterien

begrenzte Anzahl

Quasikriterium

Echtes Kriterium

Target Place

Ultimative und aktuelle Themen

Echte Kriterien und Quasi Kriterium: Zusammenhänge/ Unterschiede?

Zusammenhang:

Kriterium stimmt mit dem theoretischen Fundament des Tests überein

Unterschied:

>Echtes Kriterium: ist verlässlich und entscheidungsrelevant (hoher Status) > Bsp: „echte“ Gewalttätigkeit als Kriterium für Aggressionstest (Prädiktor)

>Quasi-Kriterium: ist nicht verlässlich und nicht entscheidungsrelevant (niedriger Status) > Bsp. Aggressivitätsfragebogen mit Aggressivitätsfragebogen (Das Buch sagt soetwas ist ein sehr schwacher Validitätsbeleg)

Diagnostik

Créer ou copier des fichiers d'apprentissage

Créer ou copier des fichiers d'apprentissage

Connecte-toi pour voir toutes les cartes.

SWITCHaai

Office 365

Edulog

Apple ID

Google