M7 3418 FUH
Differentielle Psychologie, Persönlichkeitspsychologie und Diagnostik - Grundlagen psychologischer Diagnostik
Differentielle Psychologie, Persönlichkeitspsychologie und Diagnostik - Grundlagen psychologischer Diagnostik
Kartei Details
Karten | 120 |
---|---|
Lernende | 10 |
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 26.10.2018 / 15.02.2022 |
Weblink |
https://card2brain.ch/box/20181026_m7_3418_fuh
|
Einbinden |
<iframe src="https://card2brain.ch/box/20181026_m7_3418_fuh/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Kap. 3
Lösung des Lebensaltersproblems, aktuelle Intelligenzbestimmung
- Wechsler, 1939, neukonstruierter Test
- ersetzte den IQ durch einen "Abweichungsquotienten"
- kein richtiger Quotient, sondern ein linear transformierter z-Wert (= ein Standardwert, der das Intelligenzniveau jedes Individuums durch seine Position in der Verteilung einer Referenzgruppe ausdrückt)
- noch heute meistens verwendet
Kap. 3
Gruppenintelligenztests
- Einzelfalldiagnostik nach Binet war recht zeitaufwändig → Suche nach Methoden für Gruppenintelligenztests
- kein brauchbarer Ansatz
- erster brauchbarer & über mehrere Jahrzehnte eingesetzter Test (Group Examination Alpha/Beta) zur Prüfung von Militärangehörigen der USA im 1. WK
Kap. 3
1. Periode (Galton, McKeen Cattell) vs. 2. Periode (Binet): 6 Unterschiede
- Komplexere Aufgaben mit engerer Beziehung zum Merkmal Intelligenz bei Binet
- Erfassung komplexerer Vorgänge ist praktisch brauchbarer als das Messen einfacher Qualitäten von Galton etc.
- Leistung wurde nicht mehr isoliert physikalisch gemessen, sondern sie wird mit Leistungen einer Vergleichsgruppe in Beziehung gesetzt → ein an Normen orientierter Wert (Binet: Intelligenzalter; Stern: IQ; Wechsler: Standardwert)
- Galton: Einzelaufgabe; Binet: Einteilung in viele kleine Aufgaben (Anfänge der Itemanalyse)
- Galton: Intelligenzunterschiede haben biologische Grundlage; Binet: Unterschiede sind eher auf Umwelteinflüsse zurückzuführen
- Galton: Intelligenz = allgemeine kognitive Fähigkeit; Binet: vertrat nicht Galtons Ansicht, aber nahm auch keine speziellen Bereiche kognitiver Fähigkeiten an → keine Differenzierung innerhalb der Aufgaben; die Lösungen eines Probanden wurden gleichgewichtet → Intelligenzalter ist mittlere intellektuelle Leistungsfähigkeit einer Person
Kap. 3
- Diskrepanz Laboruntersuchungen - Realität
- Unterschied Fähigkeits-&Leistungsdiagnostik und Persönlichkeitsdiagnostik i.e.S.
- Diagnostik der 1. Periode war stark labororiertiert
- Problem: die Aspekte des menschl. Verhaltens, die die Gesellschaft am meisten interessierten, waren am schwierigsten zu kontrollieren und wurden deshalb oft nicht weiter erforscht
- Fähigkeits- & Leistungsdiagnostik: erfasst die "maximale Leistung"; die daraus entwickelte Persönlichkeitsdiagnostik i.e.S. will eher das "typische Verhalten" registrieren
Kap. 3
Beginn der Persönlichkeitsdiagnostik
- ca. 25 Jahre nach der Intelligenzdiagnostik
- noch mehr von den Erfordernissen der (psychiatrischen) Praxis geprägt, daher sind die frühen wichtigsten Vertreter alles Ärzte (Charcot, Janet, Kraeplin, Freud, Jung, McDougall)
- verstärkt Gewicht auf die subjektive Erfahrung der Klienten zur Diagnose (viele Probleme entstehen ja erst durch die subj. Sichtweise); klassische Zugangsmittel: Interview und Fragebogen
Kap. 3
Frühe Fragebögen (Galton, Hall)
Psycholexikalischer Ansatz
- erster bekannt gewordene Fragebogen: Galton 1883, Fragebogen zur Prüfung von Vorstellungsbildern
- Vorgehen: Fragen wurden einzeln ausgewertet, dann wurden Schlüsse auf in der Person ablaufende Prozesse gezogen
- Hall: Fragebogen zur Untersuchung von Entwicklungsverläufen bei Jugendlichen (noch nicht speziell zur Erfassung interindividueller Differenzen)
- Galton hatte auch die Idee eines psycholexikalischen Ansatzes zur Bestimmung zentraler Persönlichkeitsdimensionen: zentrale Dimensionen menschl. Verhaltens sind in der natürlichen Sprache gespeichert, daher sollte diese auch systematisch analysiert werden
Kap. 3
Personal Data Sheet (Woodworth)
- gilt als erster ausgearbeiteter Persönlichkeitstest in Fragebogenform (stimmt nicht ganz: 1906-1909 Heymans & Wiersma, 1915 Lankes)
- zur Selektion von geeigneten Soldaten in den USA für den 1. WK (viele waren psychisch dem Kampf nicht gewachsen); Einzelinterviews waren viel zu aufwändig geworden
- Interviews sollten einfach schriftlich stattfinden, mit den standardmäßig gestellten Fragen und ja/nein-Antworten → Itemliste mit 116 Fragen
- viele andere Fragbögen wurden davon abgeleitet, z.B. der bekannteste überhaupt: MMPI
Kap. 3
Projektive Verfahren (Wortassoziationstest, Rorschach-Test)
Wortassoziationstest:
- eingeführt von Jung (1910)
- zur Registrierung emotionaler Reaktionen
- Standardliste mit Wörtern, Proband soll auf jedes Wort spontan das erste Wort erwidern, das ihm einfällt
- Weg zu "Komplexen" einer Person, also zu unbewussten Gedanken
- Zögern, Herzrate, Schwitzen zeigen eine veränderte Reaktion auf einen eigentlch normalen Reiz
Rorschach-Test:
- 1921
- das Verfahren an sich war bereits gut bekannt
- Probanden sollen bei Tintenkleksbildern sagen, was sie erkennen
- Rorschach limitierte die Bilder auf 10 Tafeln und stellte ein formales Auswertungsschema auf und stellte die Deutungen in Beziehung mit Persönlichkeitsmerkmalen
- laut Rorschach selbst kein projektiver sondern ein Wahrnehmungstest
Kap. 4
Übersicht 10 Testgütekriterien
- Objektivität
- Reliabilität
- Validität
- Skalierung
- Normierung (Eichung)
- Testökonomie
- Nützlichkeit
- Zumutbarkeit
- Unverfälschbarkeit
- Fairness
Kap. 4 Objektivität
Definition & 3 Aspekte
Ein Test ist dann objektiv, wenn er dasjenige Merkmal, das er misst, unabhängig von Testleiter, Testauswerter und von der Ergebisinterpretation misst.
- Durchführungsobjektivität
- Auswertungsobjektivität
- Interpretationsobjektivität
Kap. 4 Objektivität
Durchführungsobjektivität
- liegt vor, wenn das Testergebnis nicht davon abhängt, welcher Testleiter den Test durchführt
- Standardisierung: genaue Anweiseungen bzgl. Testmaterial, Zeitbegrenzungen, Instruktionen, Umgang mit Fragen
- Standardisierung ist dann optimal, wenn die Testperson die einzige Variationsquelle ist
- andere Variablen (z.B. Versuchsleitereffekte) beeinflussen die Testleistung unkontrolliert und gefährden die interne Validität → deshalbt möglichst keine Interaktion zwischen Testleiter und Testperson, computerbasierte Testdurchführung ist gut
Kap. 4 Objektivität
Auswertungsobjektivität
- ist gegeben, wenn das Testergebnis nicht von der Person des Testauswerters abhängt
- bei Multiple-Choice-Aufgaben problemlos zu erreichen
- bei offenem Antwortformal lind detaillierte Auswertungsregeln notwendig
- messbar im Grad der Übereinstimmung die von verschiedenen Testauswertern bei der Auswertung einer bestimmten Testleistung erreicht wird
- statistische Kennzahl: z.B. der "Konkordanzkoeffizient W" nach Kendall
Kap. 4 Objektivität
Interpretationsobjektivität
- liegt vor, wenn verschiedene Testanwender bei Testpersonen mit demselben Testwert zu denselben Schlussfolgerungen kommen
- Hilfestellung im Testmanual (Normentabellen) zum Vergleich mit relevanten Bezugsgruppen
Kap. 4 Reliabilität
Definition, Erfassung & 4 Aspekte
Ein Test ist dann reliabel (zuverlässig), wenn er das Merkmal, das er misst, exakt (d.h. ohne Messfehler) misst. Formal ist die R. definiert als der Anteil der wahren Varianz an der Gesamtvarianz der Testwerte. Die wahre Varianz bemisst dabei die Merkmalsstreuung der "wahren" Testwerte, der verbleibende Anteil kommt aufgrund des Messfehlers zustande (="Unreliabilität")
Das Ausmaß wird über den Reliabilitätskoeffizienten erfasst; nimmt Werte zw. 0 und 1 an; 1 = Freisein von Messfehlern, 0 = Ergebnis ausschließlich durch Messfehler zustande gekommen; Koeffizient bei einem gutem Test sollte 0.7 nicht unterschreiten
- Retest-Reliabilität
- Paralleltest-Reliabilität
- Testhalbierungs-Reliabilität
- Innere Konsistenz
Kap. 4 Reliabilität
Retest-Reliabilität
- derselbe Test wurd zu zwei verschiedenen Zeitpunkten vorgelegt
- Reliabilität = Korrelation zwischen den beiden Testergebnissen
- ermittelte Korrelation kann variieren, je nachdem wie viel Zeit zwischen den Tests lag (Übungs- & Erinnerungseffekte, ein veränderndes Persönlichkeitsmerkmal)
- Veränderungen der Testwerte können als "Spezifität" mittels Latent-State-Trait-Modellen identifiziert und berücksichtigt werden
Kap. 4 Reliabilität
Paralleltest-Reliabilität
- "Königsweg" zur Eliminierung/Kontrolle von reliabilitätsverändernden Einflüssen
- Korrelation zwischen den beobachteten Testwerden wird in zwei parallelen Testformen berechnet, die aus inhaltlich möglichst ähnlichen Items bestehen
- 2 Testformen sind parallel, wenn sie trotz identischer Itemstichproben zu gleichen Mittelwerten und Varianzen der Testwerte führen
Kap. 4 Reliabilität
Testhalbierungs-Reliabilität
- wenn Retest und Paralleltest nicht gehen (Testperson kann nicht zweimal kommen, Verzerrung durch Wiederholung zu hoch, nicht genug Items für parallele Tests)
- Test wird in zwei möglichst parallele Testhälften geteilt und die Korrelation der beiden Testhälften wird bestimmt
- Korrekturfaktor sollte berücksichtigt werden, um die verminderte Split-Half-Reliabilität wieder wieder auf die ursprüngliche Testlänge hochzurechnen (z.B. Spearman-Brown-Formel)
Kap. 4 Reliabilität
Innere Konsistenz
- Verallgemeinerung der Testhalbierungsmethode
- Jedes Item eines Tests wird als eigenständiger Testteil betrachtet
- je stärker die Testteile untereinander positiv korrelieren, desto höher ist die interne Konsistenz
Kap. 4 Validität
Definition, Allgemeines & 4 Aspekte
Ein Test gilt dann als valide (gültig), wenn er das Merkmal, das er messen soll, auch wirklich misst und nicht irgendein anderes.
- wichtigstes Gütekriterium (Objektivität & Reliabilität sind nur Voraussetzungen für Validität)
- hohe Validität erlaubt eine Generalisierung des beobachteten Verhaltens auf das zu messende Verhalten in der Realität
- formal: Validität ist Korrelaton der Testwerte mit einem korrespondierenden Verhalten außerhalb der Testsituation
- eine Korrelation reicht nicht aus, daher 4 Aspekte:
- Inhaltsvalidität
- Augenscheinvalidität
- Konstruktvalidität
- Kriteriumsvalidität
Kap. 4 Validität
Inhaltsvalidität
- Unter Inhaltsvalidität versteht man, inwieweit ein Test oder ein Testitem das zu messende Merkmal repräsentativ erfasst
- Annahme eines Repräsentationsschlusses: die Testitems stellen eine repräsentative Stichprobe aus dem Itemuniversum dar, mit dem dem das Merkmal erfasst werden kann
- nicht numerisch, sondern aufgrund logischer & fachlicher Überlegungen angegeben
- am einfachsten zu klären, wenn die Items einen unmittelbaren Ausschnitt aus dem betroffenen Verhaltensbereich darstellen
Kap. 4 Validität
Augenscheinvalidität
- Augenscheinvalidität gibt an, inwieweit der Validitätsanspruch eines Tests vom bloßen Augenschein her einem Laien gerechtfertigt erscheint
- Glaubhaftigkeit, Mitteilbarkeit, Akzeptanz
- Intelligenztests haben hohe Augenscheinvalidität
- aus wissenschaftlicher Perspektive nicht immer zufriedenstellend, da die Validität immer auch empirisch belegt sein muss durch Kennwerte
Kap. 4 Validität
Konstruktvalidität Definition
- bezieht sich auf theoretische Fundierung
- Ein Test weist Konstruktvalidität auf, wenn der Schluss vom Verhalten der Testeperson innerhalb der Testsituation auf zugrunde liegende psychologische Persönlichkeitsmerkmale (Konstrukte/latente Variablen/Traits) aufgezeigt wurde. Die Enge dieser Bezieung wird aufgrund von testtheoretischen Annahmen und Modellen geprüft
- also: misst z.B. ein Intelligenztest wirklich die Ausprägung der latenten Persönlichkeitsvariablen "Intelligenz"?
- 2 Ansätze bei der Beurteilung: Struktursuchendes und strukturprüfendes Vorgehen
Kap. 4 Validität
Konstruktvalidität - struktursuchendes Vorgehen
- deskriptiv
- Explorative Faktorenanalysen zur Gewinnung von Hypos über die Merkmalsstruktur der Testitems
- innerhalb der einzelnen Merkmale geben die Faktorladungen (wie die Trennschärfekoeffizienten einer Itemanalyse) Auskunkft über die Homogenität der Testitems
- die so gewonnenen Merkmalsdimensionen erlauben eine erste deskriptive Einordnung in ein bestehendes theoretisches Gefüge (hilfreich dabei: Bildung eines nomologischen Netzwerkes)
- nomologisches Netzwerk betrachtet theoriekonforme Zusammenhänge zu anderen Tests: Vergleich hinsichtlich (Un)Ähnlichkeit, dabei wird zwischen konvergenter und diskriminanter/divergenter Validität unterschieden
Kap. 4 Validität
Konstruktvalidität - struktursuchendes Vorgehen: Konvergente & diskriminante/divergente Validität
- konvergent: die Übereinstimmung mit Ergebnissen aus Tests für gleiche oder ähnliche Merkmale
- divergent: die Abgrenzung von Tests für andere Merkmale; Nachweis muss ein Vergleich von relativ konstruktnahen Tests sein
Kap. 4 Validität
Konstruktvalidität - strukturprüfendes Vorgehen
- erlaubt inferenzstatistische Schlüsse bzgl. der Konstruktvalidität
- nur auf Basis von Testmodellen mit latenten Variablen möglich, die eine explizite und inferenzstatistisch überprüfbare Beziehung zwischen zuvor genau definierten, latenten Merkmalen und den manifesten Itemvariablen herstellen
- die in exploratorischen Faktorenanalysen gefundene Struktur kann an neuen Datensätzen mit Konfirmatorischen Faktorenanalysen überprüft werden
- die einzelnen Dimensionen können mit Hilfe von IRT-Modellen konfirmatorisch bzgl. der Homogenität der Testitems inferenzstatistisch überprüft werden werden
- eine weitere konfirmatorische Vorgehensweise der Konstruktvalidierung ermöglichen Multitrait-Multimethod-Analysen im Rahmen latenter Strukturgleichungsmodelle. Dabei wird der Zusammenhang zwischen versch. Merkmalen (traits) unter Herauspartialisierung der Methodeneinflüsse strukturprüfend untersucht
Kap. 4 Validität
Kriteriumsvalidität
- bezieht sich auf praktische Anwendbarkeit
- Ein Test weist Kriteriumsvalidität auf, wenn vom Verhalten der Testperson innerhalb der Testsituation erfolgreich auf ein Kriterium (nämlich auf ein Verhalten außerhalb der Testsituation) geschlossen werden kann. Die Enge dieser Beziehung ist das Ausmaß an Kriteriumsvalidität (Korrelationsschluss)
- Bsp. Schulreifetest: Kriteriumsvalidität liegt vor, wenn die Kinder, die im Test leistungsfähig sind, sich auch in der Schule als leistungsfähig erweisen
- Überprüfung erfolgt durch Bestimmung der Korrelation zw. Test- und Kriteriumsvariablen
- Übereinstimmungvalidität: Außenkriterium liegt in der Gegenwart vor (konkurrente Validität)
- Vorhersagevalidität: Außenkriterium liegt erst in der Zukunft vor (prognostische Validität)
Kap. 4
Skalierung
- betrifft die Forderung, dass sich die Relation der Leistungsfähigkeit auch in den Testwerten widerspiegelt
- bezieht sich sowohl auf interindividuelle als auch auf intraindividuelle Differenzen und auch auf Persönlichkeitstests
- Ein Test erfüllt das Gütekriterium der Skalierung, wenn die laut Verrechnungsregel resultierenden Testwerte die empirische Merkmalsrelationen adäquat abbilden
- Umsetzbarkeit hängt vom Skalenniveau ab:
- mindestens Ordinalskalenniveau
- Intervallskalenniveau erlaubt zusätzlich die Beurteilung der Größe der Differenzen
- Rationalskalenniveau ermöglicht Bestimmung der Verhältnisse zwischen Testleistungen
Kap. 4
Normierung (Eichung)
- Unter der Normierung eines Tests versteht man das Erstellen eines Bezugssystems, mit dessen Hilfe die Ergebnisse einer Testperson im Vergleich zu den Merkmalsausprägungen anderer Personen eindeutig eingeordnet und interpretiert werden können
- Prozentrangnormen: Prozentsatz derjengen Personen, die im Test beser bzw. schlechter abschneiden als die Referenzleistung in der Eichstichprobe; Pronzentrang kumuliert die in der Eichstichprobe erzielten prozentualen Häufigkeiten der Testwerte bis einschl. zu dem Testwert der gerade interessierenden Testperson
- Standardnormen: Abstand des individuellen Testwerts vom Mittelwert der Eichstichprobe; andere Normwerte als der z-Wert: IQ-Werte, T-Werte, Centil-Werte, Stanine-Werte, Standardschulnoten
- wichtig bei der Normwertinterpretation: Merkmal muss normalverteilt sein
Kap. 4
Testökonomie
- Ein Test erfüllt das Gütekriterium der Ökonomie, wenn er, gemessen am diagnostischen Erkenntnisgewinn, relativ wenig Ressourcen wie Zeit, Geld oder andere Formen beansprucht
- 2 Faktoren: finanzieller & zeitlicher Aufwand (zeitlich oftmals wichtiger; Vorbereitung, Bearbeitung, Auswertung, Ergebnisrückmeldung)
- Ökonomie ist oft nur im Vergleich mit ähnlichen Tests bestimmbar
- Adaptives Testen: es werden nur diejenigen Aufgaben von der Testperson bearbeitet, die für sie den größten Informationsgewinn mit sich bringen
- Ökonomie kommt erst nach den 3 Hauptgütekritierien!
Kap. 4
Nützlichkeit
- Ein Test ist dann nützlich, wenn für das von ihm gemessene Merkmal praktische Relevanz besteht und die auf seiner Grundlage getroffenen Entscheidungen (Maßnahmen) mehr Nutzen als Schaden erwarten lassen
- praktische Relevanz besteht, wenn der Test 1. ein Merkmal misst, das nützliche Anwendungsmöglichkeiten aufweist (→Kriteriumsvalidität) und 2. wenn dieses Merkmal nicht auch mit einem anderen Test erfasst werden könnte, der die restlichen Gütekriterien mind. genauso gut erfüllt
Kap. 4
Zumutbarkeit
- Ein Test erfüllt das Kriterium der Zumutbarkeit, wenn er absolut und relativ zu dem aus seiner Anwendung resultierenden Nutzen die zu testende Person in zeitlicher, psychischer sowie körperlicher Hinsicht nicht über Gebühr belastet
- betrifft nur die Testpersonen
- Entscheidung ist im konkreten Fall oft schwierig: was ist unter "Nutzen" zu verstehen? Bsp: Einstellungstests Pilot vs. Sekretärin
Kap. 4
Unverfälschbarkeit
- Ein Testverfahren erfüllt das Kriterium der Unverfälschbarkeit, wenn es derart konstruiert ist, dass die zu testende Person durch gezieltes Testverhalten die konkreten Ausprägungen ihrer Testwerte nicht steuern bzw. verzerren kann
- Testpersonen versuchen das Messprinzip zu durchschauen, um sich in gutem Licht darzustellen (Soziale Erwünschtheit)
- Verfälschbarkeit wird begünstigt durch hohe Augenscheinvalidität
- bei Leistungstests unproblematisch
- "Objektive Tests" lassen Testperson über zu messendes Merkmal im Unklaren, gegen Soziale Erwünschtheit
Kap. 4
Fairness
- Ein Test erfüllt das Kriterium der Fairness, wenn die resultierenden Testwerte zu keiner systematischen Benachteiligung bestimmter Personen aufgrund ihrer Zugehörigkeit zu ethnischen, soziokulturellen oder geschlechtsspezifischen Gruppen führen
- Itembias ist zu vermeiden (systematische Benachteiligung durch unterschiedlich schwere Aufgaben für verschiedene Personengruppen)
- Culture-Fair-Tests: sind zur Lösung einer Aufgabe nicht/nicht stark an sprachliche Kompetenz gebunden (ist aber eher ein Ansatz als eine vollkommene Umsetzung)
- Durchführungsfairness: z.B. Rücksicht auf ältere Menschen beim Einsatz von Computern
- Testroutine: unterschiedliche Testerfahrung, Vertrautheit mit Testsituationen
Kap. 4 TBS-TK
TBS-TK – Testbeurteilungssystem des Testkuratoriums der Föderation Deutscher Psychologenvereinigungen (allgemein)
- dient der Qualitätssicherung von Tests
- "Test" wird hier als Oberbegriff verwendet für: Intelligenz- & allgmeine Leistungstests, Persönlichkeitsfragebogen, Objektive Persönlichkeitstests, projektive Verfahren, standardisierte Interviews, Erhebungsverfahren zur Arbeitsplatzanalyse
- Durchführung: 15 Punkte
Kap. 4 TBS-TK
Durchführung Punkt 1 bis 3
- Auswahl des zu rezensierenden Tests erfolgt durch das Testkuratorium (TK)
- TK beauftragt 2 unabhängige Rezensenten
- TK stellt Rezensenten des Test & notwendiges Infomaterial zur Verfügung; sichert ihnen bei confidential tests die Vertraulichkeit z.B. wettbewerbsrechtlicher Infos zu
Kap. 4 TBS-TK
Durchführung Punkt 4 (4.1 bis 4.3)
- Prüfung, ob die Verfahrenshinweise/Testmanual/Testhandbuch alle für die Beurteilung nötigen Infos enthält; sind die Anforderungen der DIN 33430 erfüllt? "Checkliste 1" sollte bereits durch den Testanbieter ausgefüllt sein und dann überprüft werden → prüffähig/nicht prüffähig
- Testkategorisierung nach ZPID- und EFPA-System, formale Merkmale werden für Datenbanken angegeben (wenn möglich bereits durch Testanbieter)
- Eigentliche Beurteilung des Tests; 7 Besprechungs- & Beurteilungskategorien (+ Abschlussbewertung/Empfehlung: frei, max. 2000 Zeichen), für alle eine frei formulierte Bewertung (teilweise mit Formalisierung: erfüllt die Anforderungen voll/weitgehend/teilweise/nicht), max. 1000 Zeichen; auch wenn der Test nicht prüffähig ist, muss er rezensiert werden (zur Begründung der Entscheidung)
Kap. 4 TBS-TK
Durchführung Punkt 4.3 (7 Kategorien)
- Allgemeine Informationen über den Test, Beschreibung des Test und seiner diagnostischen Zielsetzung → frei & formalisiert
- Theoretische Grundlagen als Ausgangspunkt der Testkonstruktion → frei
- Objektivität → frei & formalisiert
- Normierung/Eichung → frei
- Zuverlässigkeit (Reliabilität/Messgenauigkeit) → frei & formalisiert
- Gültigkeit (Validität) → frei & formalisiert
- Weitere Gütekriterien (Störanfälligkeit, Unverfälschbarkeit, Skalierung) → frei
Der 8. Punkt (Abschlussbewertung) ergibt sich nicht automatisch aus 1.-7.; ist an der diagnostischen Zielsetzung zu messen
Kap. 4 TBS-TK
Durchführung Punkte 5 bis 7
5. 4.1-4.3 werden von beiden Rezensenten durchgeführt und die Ergebnisse an das TK geschickt
6. Das TK hebt die Anonymität der Rezensenten auf und bittet beide um eine gemeinsame Fassung
7. Bei Uneinigkeit in einigen Punkten werden beide Positionen dargestellt; bei Bedarf Erweiterung der Maximalzeichenanzahl
Kap. 4 TBS-TK
Durchführung Punkte 8 bis 10
8. TK schickt Rezension an den Testautor; Stellungnahme des Testautors; TK entscheidet, ob aufgrund der Stellungnahme um eine Modifikation durch die Rezensenten zu bitten ist; wenn die Modifikation nicht rechtzeitig erfolgt oder die Stellungnahme nicht berücksichtigt, kann das TK Anpassungen vornehmen
9. Testrezensionen werden in "Report Psychologie" & "Psychologische Rundschau" (& evtl. anderen Zeitschriften) veröffentlicht; Nachdrucke müssen die 4 formalisierten Bewertungen enthalten und dürfen keinen irreführenden Eindruck vom Gesamtbild entstehen lassen
10. Autorennennung: Rezensenten in alphabetischer (oder anders vereinbarter) Reihenfolge; anonym: N.N.
Kap. 4 TBS-TK
Durchführung Punkte 11 bis 15
11. Link zu den unter 4.2 erarbeiteten klassifikatorischen Angaben
12. Die Rezensenten werden am Jahresende in "Report Psychologie" gennant (außer sie wollen anonym bleiben)
13. Das TK evaluiert regelmäßig das dargestellte System; Rezensenten sind explizit zur Mitwirkung an der Verbesserung des Systems aufgefordert
14. Das TK evaluiert regelmäßig die Ergebnisse der Beurteilungen und publiziert diese Erkenntnisse
15. Das TK dokumentiert alle erstellten Rezensionen und gewährleistet Zugriff darauf; bemüht sich um die Verbreitung