ergänzende Fragen Evi

ergänzende Fragen

ergänzende Fragen

Alexander Wurm

Alexander Wurm

Set of flashcards Details

Flashcards 94
Language Deutsch
Category Psychology
Level University
Created / Updated 19.04.2020 / 25.07.2020
Weblink
https://card2brain.ch/box/20200419_3445_evaluation
Embed
<iframe src="https://card2brain.ch/box/20200419_3445_evaluation/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Durchführungsmodi

Unter welchen Bedingungen wird eine Evaluation durchgeführt? 

Es werden basierend auf den Durchführungsmodi die folgenden Arten der Evaluationsforschung unterschieden: 

 

Intrinsische vs. extrinische Evaluation

interne ( = EIGENEVALUATION ) vs. externe Evaluation (FREMDEVAL)

summative vs. formative Evaluation

vergleichende vs. nicht-vergleichende Evaluation

Intrinsische (= Bewertung der inneren Struktur einer Maßnahme) vs. extrinische Evaluation (= Analyse der Effekte einer Maßnahme) interne (= Personen, die die Maßnahme umsetzen, führen auch die Evaluation durch) vs. externe Evaluation (= Evaluation wir an

Zeitpunkt der Evaluation

Evaluationsarten können anhand des Zeitpunkts der Evaluation kategorisiert werden. Die Evaluation kann entweder vor Beginn der Maßnahme, während, oder nach Abschluß durchgeführt werden.

Es werden basierend auf den Zeitpunkt die folgenden Arten der Evaluationsforschung unterschieden: 

Prognostische Evlauation = vor Maßnahmenbeginn um bestimmte Zustände zu antizpieren, Ziel: zukunftsbezogene Aussagen

Prospektive Evaluation = Schaffung von Rahmenbedingungen, welche die Wirksamkeit einer Maßnahme pos. beeinflussen

Prozessevalaution = begleitende Bewertung einer Maßnahme in der Phase ihrer Durchführung

Ergebnisevaluation = Outputevaluation = Bewertung, was eine Maßnahme letztendlcih gebracht hat

Ausrichtung der Evaluation

Woran soll sich eine Evaluation orientieren? Geht es um eine globale oder eine differenzierte Evaluation?

Es werden basierend auf der Ausrichtung die folgenden Arten der Evaluationsforschung unterschieden: 

Makroevaluation

MIkroevaluation

Programmevaluation

Inputevaluation

Complianceevaluation

Outputevaluation

Makroevaluation = Gesamtbewertung eines Eval.gegenstandes

MIkroevaluation = einzelne Aspekte sollen evaluiert werden

Programmevaluation = Aufgabe der Evaluatoren ist die Bereitstellung relevanten Handlungswissens

Inputevaluation = Unter welchen Bedingungen wird eine Maßnahme begonnen? Welche Ressourcen stehen zur Verfügung?

Complianceevaluation = Verhalten der Betroffenen im Kontext der Intervention wird evaluiert

Outputevaluation = Bewertung, was die Maßnahme letztendlich gebracht hat

Evaluationsmodell

Mit dem Begriff Evaluationsmodell will man die Zielrichtung des jeweiligen Ansatzes in den Vordergrund rücken. Welche Zielsetzung steht im Vordergrund? Soll die Evaluation dazu beitragen,  einen Praxisbezug oder eine bestehende Theorie zu bewerten? Die nachfolgende Einteilung umschreibt verschiedene Spielarten, die in unterschiedlichen Evaluationsmodellen zum tragen kommen. 

Es werden basierend auf dem Evaluationsmodell die folgenden Arten der Evaluationsforschung unterschieden: 

Praxisorientierte Evaluation

Entwicklungsorientierte Evaluation

Theorieorientierte Evaluation

Praxisorientierte Evaluation = Bei einer praxisorientierten Evaluation wird ein gegebenes Projekt

danach beurteilt, ob und wie es sich im Praxiseinsatz bewährt und welche konkreten Effekte es hervorgebrachthat

 

Entwicklungsorientierte Evaluation = Bei der entwicklungsorientierten Evaluation dienen die konkreten Ergebnisse einer bereitsdurchgeführten Evaluationder Verbesserung ähnlicher Maßnahmen in der Zukunft. In diesem Fall wird gewissermaßen ein Lerneffekt für nachfolgende Maßnahmen erzielt

 

Theorieorientierte Evaluation =  Das Ziel einer theorieorientierten Evaluation besteht schließlich darin, die einer Maßnahme zugrunde liegende theoretische Fundierung zu testen bzw. zu optimieren. So könnte man aus der Effektivität unterschiedlicher pharmazeutischer Behandlungen bei Migräne unterschiedliche theoretische Modelle über die Genese von Migräne ableiten und diese auf der Basis erhobener Daten testen

Rahmenbedingungen

Jede konkrete EValuation findet unter bestimmten Rahmenbedingungen finanzieller wie organisatorischer Art sowie in einem bestimmten Kontext statt. 

Es werden basierend auf den Rahmenbedingungen die folgenden Arten der Evaluationsforschung unterschieden: 

Evaluation im Feld vs. im Labor

Parteiliche vs. objektive Evaluation

Geschlossene vs. offene Evaluation

Vertrauliche vs. öffentliche Evaluation

Evaluation im Feld vs. im Labor

Parteiliche vs. objektive Evaluation: Rolle des Evaluators im Rahmen eines Auftrages, im Sinne eines validen Vorgehens ist eine parteiliche Eval. indiskutabel

Geschlossene vs. offene Evaluation: Konkretheit des Eval.auftrages

Vertrauliche vs. öffentliche Evaluation: wie wird mit den Ergebnissen einer Eval. verfahren?

Arten von Evaluationsforschung

(6) Metaevaluation und Metaanalyse

 

Es werden die folgenden Arten der Evaluationsforschung unterschieden: 

Metaaanalyse bzw. summative Metaevaluation

Programm-Design - Evaluation

Metaaanalyse bzw. summative Metaevaluation = quantitative Analyse aus inhaltlich homogenen Primärstudien

Programm-Design - Evaluation = Überprüfungen zum Zwecke einer verbesserten zukünftigen Durchführunghinsichtlich Planung, Gestaltung, verwendeter Methoden, Zielsetzungen usw.

2.1 Zielsetzungen der Evaluation

Es lassen sich mind. drei Zielsetzungen herauskristallisieren

Zustandsevaluation

Veränderungsevaluation

Wirksamkeitsevaluation

Zustandsevaluation:

Bei der Zustandsevaluation zielt die Evaluationsforschung darauf ab, alle

Eigenschaften oder Attribute zu ermitteln, die den Evaluationsgegenstand –das Forschungsobjekt –definieren und es von anderen Forschungsobjekten unterscheiden bzw. abgrenzen. Wenn der Kultusminister von Sachsen-Anhalt das aktuelle Wissensniveau aller Schüler der 8. Klasse des Landes im Fach Mathematik in Erfahrung bringen will, entspricht dies einer Zustandsevaluation.

Veränderungsevaluation:

Veränderungsevaluation.

Bei der Veränderungsevaluation wird der Zustand eines Forschungs-

objektsineinemraum-zeitlichenProzessanalysiert.DerProzesskannunterschiedlichabgebildet

werden:

--> Diagnosen: Das Forschungsobjekt kann über die Zeit im Rahmen mehrerer Erhebungen hinsichtlich seiner Quantität und/oder Qualität erfasst werden. Hierbei ist der Trend von Interesse, also wie sich das Objekt über die Zeit hinweg entwickelt hat bzw. entwickeln wird.

 

--> Prognose.

 

--> Retrognose. aktuelle Situation wird mit einem in der Vergangenheit liegenden Zeitpunkt verglichen

 

Wirksamkeitsevaluation

2.2 Aufgaben der Evaluationsforschung

Die 11 Stufen des Normativen Modells des Evaluationsprozesses nach Balzer, 2005

1. Evaluationsbedarf

2. Evaluationsauftrag

3. Evaluationsgrundlagen

4. Rahmenbedingungen der Evaluation

5. methodische Projektplanungen

6. Durchführung der Evaluation

7. Datenauswertung

8. Präsentation und Berichtigung

9. Dissementation der Ergebnisse

10. Nutzung der Ergebnisse

11. Bewertung der Evaluation

1. Evaluationsbedarf

2. Evaluationsauftrag

3. Evaluationsgrundlagen

4. Rahmenbedingungen der Evaluation

5. methodische Projektplanungen

6. Durchführung der Evaluation

7. Datenauswertung

8. Präsentation und Berichtigung

9. Dissementation der Ergebnisse

10. Nutzung der Ergebnisse

11. Bewertung der Evaluation

2.2. Vier Gütekriterien der Eval.forschung nach Jäger (1997):

  1. Komplexität eines Eval.gegenstandes (muss sich in der Theorie und im methodischen Zugang widerspiegeln)
  2. Gültigkeitsbereich einer Fragestellung
  3. Objektivierbarkeit mit den Kriterien
    1. Erkennbarkeit: Gegenstand muss der Erkenntnis zugänglich sein (Gott ist z.B. der Wahrnehmung icht zugägnglich)
    2. Bestimmbarkeit: welche beobachtbaren Parameter können Auskünfte über den Gegenstand geben
    3. Dokumentierbarkeit
  4. Transparenz: Regeln der Eval. müssen nachvollziehbar sein

Ist die interne Validität eine hinreichende Bedingung für die Gewährleistung der externen Valididiät?

NEIN!

Was ist die interne Valididät?

Interne

Va

lidität.

InterneValiditätbedeutet,dassein

hypothesenbasiertesEvaluationsdesigninderLageist,

eineeindeutigeAussageüberdieAnnahmeoderdie

AblehnungderentsprechendenHypothesezuliefern

Was ist die externe Validiät?

Externe

Validität.

Externe Validität bedeutet,dass es

möglich ist, die Ergebnisse der Evaluationsuntersuchung

auf andere Kontexte zug eneralisieren

2.3 Evaluationsstandards

Nach Gollwitzer die Standards aus DeGEval, 2008

1. Nützlichkeitsstandards

2. Durchführubarkeitsstandards

3. Fairnessstandards

4. Genauigkeitsstandards

1. Nützlichkeitsstandards --> an den Infobedürfnissen der Eval.nutzer orientiert

2. Durchführubarkeitsstandards --> Eval ist möglichst realistisch, gut durchdacht, diplomatisch und kostenbewusst

3. Fairnessstandards --> in der Eval wird rechtlich und ethisch korrekt mit allen Beteiligten und Betroffenen umgegangen

4. Genauigkeitsstandards --> für den Evalgegenstand und die Fragestellung werden valide Infos bereitgestellt

2.4 Evaluationsmodelle

Welche Orientierungen oder Ansätze für Evaluationsmodelle werden unterschieden?

Methodische und methodologische Orientierungen

Bewertungsorientierte Ansätze

Nutzungsorientierte Ansätze

Normative Ansätze

 

Methodische und methodologische Orientierungen:

Prozess,dem eine Evaluation folgen soll:

(1) Formulierung allgemeiner Ziele,

(2) Klassifikation der Ziele,

(3) Beschreibung dieser Ziele durch geeignete Verhaltenskategorien,

(4) Identifikation von Situationen und Bedingungen, in denen das fragliche Verhalten gezeigt

werdenkann,

(5) Auswahl oder Entwicklung von wissenschaftlichen Messmethoden zur Überprüfung der

Wirkungen,

(6) Datengewinnungund

(7) VergleichzwischendenempirischenErgebnissenmitdenzuvordefiniertenZielen

 

Bewertungsorientierte Ansätze (auch gegnerschaftsorientierte Evaluation oder adversary Evaluation)

Anwalt und Gegenanwalt ringen um die Sache (beste Ziele, wie kann Evaldesign entwickelt werden), Zentrale Bedeutung haben die Begriffe: Bewertungsmaßstäbe (= Voraussetzungen zur Bewertung) und Bewertung von Ergebnissen (Schlussfolgerungen)

 

Nutzungsorientierte Ansätze: welchen Zwecken dienen welche Arten von Ergebnissen?

vier Ebenen: Reaktionsebene, Ebene des Lernerfolgs, Verhaltensebene, Ebene objektiver Endergenisse

 

Normative Ansätze: wie soll ein Evaluationsprozess gestaltet werden, wenn das Vorgehen wissenschaftlichen Kriterien genügen soll?

 

3 - Ziele und Funktionen einer Zustandsevaluation (3 Stück):

Ermittlung des konkreten Interventionsbedarfs,

"

Erfüllung einer gesetzlich vorgeschriebenen Berichtspflicht,

"

Entscheidung über die Weiterführung einer Maßnahme

Ist der IST-Zustand ein Evaluationsgegenstand oder -kriterium?

Nein !!!

Ist-Zustand = zeitliche Spezifikation, die Evaluation soll sich auf einen akutellen Zustand zum Zeitpunkt X beziehen

Was genau sind Modalitäten?

wenn sich Indikatoren in theoretisch und/oder phänomenlogisch sinnvolle Kategorien zusammenfassen lassen.

Bsp.: Ängstlchkeit

emotionale Modalität (affektive Erlebniszustände)

kognitive Modalität (typ. Gedanken bei Konfro mit dem angstauslösenden Reiz)

physiologische Modalität (Merkmale physiologischer Erregung, z.B. Schwitzen, Herzrasen)

verhaltensbezogene Modalität (vor dem angstauslösenden Reiz davonlaufen wollen)

3.1 Diagnostik von IST Zuständen 

3.1.3 Gütekriterien einer Operationalisierung

Gefahren für die Konstruktvalidität psychologischer Messungen

 

- Selbstdarstellungstendenz (soziale Erwünschtheit)

- der Aufforderungscharakter der Befragungssituation

- der Hawthorne-Effekt

- der Rosenthal-Effekt

Selbstdarstellungstendenz (soziale Erwünschtheit) --> an Ehrlichkeit appelieren, darauf hinweisen, dass es keine richtigen und keine falschen Antworten gibt

- der Aufforderungscharakter der Befragungssituation --> Testperson um ehrliche Antwort bitten, Messinstrument objektivierbar und verhaltensnah konstruieren, nicht-reaktive Messmethoden verwenden (z.B. verdeckte Beobachtung), Testperson nach der Untersuchung befragen, welchen Sinn und Zweck sie hinter der Untersuchung vermutet

- der Hawthorne-Effekt --> Messwerte werden dadurch beeinflusst, dass eine Untersuchung stattgefunden hat

- der Rosenthal-Effekt --> = Pygmalioneffekt = durch die Erwartungen des Versuchsleiters werden die untersuchten Personen dadurch beeinflusst, dass ihnen der Versuchsleiter subtile Reize sendet und so in bestimmtes Verhalten seitens der VP untersützt/fördert

3.1 Diagnostik von IST-Zuständen

3.1.3 Gütekriterien einer Operationalsiierung

 

Unmotivierte (= unabsichtliche) Verzerrungen und Verfälschungen (beim Rosenthal-Effekt oder beim Hawthorne-Effekt ist die die Verzerrungen in irgendeiner Form motiviert, z.B. weil man ein positives Bild von sich zeichnen möchte)

Primacy-Effekt

Recency-Effekt

Halo-Effekt --> Einschätzung einer Person auf einem spezifischen Merkmal (z.B. Höflichkeit) beeinflusst die Einschätzung dieser Person auf weiteren Merkmalen (z.B. Ehrlichkeit, Zuverlässigkeit)

Bestätigungsfehler --> Infos, die eine bereits gefasste Meinung bestätigen, werden stärker gewichtet als Infos, die diese Meinung widerlegen

Assimilationsfehler --> zwei Personen, die einander oberflächlich gesehen ähnlich sind, (z.B. hinsichtlich des Aussehens) werden im Hinblick auf das zu messende Merkmal ähnlich bewertet

Kontrasteffekt --> zwei Personen, die einander unähnlich sind (z.B. sehr verschieden aussehen), werden im Hinblick auf ein Merkmal auch sehr unähnlich bewertet (obwohl die Merkmalsausprägung eigentlich ähnlich ist)

Primacy-Effekt

Recency-Effekt

Halo-Effekt

Bestätigungsfehler

Assimilationsfehler

Kontrasteffekt

2.3 Evaluationsstandards

Welche "Teilstandards" fallen nach DeGeval unter den Durchführbarkeitsstandard

- Angemessene Verfahren

- Diplomatisches Vorgehen

- Effizienz von Evaluation

- Angemessene Verfahren --> praxisverträgliche Verfahren, d.h. angemessenes Verhältnis zw. Beschaffung der benötigten Infos und Belastung der Beteiligten

- Diplomatisches Vorgehen --> Durchführung der E., so dass bei den Beteiligten eine hohe Aktzeptanz hinsichtlich aller Stadien des E.prozesses erreicht wird

- Effizienz von Evaluation --> gutes Verhältnis zwischen Aufwand für und Nutzen von E.

2.3 Evaluationsstandards

Welche "Teilstandards" fallen nach DeGeval unter den Genauigkeitssstandard? --> 9 Teilstandards

- beschreibung des Evaluationsgegenstandes

- Kontextanalyse

- Beschreibung von Zwecken und Vorgehen

- Angabe von Informationsquellen

- Valide und reliable Informationen

- Systematische Fehlerüberprüfung

- Analyse quantitativer und qualitativer Informationen

- Begründete Schlussfolgerung

- Metaevaulation

2.4.3 Nutzungsorientierte Ansätze

Kirckpatrick fordert, dass Ergebnisse auf vier unterschiedlichen Ebenen berückstichtigt werden müssen:

Um welche zwei Ebenen hat Schenkel dieses Modell erweitert?

1) Reaktionsebene (Reaction)

2) Ebene des Lernerfolgs (Learning)             

3) Verhaltensebene (Behavior)

4) Ebene der objektiven Endergebnisse (Results)

 

Ebenen 1) bis 4) sind von Kirckpatrick. Merkwort: R E Le V E

 

 

0) Produktebene --> Qualität des Produktes (Wie bewerten z.B. Experten eine Maßnahme)
5) Mehrwertebene (ROI = Return of Investment) --> langfristige Gewinne

2.4.4 Normative Ansätze

Das Maktromodell von Balzer gibt einen groben Rahmen, wie der Evaluationsprozess gestaltet werden soll, wenn er wissenschaftlichen Kriterien genügen soll (Makromodell angeben)

Evaluationsbedarf

Evaluationsauftrag

Evaluationsgrundlagen

Rahmenbedingungen der Evaluation

methodische Projektplanung

Durchführung der Evaluation

Datenauswertung

Präsentation und Berichtlegung

Dissemination der Ergebnisse --> D. = Verbreitung der Ergebnisse

Nutzung der Ergebnisse

Bewertung der Evaluation

3.1.2 Quantitative und Qualitative Methoden

Wobei handelt es sich um einen quantitativen Ansatz

Seite 64 bei Gollwitzer

3.2 Kennwerte zur Beschreibung von Ist-Zuständen

Ansätze der quantitativen Beschreibung von Ist-Zuständen finden auf 3 Ebenen oder basieren auf 3 Grundkonzepten:

Deskriptive Ansätze

- Häufigkeitsaussagen

- Zeitliche Fluktuation --> Anzahl aller HIV-Positiven in Deutschland ist nicht exakt bestimmbar, deshalb werden statistische Kennwerte (z.B. Häufigkeit) in Bezug zu zeitlichen Parametern gesetzt --> = die Anzahl der registrierten HIV-Positiven am 10.3.2017 (auch wenn klar ist, das nicht ALLE Menschen mit HIV zu diesem Zeitpunkt registriert sind (--> Dunkelziffer))

- Umöglichkeit einer Totalerhebung --> Dunkelziffer immer vorhanden

- Hellfeld vs. Dunkelfeld --> Gegensatz zw. offiziell registrierter Anzahl von ... und der vermutlich weitaus höheren Anzahl von..., die aber nicht offiziell registriert wurde (z.B. Vergewaltigungen, Opfer melden Vorfälle nicht immer der Polizei)

 

Epidemiologischer Ansatz

- Prävalenz

- Lebenszeitprävalenz

- Inzidenz

 

Inferenzstatistische Ansätze

-Population und Stichprobe

- Probabilistische und nicht-probabilitische Stichproben --> p. = Wahrscheinlichkeit mit der ein Element in eine Stichprobe gezogen wird, ist vorher bekannt

- geschichtete Stichproben --> empfiehlt sich besonders bei kleinen Stichproben, da hier ein Merkmal oft über- oder unterrepräsentiert ist  (a-Priori-Stratifizierung ( zuvor wird festgelegt, wieviele Elemente aus jeder Schicht gezogen werden, Ziehung innerhalb der Schicht erfolgt zufällig) & Ex-Post-Stratifizierung (Elemente werden zunächst ohne Berücksichtigung der Schichten gezogen, hinterher wird dann gemäß der Populationsverhältnisse gewichtet)

- Quotenstichprobe (nicht-probabilistisch Variante der geschichteteten Stichprobe) --> Größen der Schichten im Vorfeld festgelegt, Ziehung ist aber nicht vollkommen zufällig, Ziel ist es, Quoten aufzufüllen, jede Person, die die Teilnahme verweigert, wird bei der Quotenstichprobe nicht mitgezählt, Rekrutierung wird so lange fortgesetzt, bis die Quote erfüllt ist

3.3 Vergleichskriteirekn von Ist-Zuständen

2 Ansätze und deren jeweiligen Möglichkeiten

Normative Vergleiche

- Idealnormen

- Kriteriale Normen

- Realnormen

 

Empirische Vergleiche

- sozialer Vergleich

- temproralter VErgleich 

Normative Vergleiche

- Idealnormen (definiertes Ideal)

- Kriteriale Normen (sind auch Idealnormen, da sie ein Kriterium vorgeben, z.B. in Mathearbeit müssen 50% der Punkte für ein ausreichend erreicht werden)

- Realnormen (vorher ermittelte Durchschnittwerte werden zugrunde gelegt und sollten dann erreicht werden, z.B. sind 500 Punkte in einem PISA-Untertest normal, aber nicht unbedingt auch ideal)

 

Empirische Vergleiche (Vergleich zweier Ist-Zustände)

- sozialer Vergleich (z.B. zwischen zwei Personen oder Gruppen (Arbeitslosenquote in zwei Bundesländern)

- temproralter Vergleich (Zeitlicher Vergleich einer Person zum Zeitpunkt t1 wird mit zeitlich vorgelagertem Zeitpunkt t0 vergleichen) --> Zeitpunkt muss inhaltlich begründet werden

3.4 Kriterien zur Bewertung statistischer Bedeutsamkeit

Einzelfallebene! Was sollte man dazu wissen?

Man braucht aus der Population eine Eichstichprobe. 

Vorgehen Standardwerte: Den Einzelwert (x) in einen Standardwert (z-Wert) transformieren. den z-Wert interpretieren d.h. Realnormvergleich (= Beurteilung eines Wertes x im Bergleich mit allen anderen Werten in der Vergleichsstichpobe, da z-Werte unabhängig von Mittelwert und SD der Eichstichprobe interpretierbar sind)

 

Vorgehen Wahrscheinlichkeit. z-Test durchführen und p berechnen.

Vorgehen Prozentränge/Perzentile: Wenn keine Standardnormalverteilung eines Merkmals gegeben ist (siehe oben bei Standardwerte), dann diese Variante benutzen. Man kann angeben, wie viel % der Fälle einen gleichen oder einen niedrigeren Wert haben.

Gruppenebene! Statistische Tests für Mittelwerte

Welche Vergleiche gibt es und welche Tests eignen sich jeweils dazu

Idealnormvergleiche (1)

 

Realnormvergleiche (1)

 

Soziale Vergleich: Mittelwertsunterschiede (2)

Idealnormvergleiche.

z-Test

Realnormvergleiche.

Ein-Gruppen-t-Test

Soziale Vergleich: Mittelwertsunterschiede.

2 Gruppen: t-Test für unabhängige Stichproben

mehrere Gruppen: Varianzanalyse

3.4 Kriterien zur Bewertung statistischer Bedeutsamkeit

Gruppenebene! Statistische Tests für Häufigkeiten, Häufigkeitsverteilung in einer Stichprobe wird über Kategorien hiinweg mit einer vorher definierten oder einer Referenzverteilung verglichen

Welche Vergleiche gibt es und welche Tests eignen sich jeweils dazu

Real- und Idealnormvergleiche (2)

Soziale Vergleiche (1)

 

Real- und Idealnormvergleiche. 

X²-Test

Binominaltest

Soziale Vergleiche.

X²-Test

Auf der Einzelfallebene könnten Veränderungen wie ausgedrückt werden?

d = einfache Differenz

d(st) = standardisierte Differenz

d(k) = klinische Signifikanz (kritische Differenz, RCI)

d = einfache Differenz

d(st) = standardisierte Differenz, d.h. die absolute Differenz d wird an der SD des gemessenen Merkmals zum ersten Messzeitpunkt standardisiert, auf diese Weise wird die Skala der Testwerte berücksichtigt (die Aussage "die Differenz liegt bei + 4 ist unterschiedlich zu bewerten, wenn die Skala von 0 bis 100 liegt oder im Vergleich nur zwischen 0 und 10)

d(k) = klinische Signifikanz (kritische Differenz, RCI = reliable change index) --> dazu werden benötigt: der Populationsmittelwert aller intraindividuellen Differenzen und die SD aller intraindividuellen Differenzen

Ist die Wahrscheinlichkeit für d(k) unter der Nullhypothese klein (überlicherweise kleiner als 5%), so ist die empirisch gefundene intraindividuelle Differenz signifikant größer als Null, d.h. die Veränderung ist statistisch bedeutsam  (die Nullhypothese muss abgelehnt werden und die H1 wird angenommen)

Daten verschiedener Personen werden zu zwei Messzeitpunkten durch das Robert-Koch-Institut gemeldet. 

Es werden beim zweiten Messzeitpunkt nicht die Daten der gleichenn, sondern von anderen Personen gemeldet (Meldung der HIV-positiv-Diganosen). 

Welcher Test wäre angebracht?

 

X²Test --> aber nur dann,wenn die Daten aller auf HIV getesteten Personen vorlägen, sonst nicht. Liegt nur die Anzahl der positiv getesteten vor, dann kann man einen Veränderungsquotienten berechnen (Differenz zwischen Ausgangsinzidenz und aktueller Inzidenz wid berechnet und dann durch die Ausgangsinzidenz geteilt (d.h. an der Ausgangsinzidenz standardisiert)

Was ist eine indirekte Veränderungsmessung?

 

Was macht man bei einer direkten Veränderungsmessung?

indirekte Veränderungsmessung: man schließt von einer beobachteten Differenz oder einem beobachteteten Trend indirekt darauf, dass eine Veränderung stattgefunden hat

 

direkte Veränderungsmessung: Für jede Person wird ein Mittelwert von vorliegenden Fremdbeurteilungen zu einem einzigen Zeitpunkt berechnet. Ist der Mittelwert negativ, dann ist der Schüler weniger aggressiv, ist er positiv, dann ist der Schüler über die Zeit hinweg aggressiver geworden

Was ist ein Response Shift?

Nicht die wahre Merkmalsausprägung hat sich über die Zeit hinweg geändert, sondern die subjektive Repräsentation des Merkmals (und damit auch die Validität des Messinstruments).

Eine Person kann z.B. im Verlauf der Zeit sensibilisierter für eigene Verhaltensweisen werden und gibt möglicherweise bei einer Befragung höhere WErte für aggessive Verhaltensweisen an als bei der gleichen Befragung, die ein Jahr zuvor stattgefunden hat.

Welche Verzerrungen und Verfälschungen können sich auf die Validität einer Messung bei einer indirekten Veränderungsmessung (d.h. bei mehreren Messzeitpunkten) auswirken? (5 Stücke)

  1. Erinnerungseffekte
  2. Testübung
  3. Sensibilisierung für die Fragestellung
  4. zwischenzeitliches Geschehen (kann Antwortverhalten einer Person beeinflussen)
  5. Response Shift

Validitätsgefährdende Einflüsse bei direkter Veränderungsmessung (d.h. 1 Messzeitpunkt)

 

Konfirmationseffekte (Gollwitzer S. 94)

selektive Gewichtung von Infos (Primacy- oder Recencyeffekt)

Assimilations- und Kontrasteffekte: Abweichungen werden systematisch unterschätzt (A) oder überschätzt (K)

Response Shift

Quasi-indirekte Veränderungsmessung: Was ist das? Wie funktioniert sie?

direkte und indirekte Veränderungsmessung werden kombiniert und man lässt eine Person zum Zeitpunkt t2 ihre Merkmalsauspräung zum Zeitpunkt t1 (der also zeitlich davor lag) einschätzen, anschließend berechnet man die Differenz zwischen Zeipunkt t2 und t1 --> verringert die Gefahr eines Response Shift

Was ist der Regressionseffekt oder Regression zur Mitte-Effekt?

Wenn ein Wert zu einem Zeitpunkt t1 weit vom Mittelwert entfernt liegt und zum anderen Zeitpunkt t2 dann wieder weiter am Mittelwert dran liegt

Beispielsweise könnte ein Junge im Verglieich zum MIttel seiner Klasse sehr aggressiv sein. Am Ende des Jahres liegt er sehr nahe am MIttel. DAs bedeutet aber noch nicht, dass der Junge weniger aggressiv geworden ist. (Es könnte ja auch sein, dass die KLasse insgesamt aggressiver geworden ist?)

Wenn tritt der Regressionseffekt unvermeidlich auf?

  • Autokorrelation r12 < 1 (ist alleine aber keine hinreichende Bedingung und kommt in der Realität meist so vor (selten gibt es perfekte Korrelationen) und
  • beide Messwertreihen haben identsche Varianzen 

Wie müsen Autokorrelationen und Varianzen (hoch vs niedrig) ausgeprägt sein, damit eine Regression zur Mitte eigentlich unvermeidbar ist (was sich natürlich auch auf die Reliabilität eines Messinstruments auswirkt, die dann in Bezug auf den Differenzwert gering ist)?

Autokorrelation hoch

Varianzen zwischen zwei Messpunkten sind gleich (z.B. nach einer z-Standardisierung)

5.1 Wirksamkeit und Wirkung

Unterschied von Wirksamkeit und Wirkung?

Wirksamkeit: durch eine Maßnahme versursachte Konsequenzen

Wirkung: angenommene Mechanismen (Prozesse), die zu einem beobachteten Effekt geführt haben

 

ein Nachweis der Wirksamkeit beschränkt sich also auf die Feststellung, dass eine Maßnahme etwas bewirkt hat, eine

Analyse der Wirkung einer Maßnahme fragt danach, wie eine Maßnahme gewirkt hat