ergänzende Fragen Evi
ergänzende Fragen
ergänzende Fragen
Fichier Détails
Cartes-fiches | 94 |
---|---|
Langue | Deutsch |
Catégorie | Psychologie |
Niveau | Université |
Crée / Actualisé | 19.04.2020 / 25.07.2020 |
Lien de web |
https://card2brain.ch/box/20200419_3445_evaluation
|
Intégrer |
<iframe src="https://card2brain.ch/box/20200419_3445_evaluation/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Durchführungsmodi
Unter welchen Bedingungen wird eine Evaluation durchgeführt?
Es werden basierend auf den Durchführungsmodi die folgenden Arten der Evaluationsforschung unterschieden:
Intrinsische vs. extrinische Evaluation
interne ( = EIGENEVALUATION ) vs. externe Evaluation (FREMDEVAL)
summative vs. formative Evaluation
vergleichende vs. nicht-vergleichende Evaluation
Intrinsische (= Bewertung der inneren Struktur einer Maßnahme) vs. extrinische Evaluation (= Analyse der Effekte einer Maßnahme) interne (= Personen, die die Maßnahme umsetzen, führen auch die Evaluation durch) vs. externe Evaluation (= Evaluation wir an
Zeitpunkt der Evaluation
Evaluationsarten können anhand des Zeitpunkts der Evaluation kategorisiert werden. Die Evaluation kann entweder vor Beginn der Maßnahme, während, oder nach Abschluß durchgeführt werden.
Es werden basierend auf den Zeitpunkt die folgenden Arten der Evaluationsforschung unterschieden:
Prognostische Evlauation = vor Maßnahmenbeginn um bestimmte Zustände zu antizpieren, Ziel: zukunftsbezogene Aussagen
Prospektive Evaluation = Schaffung von Rahmenbedingungen, welche die Wirksamkeit einer Maßnahme pos. beeinflussen
Prozessevalaution = begleitende Bewertung einer Maßnahme in der Phase ihrer Durchführung
Ergebnisevaluation = Outputevaluation = Bewertung, was eine Maßnahme letztendlcih gebracht hat
Ausrichtung der Evaluation
Woran soll sich eine Evaluation orientieren? Geht es um eine globale oder eine differenzierte Evaluation?
Es werden basierend auf der Ausrichtung die folgenden Arten der Evaluationsforschung unterschieden:
Makroevaluation
MIkroevaluation
Programmevaluation
Inputevaluation
Complianceevaluation
Outputevaluation
Makroevaluation = Gesamtbewertung eines Eval.gegenstandes
MIkroevaluation = einzelne Aspekte sollen evaluiert werden
Programmevaluation = Aufgabe der Evaluatoren ist die Bereitstellung relevanten Handlungswissens
Inputevaluation = Unter welchen Bedingungen wird eine Maßnahme begonnen? Welche Ressourcen stehen zur Verfügung?
Complianceevaluation = Verhalten der Betroffenen im Kontext der Intervention wird evaluiert
Outputevaluation = Bewertung, was die Maßnahme letztendlich gebracht hat
Evaluationsmodell
Mit dem Begriff Evaluationsmodell will man die Zielrichtung des jeweiligen Ansatzes in den Vordergrund rücken. Welche Zielsetzung steht im Vordergrund? Soll die Evaluation dazu beitragen, einen Praxisbezug oder eine bestehende Theorie zu bewerten? Die nachfolgende Einteilung umschreibt verschiedene Spielarten, die in unterschiedlichen Evaluationsmodellen zum tragen kommen.
Es werden basierend auf dem Evaluationsmodell die folgenden Arten der Evaluationsforschung unterschieden:
Praxisorientierte Evaluation
Entwicklungsorientierte Evaluation
Theorieorientierte Evaluation
Praxisorientierte Evaluation = Bei einer praxisorientierten Evaluation wird ein gegebenes Projekt
danach beurteilt, ob und wie es sich im Praxiseinsatz bewährt und welche konkreten Effekte es hervorgebrachthat
Entwicklungsorientierte Evaluation = Bei der entwicklungsorientierten Evaluation dienen die konkreten Ergebnisse einer bereitsdurchgeführten Evaluationder Verbesserung ähnlicher Maßnahmen in der Zukunft. In diesem Fall wird gewissermaßen ein Lerneffekt für nachfolgende Maßnahmen erzielt
Theorieorientierte Evaluation = Das Ziel einer theorieorientierten Evaluation besteht schließlich darin, die einer Maßnahme zugrunde liegende theoretische Fundierung zu testen bzw. zu optimieren. So könnte man aus der Effektivität unterschiedlicher pharmazeutischer Behandlungen bei Migräne unterschiedliche theoretische Modelle über die Genese von Migräne ableiten und diese auf der Basis erhobener Daten testen
Rahmenbedingungen
Jede konkrete EValuation findet unter bestimmten Rahmenbedingungen finanzieller wie organisatorischer Art sowie in einem bestimmten Kontext statt.
Es werden basierend auf den Rahmenbedingungen die folgenden Arten der Evaluationsforschung unterschieden:
Evaluation im Feld vs. im Labor
Parteiliche vs. objektive Evaluation
Geschlossene vs. offene Evaluation
Vertrauliche vs. öffentliche Evaluation
Evaluation im Feld vs. im Labor
Parteiliche vs. objektive Evaluation: Rolle des Evaluators im Rahmen eines Auftrages, im Sinne eines validen Vorgehens ist eine parteiliche Eval. indiskutabel
Geschlossene vs. offene Evaluation: Konkretheit des Eval.auftrages
Vertrauliche vs. öffentliche Evaluation: wie wird mit den Ergebnissen einer Eval. verfahren?
Arten von Evaluationsforschung
(6) Metaevaluation und Metaanalyse
Es werden die folgenden Arten der Evaluationsforschung unterschieden:
Metaaanalyse bzw. summative Metaevaluation
Programm-Design - Evaluation
Metaaanalyse bzw. summative Metaevaluation = quantitative Analyse aus inhaltlich homogenen Primärstudien
Programm-Design - Evaluation = Überprüfungen zum Zwecke einer verbesserten zukünftigen Durchführunghinsichtlich Planung, Gestaltung, verwendeter Methoden, Zielsetzungen usw.
2.1 Zielsetzungen der Evaluation
Es lassen sich mind. drei Zielsetzungen herauskristallisieren
Zustandsevaluation
Veränderungsevaluation
Wirksamkeitsevaluation
Zustandsevaluation:
Bei der Zustandsevaluation zielt die Evaluationsforschung darauf ab, alle
Eigenschaften oder Attribute zu ermitteln, die den Evaluationsgegenstand –das Forschungsobjekt –definieren und es von anderen Forschungsobjekten unterscheiden bzw. abgrenzen. Wenn der Kultusminister von Sachsen-Anhalt das aktuelle Wissensniveau aller Schüler der 8. Klasse des Landes im Fach Mathematik in Erfahrung bringen will, entspricht dies einer Zustandsevaluation.
Veränderungsevaluation:
Veränderungsevaluation.
Bei der Veränderungsevaluation wird der Zustand eines Forschungs-
objektsineinemraum-zeitlichenProzessanalysiert.DerProzesskannunterschiedlichabgebildet
werden:
--> Diagnosen: Das Forschungsobjekt kann über die Zeit im Rahmen mehrerer Erhebungen hinsichtlich seiner Quantität und/oder Qualität erfasst werden. Hierbei ist der Trend von Interesse, also wie sich das Objekt über die Zeit hinweg entwickelt hat bzw. entwickeln wird.
--> Prognose.
--> Retrognose. aktuelle Situation wird mit einem in der Vergangenheit liegenden Zeitpunkt verglichen
Wirksamkeitsevaluation
2.2 Aufgaben der Evaluationsforschung
Die 11 Stufen des Normativen Modells des Evaluationsprozesses nach Balzer, 2005
1. Evaluationsbedarf
2. Evaluationsauftrag
3. Evaluationsgrundlagen
4. Rahmenbedingungen der Evaluation
5. methodische Projektplanungen
6. Durchführung der Evaluation
7. Datenauswertung
8. Präsentation und Berichtigung
9. Dissementation der Ergebnisse
10. Nutzung der Ergebnisse
11. Bewertung der Evaluation
1. Evaluationsbedarf
2. Evaluationsauftrag
3. Evaluationsgrundlagen
4. Rahmenbedingungen der Evaluation
5. methodische Projektplanungen
6. Durchführung der Evaluation
7. Datenauswertung
8. Präsentation und Berichtigung
9. Dissementation der Ergebnisse
10. Nutzung der Ergebnisse
11. Bewertung der Evaluation
2.2. Vier Gütekriterien der Eval.forschung nach Jäger (1997):
- Komplexität eines Eval.gegenstandes (muss sich in der Theorie und im methodischen Zugang widerspiegeln)
- Gültigkeitsbereich einer Fragestellung
- Objektivierbarkeit mit den Kriterien
- Erkennbarkeit: Gegenstand muss der Erkenntnis zugänglich sein (Gott ist z.B. der Wahrnehmung icht zugägnglich)
- Bestimmbarkeit: welche beobachtbaren Parameter können Auskünfte über den Gegenstand geben
- Dokumentierbarkeit
- Transparenz: Regeln der Eval. müssen nachvollziehbar sein
Ist die interne Validität eine hinreichende Bedingung für die Gewährleistung der externen Valididiät?
NEIN!
Was ist die interne Valididät?
Interne
Va
lidität.
InterneValiditätbedeutet,dassein
hypothesenbasiertesEvaluationsdesigninderLageist,
eineeindeutigeAussageüberdieAnnahmeoderdie
AblehnungderentsprechendenHypothesezuliefern
Was ist die externe Validiät?
Externe
Validität.
Externe Validität bedeutet,dass es
möglich ist, die Ergebnisse der Evaluationsuntersuchung
auf andere Kontexte zug eneralisieren
2.3 Evaluationsstandards
Nach Gollwitzer die Standards aus DeGEval, 2008
1. Nützlichkeitsstandards
2. Durchführubarkeitsstandards
3. Fairnessstandards
4. Genauigkeitsstandards
1. Nützlichkeitsstandards --> an den Infobedürfnissen der Eval.nutzer orientiert
2. Durchführubarkeitsstandards --> Eval ist möglichst realistisch, gut durchdacht, diplomatisch und kostenbewusst
3. Fairnessstandards --> in der Eval wird rechtlich und ethisch korrekt mit allen Beteiligten und Betroffenen umgegangen
4. Genauigkeitsstandards --> für den Evalgegenstand und die Fragestellung werden valide Infos bereitgestellt
2.4 Evaluationsmodelle
Welche Orientierungen oder Ansätze für Evaluationsmodelle werden unterschieden?
Methodische und methodologische Orientierungen
Bewertungsorientierte Ansätze
Nutzungsorientierte Ansätze
Normative Ansätze
Methodische und methodologische Orientierungen:
Prozess,dem eine Evaluation folgen soll:
(1) Formulierung allgemeiner Ziele,
(2) Klassifikation der Ziele,
(3) Beschreibung dieser Ziele durch geeignete Verhaltenskategorien,
(4) Identifikation von Situationen und Bedingungen, in denen das fragliche Verhalten gezeigt
werdenkann,
(5) Auswahl oder Entwicklung von wissenschaftlichen Messmethoden zur Überprüfung der
Wirkungen,
(6) Datengewinnungund
(7) VergleichzwischendenempirischenErgebnissenmitdenzuvordefiniertenZielen
Bewertungsorientierte Ansätze (auch gegnerschaftsorientierte Evaluation oder adversary Evaluation)
Anwalt und Gegenanwalt ringen um die Sache (beste Ziele, wie kann Evaldesign entwickelt werden), Zentrale Bedeutung haben die Begriffe: Bewertungsmaßstäbe (= Voraussetzungen zur Bewertung) und Bewertung von Ergebnissen (Schlussfolgerungen)
Nutzungsorientierte Ansätze: welchen Zwecken dienen welche Arten von Ergebnissen?
vier Ebenen: Reaktionsebene, Ebene des Lernerfolgs, Verhaltensebene, Ebene objektiver Endergenisse
Normative Ansätze: wie soll ein Evaluationsprozess gestaltet werden, wenn das Vorgehen wissenschaftlichen Kriterien genügen soll?
3 - Ziele und Funktionen einer Zustandsevaluation (3 Stück):
Ermittlung des konkreten Interventionsbedarfs,
"
Erfüllung einer gesetzlich vorgeschriebenen Berichtspflicht,
"
Entscheidung über die Weiterführung einer Maßnahme
Ist der IST-Zustand ein Evaluationsgegenstand oder -kriterium?
Nein !!!
Ist-Zustand = zeitliche Spezifikation, die Evaluation soll sich auf einen akutellen Zustand zum Zeitpunkt X beziehen
Was genau sind Modalitäten?
wenn sich Indikatoren in theoretisch und/oder phänomenlogisch sinnvolle Kategorien zusammenfassen lassen.
Bsp.: Ängstlchkeit
emotionale Modalität (affektive Erlebniszustände)
kognitive Modalität (typ. Gedanken bei Konfro mit dem angstauslösenden Reiz)
physiologische Modalität (Merkmale physiologischer Erregung, z.B. Schwitzen, Herzrasen)
verhaltensbezogene Modalität (vor dem angstauslösenden Reiz davonlaufen wollen)
3.1 Diagnostik von IST Zuständen
3.1.3 Gütekriterien einer Operationalisierung
Gefahren für die Konstruktvalidität psychologischer Messungen
- Selbstdarstellungstendenz (soziale Erwünschtheit)
- der Aufforderungscharakter der Befragungssituation
- der Hawthorne-Effekt
- der Rosenthal-Effekt
Selbstdarstellungstendenz (soziale Erwünschtheit) --> an Ehrlichkeit appelieren, darauf hinweisen, dass es keine richtigen und keine falschen Antworten gibt
- der Aufforderungscharakter der Befragungssituation --> Testperson um ehrliche Antwort bitten, Messinstrument objektivierbar und verhaltensnah konstruieren, nicht-reaktive Messmethoden verwenden (z.B. verdeckte Beobachtung), Testperson nach der Untersuchung befragen, welchen Sinn und Zweck sie hinter der Untersuchung vermutet
- der Hawthorne-Effekt --> Messwerte werden dadurch beeinflusst, dass eine Untersuchung stattgefunden hat
- der Rosenthal-Effekt --> = Pygmalioneffekt = durch die Erwartungen des Versuchsleiters werden die untersuchten Personen dadurch beeinflusst, dass ihnen der Versuchsleiter subtile Reize sendet und so in bestimmtes Verhalten seitens der VP untersützt/fördert
3.1 Diagnostik von IST-Zuständen
3.1.3 Gütekriterien einer Operationalsiierung
Unmotivierte (= unabsichtliche) Verzerrungen und Verfälschungen (beim Rosenthal-Effekt oder beim Hawthorne-Effekt ist die die Verzerrungen in irgendeiner Form motiviert, z.B. weil man ein positives Bild von sich zeichnen möchte)
Primacy-Effekt
Recency-Effekt
Halo-Effekt --> Einschätzung einer Person auf einem spezifischen Merkmal (z.B. Höflichkeit) beeinflusst die Einschätzung dieser Person auf weiteren Merkmalen (z.B. Ehrlichkeit, Zuverlässigkeit)
Bestätigungsfehler --> Infos, die eine bereits gefasste Meinung bestätigen, werden stärker gewichtet als Infos, die diese Meinung widerlegen
Assimilationsfehler --> zwei Personen, die einander oberflächlich gesehen ähnlich sind, (z.B. hinsichtlich des Aussehens) werden im Hinblick auf das zu messende Merkmal ähnlich bewertet
Kontrasteffekt --> zwei Personen, die einander unähnlich sind (z.B. sehr verschieden aussehen), werden im Hinblick auf ein Merkmal auch sehr unähnlich bewertet (obwohl die Merkmalsausprägung eigentlich ähnlich ist)
Primacy-Effekt
Recency-Effekt
Halo-Effekt
Bestätigungsfehler
Assimilationsfehler
Kontrasteffekt
2.3 Evaluationsstandards
Welche "Teilstandards" fallen nach DeGeval unter den Durchführbarkeitsstandard
- Angemessene Verfahren
- Diplomatisches Vorgehen
- Effizienz von Evaluation
- Angemessene Verfahren --> praxisverträgliche Verfahren, d.h. angemessenes Verhältnis zw. Beschaffung der benötigten Infos und Belastung der Beteiligten
- Diplomatisches Vorgehen --> Durchführung der E., so dass bei den Beteiligten eine hohe Aktzeptanz hinsichtlich aller Stadien des E.prozesses erreicht wird
- Effizienz von Evaluation --> gutes Verhältnis zwischen Aufwand für und Nutzen von E.
2.3 Evaluationsstandards
Welche "Teilstandards" fallen nach DeGeval unter den Genauigkeitssstandard? --> 9 Teilstandards
- beschreibung des Evaluationsgegenstandes
- Kontextanalyse
- Beschreibung von Zwecken und Vorgehen
- Angabe von Informationsquellen
- Valide und reliable Informationen
- Systematische Fehlerüberprüfung
- Analyse quantitativer und qualitativer Informationen
- Begründete Schlussfolgerung
- Metaevaulation
2.4.3 Nutzungsorientierte Ansätze
Kirckpatrick fordert, dass Ergebnisse auf vier unterschiedlichen Ebenen berückstichtigt werden müssen:
Um welche zwei Ebenen hat Schenkel dieses Modell erweitert?
1) Reaktionsebene (Reaction)
2) Ebene des Lernerfolgs (Learning)
3) Verhaltensebene (Behavior)
4) Ebene der objektiven Endergebnisse (Results)
Ebenen 1) bis 4) sind von Kirckpatrick. Merkwort: R E Le V E
0) Produktebene --> Qualität des Produktes (Wie bewerten z.B. Experten eine Maßnahme)
5) Mehrwertebene (ROI = Return of Investment) --> langfristige Gewinne
2.4.4 Normative Ansätze
Das Maktromodell von Balzer gibt einen groben Rahmen, wie der Evaluationsprozess gestaltet werden soll, wenn er wissenschaftlichen Kriterien genügen soll (Makromodell angeben)
Evaluationsbedarf
Evaluationsauftrag
Evaluationsgrundlagen
Rahmenbedingungen der Evaluation
methodische Projektplanung
Durchführung der Evaluation
Datenauswertung
Präsentation und Berichtlegung
Dissemination der Ergebnisse --> D. = Verbreitung der Ergebnisse
Nutzung der Ergebnisse
Bewertung der Evaluation
3.1.2 Quantitative und Qualitative Methoden
Wobei handelt es sich um einen quantitativen Ansatz
Seite 64 bei Gollwitzer
3.2 Kennwerte zur Beschreibung von Ist-Zuständen
Ansätze der quantitativen Beschreibung von Ist-Zuständen finden auf 3 Ebenen oder basieren auf 3 Grundkonzepten:
Deskriptive Ansätze
- Häufigkeitsaussagen
- Zeitliche Fluktuation --> Anzahl aller HIV-Positiven in Deutschland ist nicht exakt bestimmbar, deshalb werden statistische Kennwerte (z.B. Häufigkeit) in Bezug zu zeitlichen Parametern gesetzt --> = die Anzahl der registrierten HIV-Positiven am 10.3.2017 (auch wenn klar ist, das nicht ALLE Menschen mit HIV zu diesem Zeitpunkt registriert sind (--> Dunkelziffer))
- Umöglichkeit einer Totalerhebung --> Dunkelziffer immer vorhanden
- Hellfeld vs. Dunkelfeld --> Gegensatz zw. offiziell registrierter Anzahl von ... und der vermutlich weitaus höheren Anzahl von..., die aber nicht offiziell registriert wurde (z.B. Vergewaltigungen, Opfer melden Vorfälle nicht immer der Polizei)
Epidemiologischer Ansatz
- Prävalenz
- Lebenszeitprävalenz
- Inzidenz
Inferenzstatistische Ansätze
-Population und Stichprobe
- Probabilistische und nicht-probabilitische Stichproben --> p. = Wahrscheinlichkeit mit der ein Element in eine Stichprobe gezogen wird, ist vorher bekannt
- geschichtete Stichproben --> empfiehlt sich besonders bei kleinen Stichproben, da hier ein Merkmal oft über- oder unterrepräsentiert ist (a-Priori-Stratifizierung ( zuvor wird festgelegt, wieviele Elemente aus jeder Schicht gezogen werden, Ziehung innerhalb der Schicht erfolgt zufällig) & Ex-Post-Stratifizierung (Elemente werden zunächst ohne Berücksichtigung der Schichten gezogen, hinterher wird dann gemäß der Populationsverhältnisse gewichtet)
- Quotenstichprobe (nicht-probabilistisch Variante der geschichteteten Stichprobe) --> Größen der Schichten im Vorfeld festgelegt, Ziehung ist aber nicht vollkommen zufällig, Ziel ist es, Quoten aufzufüllen, jede Person, die die Teilnahme verweigert, wird bei der Quotenstichprobe nicht mitgezählt, Rekrutierung wird so lange fortgesetzt, bis die Quote erfüllt ist
3.3 Vergleichskriteirekn von Ist-Zuständen
2 Ansätze und deren jeweiligen Möglichkeiten
Normative Vergleiche
- Idealnormen
- Kriteriale Normen
- Realnormen
Empirische Vergleiche
- sozialer Vergleich
- temproralter VErgleich
Normative Vergleiche
- Idealnormen (definiertes Ideal)
- Kriteriale Normen (sind auch Idealnormen, da sie ein Kriterium vorgeben, z.B. in Mathearbeit müssen 50% der Punkte für ein ausreichend erreicht werden)
- Realnormen (vorher ermittelte Durchschnittwerte werden zugrunde gelegt und sollten dann erreicht werden, z.B. sind 500 Punkte in einem PISA-Untertest normal, aber nicht unbedingt auch ideal)
Empirische Vergleiche (Vergleich zweier Ist-Zustände)
- sozialer Vergleich (z.B. zwischen zwei Personen oder Gruppen (Arbeitslosenquote in zwei Bundesländern)
- temproralter Vergleich (Zeitlicher Vergleich einer Person zum Zeitpunkt t1 wird mit zeitlich vorgelagertem Zeitpunkt t0 vergleichen) --> Zeitpunkt muss inhaltlich begründet werden
3.4 Kriterien zur Bewertung statistischer Bedeutsamkeit
Einzelfallebene! Was sollte man dazu wissen?
Man braucht aus der Population eine Eichstichprobe.
Vorgehen Standardwerte: Den Einzelwert (x) in einen Standardwert (z-Wert) transformieren. den z-Wert interpretieren d.h. Realnormvergleich (= Beurteilung eines Wertes x im Bergleich mit allen anderen Werten in der Vergleichsstichpobe, da z-Werte unabhängig von Mittelwert und SD der Eichstichprobe interpretierbar sind)
Vorgehen Wahrscheinlichkeit. z-Test durchführen und p berechnen.
Vorgehen Prozentränge/Perzentile: Wenn keine Standardnormalverteilung eines Merkmals gegeben ist (siehe oben bei Standardwerte), dann diese Variante benutzen. Man kann angeben, wie viel % der Fälle einen gleichen oder einen niedrigeren Wert haben.
Gruppenebene! Statistische Tests für Mittelwerte
Welche Vergleiche gibt es und welche Tests eignen sich jeweils dazu
Idealnormvergleiche (1)
Realnormvergleiche (1)
Soziale Vergleich: Mittelwertsunterschiede (2)
Idealnormvergleiche.
z-Test
Realnormvergleiche.
Ein-Gruppen-t-Test
Soziale Vergleich: Mittelwertsunterschiede.
2 Gruppen: t-Test für unabhängige Stichproben
mehrere Gruppen: Varianzanalyse
3.4 Kriterien zur Bewertung statistischer Bedeutsamkeit
Gruppenebene! Statistische Tests für Häufigkeiten, Häufigkeitsverteilung in einer Stichprobe wird über Kategorien hiinweg mit einer vorher definierten oder einer Referenzverteilung verglichen
Welche Vergleiche gibt es und welche Tests eignen sich jeweils dazu
Real- und Idealnormvergleiche (2)
Soziale Vergleiche (1)
Real- und Idealnormvergleiche.
X²-Test
Binominaltest
Soziale Vergleiche.
X²-Test
Auf der Einzelfallebene könnten Veränderungen wie ausgedrückt werden?
d = einfache Differenz
d(st) = standardisierte Differenz
d(k) = klinische Signifikanz (kritische Differenz, RCI)
d = einfache Differenz
d(st) = standardisierte Differenz, d.h. die absolute Differenz d wird an der SD des gemessenen Merkmals zum ersten Messzeitpunkt standardisiert, auf diese Weise wird die Skala der Testwerte berücksichtigt (die Aussage "die Differenz liegt bei + 4 ist unterschiedlich zu bewerten, wenn die Skala von 0 bis 100 liegt oder im Vergleich nur zwischen 0 und 10)
d(k) = klinische Signifikanz (kritische Differenz, RCI = reliable change index) --> dazu werden benötigt: der Populationsmittelwert aller intraindividuellen Differenzen und die SD aller intraindividuellen Differenzen
Ist die Wahrscheinlichkeit für d(k) unter der Nullhypothese klein (überlicherweise kleiner als 5%), so ist die empirisch gefundene intraindividuelle Differenz signifikant größer als Null, d.h. die Veränderung ist statistisch bedeutsam (die Nullhypothese muss abgelehnt werden und die H1 wird angenommen)
Daten verschiedener Personen werden zu zwei Messzeitpunkten durch das Robert-Koch-Institut gemeldet.
Es werden beim zweiten Messzeitpunkt nicht die Daten der gleichenn, sondern von anderen Personen gemeldet (Meldung der HIV-positiv-Diganosen).
Welcher Test wäre angebracht?
X²Test --> aber nur dann,wenn die Daten aller auf HIV getesteten Personen vorlägen, sonst nicht. Liegt nur die Anzahl der positiv getesteten vor, dann kann man einen Veränderungsquotienten berechnen (Differenz zwischen Ausgangsinzidenz und aktueller Inzidenz wid berechnet und dann durch die Ausgangsinzidenz geteilt (d.h. an der Ausgangsinzidenz standardisiert)
Was ist eine indirekte Veränderungsmessung?
Was macht man bei einer direkten Veränderungsmessung?
indirekte Veränderungsmessung: man schließt von einer beobachteten Differenz oder einem beobachteteten Trend indirekt darauf, dass eine Veränderung stattgefunden hat
direkte Veränderungsmessung: Für jede Person wird ein Mittelwert von vorliegenden Fremdbeurteilungen zu einem einzigen Zeitpunkt berechnet. Ist der Mittelwert negativ, dann ist der Schüler weniger aggressiv, ist er positiv, dann ist der Schüler über die Zeit hinweg aggressiver geworden
Was ist ein Response Shift?
Nicht die wahre Merkmalsausprägung hat sich über die Zeit hinweg geändert, sondern die subjektive Repräsentation des Merkmals (und damit auch die Validität des Messinstruments).
Eine Person kann z.B. im Verlauf der Zeit sensibilisierter für eigene Verhaltensweisen werden und gibt möglicherweise bei einer Befragung höhere WErte für aggessive Verhaltensweisen an als bei der gleichen Befragung, die ein Jahr zuvor stattgefunden hat.
Welche Verzerrungen und Verfälschungen können sich auf die Validität einer Messung bei einer indirekten Veränderungsmessung (d.h. bei mehreren Messzeitpunkten) auswirken? (5 Stücke)
- Erinnerungseffekte
- Testübung
- Sensibilisierung für die Fragestellung
- zwischenzeitliches Geschehen (kann Antwortverhalten einer Person beeinflussen)
- Response Shift
Validitätsgefährdende Einflüsse bei direkter Veränderungsmessung (d.h. 1 Messzeitpunkt)
Konfirmationseffekte (Gollwitzer S. 94)
selektive Gewichtung von Infos (Primacy- oder Recencyeffekt)
Assimilations- und Kontrasteffekte: Abweichungen werden systematisch unterschätzt (A) oder überschätzt (K)
Response Shift
Quasi-indirekte Veränderungsmessung: Was ist das? Wie funktioniert sie?
direkte und indirekte Veränderungsmessung werden kombiniert und man lässt eine Person zum Zeitpunkt t2 ihre Merkmalsauspräung zum Zeitpunkt t1 (der also zeitlich davor lag) einschätzen, anschließend berechnet man die Differenz zwischen Zeipunkt t2 und t1 --> verringert die Gefahr eines Response Shift
Was ist der Regressionseffekt oder Regression zur Mitte-Effekt?
Wenn ein Wert zu einem Zeitpunkt t1 weit vom Mittelwert entfernt liegt und zum anderen Zeitpunkt t2 dann wieder weiter am Mittelwert dran liegt
Beispielsweise könnte ein Junge im Verglieich zum MIttel seiner Klasse sehr aggressiv sein. Am Ende des Jahres liegt er sehr nahe am MIttel. DAs bedeutet aber noch nicht, dass der Junge weniger aggressiv geworden ist. (Es könnte ja auch sein, dass die KLasse insgesamt aggressiver geworden ist?)
Wenn tritt der Regressionseffekt unvermeidlich auf?
- Autokorrelation r12 < 1 (ist alleine aber keine hinreichende Bedingung und kommt in der Realität meist so vor (selten gibt es perfekte Korrelationen) und
- beide Messwertreihen haben identsche Varianzen
Wie müsen Autokorrelationen und Varianzen (hoch vs niedrig) ausgeprägt sein, damit eine Regression zur Mitte eigentlich unvermeidbar ist (was sich natürlich auch auf die Reliabilität eines Messinstruments auswirkt, die dann in Bezug auf den Differenzwert gering ist)?
Autokorrelation hoch
Varianzen zwischen zwei Messpunkten sind gleich (z.B. nach einer z-Standardisierung)
5.1 Wirksamkeit und Wirkung
Unterschied von Wirksamkeit und Wirkung?
Wirksamkeit: durch eine Maßnahme versursachte Konsequenzen
Wirkung: angenommene Mechanismen (Prozesse), die zu einem beobachteten Effekt geführt haben
ein Nachweis der Wirksamkeit beschränkt sich also auf die Feststellung, dass eine Maßnahme etwas bewirkt hat, eine
Analyse der Wirkung einer Maßnahme fragt danach, wie eine Maßnahme gewirkt hat