Bildungspsychologie - Modul AF B Teil 1
Fernuniversität Hagen SS 19
Fernuniversität Hagen SS 19
Set of flashcards Details
Flashcards | 501 |
---|---|
Students | 36 |
Language | Deutsch |
Category | Psychology |
Level | University |
Created / Updated | 21.02.2019 / 13.12.2023 |
Weblink |
https://card2brain.ch/box/20190221_bildungspsychologie_modul_af_b
|
Embed |
<iframe src="https://card2brain.ch/box/20190221_bildungspsychologie_modul_af_b/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
481. Isolierte vs. vergleichende vs. kombinierte Evaluation - die drei Evaluationsparadigmen nach
Hager
Paradigma der isolierten Evaluation:
- Frage nach der grundsätzlichen Wirksamkeit eines Programms steht im Vordergrund
- Beispiel - Wirksamkeitshypothese: "Trainingsmaßnahme A bewirkt bei den beteiligten Personen (Interventionsgruppe) eine Veränderung in Richtung des Ziels A, während diese Veränderung in der Kontrollgruppe nicht beobachtbar ist."
Paradigma der vergleichenden Evaluation:
- Gegenüberstellung mindestens zweier Maßnahmen/Interventionen, welche (mit unterschiedlichen Mitteln) dieselben Ziele verfolgen
- Die zu testenden Hypothesen sind:
- Äquivalenzhypothesen (alle Maßnahmen sind gleich erfolgreich),
- Überlegenheitshypothesen (eine Maßnahme hat größere Effekte auf die Zielvariablen als die andere)
- Nicht-Unterlegenheitshypothesen (eine Maßnahme ist mindestens ebenso wirksam wie eine Alternative)
- Die zu testenden Hypothesen sind:
Paradigma der kombinierten Evaluation:
- Zusammenführung der isolierten und der vergleichenden Evaluation
- Ist notwendig, wenn Programme sich zunächst in einer vergleichenden Evaluation als äquivalent erweisen, man aber nicht wirklich daraus schließen kann, wie groß die Wirksamkeit ist
482. Summative vs. formative Evaluation
Summative Evaluationen (Produktevaluationen) finden nach Fertigstellung eines Produktes bzw.
Beendigung einer Maßnahme bzw. Intervention statt
- Das primäre Ziel besteht darin, Fragen hinsichtlich der Wirksamkeit von Programmen zu beantworten
Formative Evaluationen (Prozessevaluationen) setzen direkt während der Entwicklung oder
Erprobung einer Maßnahme bzw. Intervention ein, können aber auch interventionsbegleitend
sein
- Sie haben die Funktion, die Komponenten eines Programms zu modifizieren bzw. zu optimieren, um die Gesamtwirkung der Maßnahme zu erhöhen
483. Die acht Schritte einer wissenschaftlichen Evaluation
- Entscheidung über die Druchführung einer Evaluation
- Entschiedung über zu untersuchende Bereiche
- Entwicklung von Fragestellungen und Indikatoren
- Konstruktion von Instrumenten
- Durchführung, Aufbereitung, Auswertung und Dokumentation
- Entscheidung über Zugang zu den Ergebnissen
- Interpretation von Ergebnissen
- Ziehen von Konsequenzen
Entstehungszusammenhang: Schritt 1 + 2
- Konzeptualisierungsphase: Schritte 1–3
Begründungszusammenhang: Schritte 3-5
- Implementationsphase: Schritte 4 + 5
Verwertungszusammenhang: Schritte 6-8
- Wirkungsforschungsphase: Schritte 6–8
484. Entstehungszusammenhang von Evaluationen
- Festlegung der zentralen Zieldimensionen, die infolge einer Maßnahme optimiert werden sollen Präzisierung der Zielgruppe
- Festlegung des Ortes und des zu verwendenden Evaluationsmodells
- Festlegung, in welchen Einrichtungen (Institutionen) die Intervention durchgeführt werden soll, welche Personengruppen und welche Bereiche eingebunden werden sollen
- Festlegungen auf eine Evaluationsstrategie: Prozessevaluation oder Produktevaluation oder Kombi
- Berücksichtigung einer oder mehrerer Kontroll- bzw. Vergleichsgruppen – wo immer möglich
- Bzw. Versuch eines fairen Vergleichs: Begibt man sich auf die Ebene der Einzelschule und definiert hier passgenaue Indikatoren der Schul- und Unterrichtsqualität, so werden an die Stelle von Kontrollgruppen Schulen treten, die in vergleichbaren Lagen ähnliche Schüler aufnehmen
485. Zentrale Faktoren der Qualität einer Schule (nach Scheerens & Bosker) - 13 schulische
Faktoren, die als relevant für die Steigerung der Schülerleistungen gelten
- Qualität von Curriculum und Lernumgebungen
- Aktive und positive Beziehungen zwischen der Schule und ihrem Umfeld (z. B. Eltern, Betriebe)
- Effiziente Schulleitung
- Konsens und Zusammenhalt im Kollegium
- Schulklima
- Evaluationsorientierung
- Leistungsorientierung, hohe Lernerwartungen der Lehrkräfte an die Schüler
- Zielstrebige Führung des Unterrichts
- Klassenklima
- Klar strukturierter Unterricht
- Selbstständiges Lernen
- Differenzierung, lernerangepasste Methodik
- Rückmeldung
486. Begründungszusammenhang von Evaluationen
Formulierung von Fragestellungen bzw. Hypothesen, die das Kausalgefüge zwischen Maßnahmen bzw. Interventionen und Kriterien beschreiben:
- Welche Maßnahmen führen zu welchen Effekten aufseiten der Qualitätsindikatoren?
- Wie intensiv müssen sie sein?
- Gibt es Bedingungen, unter denen sie unwirksam werden?
- Wirken mehrere, gleichzeitig implementierte Maßnahmen jede für sich oder kumulativ oder gar kompensatorisch?
Nur bei Verwendung adäquater Untersuchungsdesigns, messgenauer und in der Literatur etablierter Erhebungsverfahren und der Anwendung adäquater Auswertungsmethoden ist die
Validität der in der Evaluation gewonnenen Befunde gegeben
487. Verwertungszusammenhang von Evaluationen
Treffen von Entscheidungen darüber, wer Zugang zu den Ergebnissen haben soll, wie die Befunde zu interpretieren sind und welche Konsequenzen sich daraus für ein Produkt bzw. Programm ergeben
An die Bereitstellung von Evaluationsbefunden wird sich dementsprechend ein Katalog von
Maßnahmen zur Implementation der erwünschten Veränderungen anschließen
488. Was ist laut Hager eine „echte“ Kontrollgruppe?
Kontroll- bzw. Vergleichsgruppen können alternative oder keine Interventionen erhalten
—> nur bei alternativen Interventionen spricht Hager von echten Kontrollgruppen
489. Überprüfung der Wirksamkeit von Interventionen - Vortest-Nachtest- Follow-up-Plan
- In der Interventionsgruppe und in der Kontrollgruppe wird unmittelbar vor der Maßnahme eine Baseline-Erhebung der Zielvariablen durchgeführt, die zweite Messung erfolgt unmittelbar nach Ende der Maßnahme.
- Schließlich wird längere Zeit nach Abschluss der Maßnahme eine dritte Messung durchgeführt um zu überprüfen, ob das Programm nachhaltige Effekte auf die Zielgrößen hat
- Zum Zeitpunkt der Baseline-Erhebung sollten keine Unterschiede zwischen Interventions- und Kontrollgruppen bestehen!
490. Phänomen der Regression zur Mitte
Messfehlerbedingt höhere Ausgangswerte reduzieren die Chance, dass beim Zielkriterium Wachstum beobachtbar ist
nach einem extrem ausgefallenen Messwert die nachfolgende Messung wieder näher am Durchschnitt liegt, falls der Zufall einen Einfluss auf die Messgröße hat
491. Fünf typische Ergebnismuster bei isolierten Evaluationen
- Mittelwertsverlauf bei erfolgloser Intervention
- Mittelwertsverlauf bei einer teilweise erfolgreichen Intervention
- Mittelwertsverlauf bei einer erfolgreichen Intervention mit stabilen Effekten beim Follow-Up
- Mittelwertsverlauf bei einer erfolgreichen Intervention mit zunhemendem Effekt
- Mittelwertsverlauf bei einer erfolgreichen Intervention mit verzögerten Effekt
492. Statistische Signifikanz und Effektstärken in wissenschaftlichen Evaluationen
- Im Hinblick auf die inferenzstatistische Absicherung der Interventionen werden typischerweiseVarianzanalysen mit Messwiederholung und/oder geplante Kontraste durchgeführt
- Im Falle ungleicher Ausgangswerte zwischen Interventions- und Kontrollgruppen werden Kovarianzanalysen angewendet
- Als Prüfgröße wird (in Varianzanalysen) die F-Statistik verwendet, und die Entscheidung für oder gegen H0 erfolgt entsprechend den in der Inferenzstatistik geltenden Konventionen:
- Erreicht der F-Bruch einen Wert, für den unter der Annahme von H0 gilt, dass dieser oder größere Werte nur noch mit einer Wahrscheinlichkeit von unter 5 % (α = 0,05) oder von unter einem Prozent (α = 0,01) auf- treten, so wird H0 verworfen
- Wir vertreten eine Position, wonach zu einer angemessenen Auswertung der Daten sowohl die inferenzstatistische Absicherung als auch die Bestimmung von Effektstärken gehört
- Maße für die Effektstärke, die bei kontinuierlichen Zielvariablen typischerweise berechnet werden, sind die Koeffizienten d und η2
- Der Koeffizient d wird als Differenz zwischen zwei Mittelwerten, geteilt durch die gepoolte Standardabweichung bestimmt
- η2 ist ein deskriptives Maß für die durch die Gruppenzugehörigkeit aufgeklärte Varianz, das dem quadrierten multiplen Regressionskoeffizient R2 entspricht
493. Entscheidungen beim Hypothesentesten
Entscheidung für
H0 H1
Wahr ist
H0 1-a a
H1 ß 1-ß
494. Effektstärkenmaße
\(d = {M_{IG}-M_{KG} \over\sqrt{S^2_{IG}+S^2_{KG} \over 2}}\)\(x = {{QS_{zwischen}} \over QS_{Total}}\)
- MIG Mittelwert in Der Interventionsgruppe
- MKG Mittelwert in der Kontrollgruppe
- S2IG Varianz der Interventionsgruppe
- S2KG Varianz der Kontrollgruppegruppe
- QSzwischen Streuung zwischen der Interventionsgruppe und den Kontrollgruppen
- QSTotal Gesamtsteuung
- η2 ebenso wie R2 stellt nur in sehr großen Stichproben eine unverzerrte Schätzung der Effektstärke auf Populationsebene dar
- In kleinen Stichproben überschätzt η2 die Effektstärke, das hier adäquatere Maß ist die Größe ω2
- Die in Stichproben ermittelte Größe d ist dagegen ein unverzerrter (erwartungstreuer) Schätzer für die Effektstärke auf Populationsebene
495. Konventionen für die Interpretation von Effektstärken
Unbedutender Effekt: d < 0,20...........η2 < 1%
Kleiner Effekt: d < 0,20-0,50...........η2 < 1-5%
Mittlerer Effekt: d < 0,50-0,80...........η2 < 6-14%
Großer Effekt: d > 0,80...........η2 > 15%
496. Kosten-Nutzen-Analyse (Cost-benefit-Analysis)
- Ein anderer Weg, die praktische Bedeutsamkeit einer Intervention zu beleuchten
- Zielt primär nicht auf die Wirksamkeit einer Maßnahme ab (Effektivität), sondern betrachtet den Aufwand einer Intervention in Relation zu den Erträgen (Effizienz)
Hier geht es vor allem auch um die Frage, ob die potenziellen finanziellen Gewinne bzw. später
ausbleibenden Kosten eines Programms höher sind als die für das Programm aufgewendeten
Finanzmittel
- Z.B.: Cost-Benefit-Quotient von ungefähr 1 : 3, d. h. aus jedem pro Kind investierten Dollar resultierten später mehr als drei Dollar
497. Methodische Probleme bei Evaluationen
Reifungs- und Entwicklungseffekte
- Veränderungen, die nicht auf die Interventionen selbst, sondern auf organismische oder umweltbedingte Effekte zurückzuführen sind
- Übungseffekte
Nichtäquivalenz von Vergleichsgruppen
- Wenn keine Randomisierung möglich ist
- In solchen Fällen der Nichtäquivalenz ist es nötig, Ausgangsunterschiede und Störvariablen in der Vortestung mit zu erheben
Stichprobenmortalität
- bzw. Verweigerung der weiteren Teilnahme
Hierarchische Daten
498. Fehlerquellen bei der Nichtäquivalenz von Vergleichsgruppen
Diffusion oder Imitation der Intervention kann auftreten, wenn beispielsweise in einer Kontrollgruppe das Programm bekannt wird und die Mitglieder der Kontrollgruppe sich bemühen, das Treatment zu imitieren.
Ein kompensatorischer Ausgleich der Intervention kann auftreten, wenn Kontrollgruppen große Anstrengungen unternehmen, die fehlenden Interventionen durch andere Fördermaßnahmen auszugleichen
Von einer kompensatorischen Anstrengung innerhalb der Kontrollgruppe spricht man, wenn sich ihre Mitglieder benachteiligt fühlen und sich dann aber in der Posttestung besonders anstrengen
Eine negative Reaktion der Kontrollgruppe liegt vor, wenn ihre Mitglieder aus dem Gefühl der Benachteiligung sich im Posttest nicht anstrengen, sodass es zu einer erheblichen Unterschätzung ihrer Leistungen kommt
499. Mit den durch Stichprobenmortalität fehlenden Werten sind drei statistische Probleme
verbunden:
- ein Verlust an Effizienz, da die Stichprobengröße eingeschränkt ist
- ein erschwerter Umgang mit den Daten, weil die statistischen Standardverfahren vollständige Datenmatrizen erwarten
- die Gefahr verzerrter Parameterschätzungen aufgrund möglicher Unterschiede zwischen den beobachteten und den fehlenden Daten
500. Umgang mit fehlenden Werten
- In der neueren methodischen Literatur besteht Konsens darüber, dass ein fallweiser Ausschluss die Validität der Befunde deutlich senken kann und Verfahren der Mehrfachschätzung fehlender Werte („multiple imputation“) den Schwierigkeiten am besten begegnen und zu vergleichsweise validen Befunden in den statistischen Analysen führen
- Mittlerweile existieren zufriedenstellende Softwarelösungen zur multiplen Imputation:
- NORM
- Mplus
- implementierte Routinen in R
- Üblicherweise werden je nach Menge der fehlenden Werte zwischen 5 und 50 vollständige Datensätze generiert, die anschließend simultan statistisch analysiert werden
- Die aktuellen Versionen vieler Softwarepakete bieten darüber hinaus sog. „Full-informationmaximum-likelihood“-Verfahren (FIML) zur unverzerrten Parameterschätzung bei unvollständigen Daten an
501. Besonderheiten hierarchischer Daten
- In Interventionsprogrammen im Kontext Schule werden häufig nicht Personen, sondern ganze Klassen oder gar Schulen einer Interventions- und einer Kontrollgruppe zugewiesen
- Innerhalb der Klassen und Schulen, die als „Klumpen“ bezeichnet werden, trifft man Schüler an, die sich hinsichtlich verschiedener Merkmale oft sehr ähnlich sind, wohingegen Schüler unterschiedlicher Klassen und Schulen sich oftmals sehr unähnlich sind
- Die Ziehung von Klumpenstichproben hat für die weiteren statistischen Analysen erhebliche Konsequenzen, vor allem bei der Bestimmung von Standardfehlern
- Die übliche Berechnung des Standardfehlers setzt eine Zufallsstichprobe mit voneinander unabhängigen Beobachtungen voraus
- Bei Klumpenstichproben führt die Berechnung des Standardfehlers auf dem üblichen Weg zu einer Unterschätzung
- Das Ausmaß der Unterschätzung von Standardfehlern hängt zum einen von der Klumpengröße in der Stichprobe ab: Steigt diese, so nimmt auch die Unterschätzung zu
- Zum anderen bestimmt die Homogenität der Klumpen die Verschätzung der Standardfehler
- Die Homogenität wird üblicherweise über die Intraklassenkorrelation bestimmt
- Die Intraklassenkorrelation beschreibt das Verhältnis der Varianz zwischen den Klumpen zu der Varianz innerhalb der Klumpen
- Je größer die Intraklassenkorrelation, desto stärker die Verschätzung bei der Bestimmung der Standardfehler
- Die Homogenität wird üblicherweise über die Intraklassenkorrelation bestimmt
- Einen eleganten Weg bei der multivariaten Behandlung von hierarchischen Daten aus Klumpenstichproben stellen mehrebenenanalytische Verfahren dar
- Bei diesen Verfahren wird die hierarchische Struktur der Daten direkt modelliert
- Der HLM-Ansatz löst die aufgezeigten Probleme, indem er die hierarchische Struktur selbst zum Gegenstand der Prüfung macht
- Bei diesen Verfahren wird die hierarchische Struktur der Daten direkt modelliert