PTFuMdKP
7686
7686
Set of flashcards Details
Flashcards | 261 |
---|---|
Language | Deutsch |
Category | Religion/Ethics |
Level | University |
Created / Updated | 25.03.2016 / 19.06.2016 |
Weblink |
https://card2brain.ch/box/ptfumdkp
|
Embed |
<iframe src="https://card2brain.ch/box/ptfumdkp/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Beurteilung der Wirksamkeit (6)
- Klinisch signifikante Veränderung
- Prozentsatz an gebesserten Patienten
- Effektstärken: deskriptives Mass, wie stark sich Patienten gebessert haben
- Breite der Veränderung (Wirkungsspektrum)
- Dauerhaftigkeit der Veränderung (Katamnese)
- Oft vergessen! Ausmass an negativen Effekten: auch verschlechterungen müssen berichtet werden. Normalerweise sind es 15%
Unterschied zwischen Mediatoren und Moderatoren?
Mediatoren ERKLÄREN den Zusammenhang zwischen zwei Variablen -> Mediator = indirekter Effekt
Moderatoren VERÄNDERN den Zusammenhang zwischen zwei Variablen
Testung der Mediatorwirkung
Die Stärke der Assoziation zwischen A und C wird reduziert, wenn die Assoziation zwischen A und B und B und C statistisch kontrolliert wird. Berechnung z.B. Regressionsanalysen
Moderatoren:
Beispiel: Die Variable « Talent, Gene » beinflusst bzw. verändert den Zusammenhang
oder aus der Therapieforschung: Anzahl depressiver Episoden (vor Therapie) verändert den Zusammenhang zwischen Therapiebeziehung und Outcome (0-2 Episoden: r=0.52; 3-X Episoden: r=0.02)
oder ein weiteres Beispiel: « Negative soziale Kontakte » (z.B. Streit mit Freunden) ist bei Studenten mit mehr « Trinken zu Hause » verbunden, aber nur bei solchen, die sagen, dass Sie zur Bewältigung trinken.
Mediatoren / Moderatoren: Scheinbeziehung
Zwei Variablen hängen nur deshalb zusammen, weil beide Variablen von einer dritten Variablen beeinflusst werden.
Supression: Zwei Variablen hängen zu Beginn nicht zusammen, und durch die Zunahme einer dritten Variable kommt ein Zusammenhang zustand. z.B. Geschlecht und Zivilstand hängen nicht zusammen - nimmt man jedoch SES dazu, dann sieht man einen Zusammenhang, dass Junge, schlechter gebildete Frauen eher verheiratet sind als ältere, bessergebildete Männer. => Nicht wichtig in Psychotherapieforschung
Was versteht man unter Strukturqualität?
Strukturqualität: Rahmenbedingungen: Ausbildung und Qualifikation der Psychotherapeuten, Ausstattung der Praxis
Was versteht man unter Prozessqualität?
Prozessqualität: Sachgerechte Durchführung der Psychotherapie. Qualität der Psychotherapie.
Z.B. Welche diagnostischen und therapeutischen Massnahmen werden durchgeführt, und erfolgt die Durchführung lege artis?
Was versteht man unter Struktur, Prozess und Ergebnisqualität?
Ergebnisqualität: Bezieht sich auf die Resultate der Psychotherapie.
Bezieht sich auf den Therapieerfolg
Massnahmen um Strukturqualität zu verbessern?
z.B. Fortbildung und Qualifikation der Psychotherapeuten sichergestellt? Ist die Einrichtung angemessen ausgestattet? Ist die Einrichtung vernetzt und wird mit anderen Einrichtungen kooperiert?
Massnahmen um Prozessqualität zu verbessern?
z.B. Supervision und Intervision der Therapeuten sichergestellt? Bestehen klinisch-psychologische Leitlinien, nach denen sich Therapeuten richten können? Werden die Therapien « gut » dokumentiert? Werden Prozessmessungen durchgeführt (Erhebungen während den Therapien?
Massnahmen um Ergebnisqualität zu verbessern?
Wird die Ergebnisqualität der Therapien auf verschiedenen Ebenen erhoben?
Verschiedene Formen der Erfolgsmessung? (2)
- Verschiedene Datenquellen (Selbst- / Fremdeinschätzung)
- Verschiedene Datenebenen bzw. Funktions- bzw. Konstruktbereiche
Verschiedene Formen der Erfolgsmessung: Verschiedene Datenquellen (3)
Üblich sind
- Selbsteinschätzung: Patienteneinschätzung (z.B. IIP-64 (Inventar Interpersoneller Probleme)
- Fremdeinschätzung: Therapeuteneinschätzung, « soziale » Bezugspersonen, unabhängige Beobachter (z.B. Fremdeinschätzung Bezugsperson: IMI (Impact Message Inventory)
Auf unterschiedlichen Perspektiven zeigt sich, dass sich leicht unterschiedliche Werte zeigen. d.h. Verschiedene Selbsteinschätzungsverfahren korrelieren untereinander - verschiedene Fremdeinschätzungsverfahren ebenfall. Aber miteinander können sich unterschiedliche Resultate zeigen
Formen der Erfolgsmessung: Verschiedene Datenebenen bzw. Funktions- bzw. Konstruktbereiche (6)
- Üblich sind:
- Störungsübergreifende Masse (sehr breit) -> z.B. Symptom-Check-Liste-90
- Störungsspezifische Masse -> z.B. Beck Depression Inventar
- Soziale Funktionsfähigkeit, Wohlbefinden und Lebensqualität -> z.B. Inventar interpersoneller Probleme, Fragebogen zur Erfassung der Lebensqualität
- Teils theorie- bzw. schulspezifische Masse: z.B. Veränderung kognitiver Überzeugungen (kogn. Therapie), Inkongruenzfragebogen (Bern)
- Biologische Masse
Phasenmodell psychotherapeutischer Veränderungen? (1 + 3 + 1)
Howard et al. (1993) unterscheiden drei unterschiedliche Phasen in der Veränderung von Psychotherapiepatienten, in denen jeweils unterschiedliche Problemdimensionen im Fokus stehen.
- Remoralisierungsphase: Gemäss dem Modell verändert sich das subjektive Wohlbefinden zunächst relativ schnell (z.B. durch positive Erwartungen und Hoffnungen). Jedoch keine Veränderung der Symptome
- Remediationsphase: In der zweiten Phase verringern sich die Symptome, auf die die Intervention abzielt. Symptome + subjektives Wohlbefinden
- Rehabilitationsphase: Wiederherstellung des allgemeinen Funktionsniveaus z.B. in Bezug auf interpersonale Verhaltensweisen. Eine Veränderung des allgemeinen Funktionsniveaus dauert nach dem Phasenmodell am „längsten“. Interpersonale Beziehungen und allg. Funktionsniveau wird verbessert
Wichtig: für unterschiedliche Phasen sollten unterschiedliche Messinstrumente verwendet werden: es nützt nichts, wenn man in der Rehabilitationsphase das subjektive Wohlbefinden misst
Was bedeutet das Phasenmodell für die Messung von Psychotherapieerfolg? (1 + 3 + 1)
Es sollten verschiedene Messmittel verwendet werden, die auch die verschiedenen Phasen abbilden und auf denen auch eine unterschiedlich „schnelle“ Veränderung erwartet werden kann.
- Remoralisierungsphase: Masse des subjektiven Wohlbefindens (z.B. Fragebogen zum Wohlbefinden; WHO-5)
- Remediationsphase: Messmittel, die die Symptomausprägung messen (z.B. Symptom Checkliste SCL-90-R).
- Rehabilitationsphase: Messmittel, die das allgemeine Funktionsniveau und interpersonale Verhaltensweisen abbilden (z.B. Inventar Interpersoneller Probleme IIP)
Es liegen inzwischen zahlreiche Belege für das Phasenmodell vor (z.B. Barkham et al., 1996)
Formen der Erfolgsmessung: Verschiedene Verfahren
Üblich sind:
- Fragebogen -> Ergebnis meist dimensional = z.B. mehr oder weniger Symptome
Meist Fragebogen zur Selbsteinschätzung - Interview (Strukturiert klinisches Interview SKID nach DSMIV) -> Ergebnis kategorial -> Diagnose noch erfüllt oder nicht
Oft gefordert, aber weniger üblich:
- Verhaltenstests -> Verhaltens- und Erlebensbeobachtung in konkreten Situationen
- Bsp. Verhaltenstest zur Messung der Ausprägung einer Schlangen- und einer Sozialphobie:
Schlangenphobie: Wie nah holt man die Schlange an sich ran (auf einer Schiene, die man selbst regulieren kann, wie es einen passt)
Sozialphobie: Pat. einen Vortrag machen lassen. Anschliessend Publikum befragen inkl. Rater im Publikum
Direkte Veränderungsmessung
Messung nur zu Therapie-Ende (Post-Messung) = Rückblickende Befragung, ob sich etwas verändert hat im verhältnis vor der Therapie
Beispielitems: Im Vergleich zum Zeitpunkt direkt vor der Therapie.....
• ...bin ich mit mir zufriedener
• ...kann ich mit den Schwierigkeiten des alltäglichen Lebens besser umgehen
• ...fühle ich mich weniger niedergeschlagen
• ...habe ich jetzt mehr Selbstvertrauen
Individualisierte Erfolgsmessung: Beispiel Zielerreichungsskala (GAS) (3)
GAS (Goal Attainment Scaling; Kirusek & Sherman, 1968):
- Das GAS stellt sowohl eine therapeutische Intervention als auch ein individualisiertes Evaluationsinstrument dar
- Mit Hilfe des GAS werden Therapieziele operationalisiert, die individuell zwischen Psychotherapeuten und Patienten vereinbart werden.
- Im GAS werden auf einer Skala (hier 6-stufig) für die drei wichtigsten Problembereiche der aktuelle Zustand (Ist-Zustand), sowie der erwünschte Zielzustand (Soll-Zustand) und Zwischenziele definiert
GAS (Goal Attainment Scaling): Die wichtigsten Grundsätze beim GAS (4)
- Die Zielvorstellungen sollten positiv formuliert sein. Keine Zielformulierung wie: "Ich habe Problem XY nicht mehr“. Besser z.B. "ich traue mir wieder zu, alleine Gleichaltrige anzusprechen").
- Die Zielvorstellungen sollten konkret bzw. operationalisierbar sein. Es sind möglichst viele konkrete Merkmale (z.B. wie oft, in wessen Gegenwart etc.) zu nennen, an denen erkannt werden kann, ob sich das Problem verändert hat.
- Die Zielvorstellungen sollten realistisch sein. Keine Zielformulierung wie: "mir soll's nie mehr schlecht gehen“.
- Die Zielvorstellungen sollten Schritte beinhalten, die Eigenveränderungen ermöglichen bzw. auf das eigene Handeln bezogen sind. Keine Zielformulierung wie: "Meine Freundin ist netter zu mir" (beinhaltet die Veränderung von anderen). Dies sollte auch bei der Formulierung des Ausgangszustandes beachtet werden. Formulierungen sollten auf das eigene Handeln bezogen sein: Nicht "die Welt ist schlecht", sondern: "ich grüble ständig daran herum, warum die Welt so schlecht ist".
Effektstärken (7 + 1)
- Nicht nur statistische Signifikanz für Bedeutsamkeit eines Ergebnisses ausschlaggebend
- Grösse und Richtung eines Effektes (z.B. Mittelwertsunterschied, Zusammenhang) inhaltlich relevant
- APA empfiehlt das berichten von Effektstärken zusätzlich zu den Ergebnissen statistischer Tests
- In der klinischen Forschung sind Effektgrössen/- stärken wichtig (die Frage ist nicht nur, ob eine Behandlung wirkt, sondern auch wie gut sie wirkt)
- Unstandardisierte Effektgrössen: z.B. raw change scores (prä-post-Veränderung in Rohwerten: z.B. 5 Punkte auf dem BDI)
- Effektstärken = standardisierte Effektgrössen
- Häufig verwendete standardisierte Effektstärkenmasse: Cohen‘s d, Produkt-Moment- Korrelation r, Eta2 (Mass der Varianzaufklärung)
Bei grossen Stichproben findet man immer einen signifikanten Wert.
Alles wird statistisch signifikant, wenn genügend viele (100'000) Vpn mitmachten
Effektstärkenberechnung (Cohen‘s d) (3 + 1)
- Prä-Post im Einzelfall: ES = Postwert-Präwert / Standardabw.*
- Prä-Post auf Gruppenebene: ES = Mittelwert Post - Mittelwert Prä / Standardabw.*
- Gruppenvergleiche: ES = M Treatmentgr. - M Kontrollgr. / Standardabw.*
*Standardabweichung aller Patienten z.B. zum Präzeitpunkt/in Kontrollgruppe oder « gepoolte » Standardabweichung (Prä und Post / Kontroll- und Treatment-Gruppe)
Effektstärke Psychotherapie: ES = 0.85 (Smith et al., 1980)
Effektstärkenberechnung (Cohen‘s d):
- kleine Effektstärken
- mittlere Effektstärken
- grosse Effektstärken
ES 0.2 = kleine Effektstärken
ES 0.5 = mittlere Effektstärken
ES 0.8 = grosse Effektstärken
Vorteile der Effektstärkenberechnung (2 + 2)
- Vergleichbarkeit der Resultate über verschiedene Messmittel/Interventionen hinweg
- Erlaubt die Einschätzung der praktischen Bedeutsamkeit einer Veränderung relativ unabhängig der Stichprobengrösse
- Signifikante Effekte können bei einer grossen Stichprobe klein sein
- Nicht signifikante Effekte können bei einer kleinen Stichprobe gross sein
Probleme mit Effektstärkenberechnung (3)
- Unterschiedliche Definitionen, durch welche Varianz/Streuung dividiert werden soll (kann Grösse der Effekte stark beeinflussen; z.B. ist die Varianz zum Prä-Zeitpunkt meist geringer als zum Post-Zeitpunkt = Varianzvergrösserungsphänomen)
- Grössere Effekte bei homogenen Stichproben (weil geringere Varianz = Effektstärken können « künstlich » erhöht werden)
Typisch bei RCTs: Es wird künstlich geschaut, dass die Stichprobe möglicht homogen ist (mit geringer Variabz) = Man hat grössere Chancen um signifikante Effekte zu finden - Gleiche Wertung von unterschiedlich wichtigen und unterschiedlich veränderungssensitiven Messmitteln: Mit unterschiedlichen Messmittel, werden unterschiedlich gut Wirkungen aufgezeigt.
Es gibt Messmittel, da gibt es schnell eine Veränderung und andere, da gibt es kaum eine (Pharma macht dies zu ihrem Vorteil)
Möglichkeit dies zu Verändern: Messbatterien, die voraussagen, welche Messmittel für was eingesetzt werden soll. Diese Diskussion läfut jedoch (seit Schultes Artikel) ohne ein Ergebnis gefunden zu haben.
Power und Poweranalysen: Power eines statistischen Tests?
- Definition Power
- Alpha-Fehlerrisiko
- Beta-Fehlerrisiko
- Definition Power: Die Wahrscheinlichkeit, mit der ein Test in der Lage ist, eine richtige H1 auch zu entdecken.
- Alpha-Fehlerrisiko: H0 zurückweisen, obwohl sie korrekt wäre
- Beta-Fehlerrisiko: H1 zurückweisen, obwohl sie korrekt wäre
1- β = Power: Wenn das β -Fehlerrisiko angibt, mit welcher Wahrscheinlichkeit eine richtige H1 abgelehnt wird, muss 1- β als eine hierzu komplementäre Wahrscheinlichkeit bedeuten, mit welcher Wahrscheinlichkeit eine richtige H1 angenommen wird. Diese Wahrscheinlichkeit wird Power (Teststärke) genannt.
Weshalb sind Power-Überlegungen so wichtig? (3)
- Wenn ein Test/eine Studie mit grosser Wahrscheinlichkeit gar nicht in der Lage ist, mögliche Unterschiede oder Zusammenhänge zu finden, macht die Studie eigentlich auch keinen Sinn!
- Wenn sowieso nicht mit großen Effekten zu rechnen ist, hat diese Studie eigentlich gar keinen Sinn gemacht. Schon vorher war klar, dass keine Unterschiede gefunden werden können.
- Wichtig ist deshalb, sich schon während der Versuchsplanung Überlegungen zur Power machen!
Von welchen Faktoren hängt die Power ab? (3)
- Effektstärken: Je grösser der Effekt, desto grösser die Power d.h. desto grösser ist die Wahrscheinlichkeit, dass auch ein Unterschied erkannt wird
- Stichprobengrösse: Je grösser die Stichprobe, desto grösser die Power (Kleine Stichprobe = grosses Konfidenzintervall = kleine Power)
- Alpha-Niveau: Je grösser das Alpha-Fehlerrisiko, desto grösser die Power (normalerweise wird das Alpha-Niveau auf 5% festgelegt und nicht verändert)
Elemente statistischer Entscheidungen (4 +1)
- Alpha (α): Der Fehler die Nullhypothese zurückzuweisen, wenn sie korrekt ist.
- Effekt: Mittelwertsunterschiede oder Zusammenhänge
- N (Stichprobengrösse): Anzahl der Erhebungseinheiten einer Studie (z.B. Personen).
- Beta (β) oder Power (1- β): Der Fehler zweiter Art (Beta- Fehler) ist der Fehler, die Nullhypothese zu akzeptieren, obwohl die Alternativhypothese richtig ist. Power: Die Wahrscheinlichkeit, mit der ein Test in der Lage ist, eine richtige H1 auch zu entdecken.
Diese 4 Bestimmungsstücke hängen funktional miteinander zusammen -> wenn 3 der 4 bestimmt sind, dann ist auch das 4. klar: dies macht man sich zu nutze, wenn man eine Poweranalyse macht
Poweranalysen: A priori Poweranalysen
Poweranalysen sollten während der Versuchsplanung bzw. vor der Durchführung des Versuchs (a priori) berechnet werden
Hier stellt sich die Frage nach dem nötigen bzw. optimalen Stichprobenumfang
Poweranalyse im SPSS = Beobachtete Schärfe
Poweranalysen: A priori Poweranalysen: Bedingungen für die Berechnung:
Für die Berechnung muss...
- ... das Alpha-Niveau (meist 0.05)
- ... die Power (in der Regel 0.8; Cohen, 1965)
- ... und die Grösse des zu erwartenden Effektes (Hinweise liefern vergleichbare Studien oder Definitionen z.B. kleiner Effekt (d=0.2); mittlerer Effekt (d=0.5); grosser Effekt (d=0.8); Cohen, 1965) festgelegt werden.
Grösse des erwarteten Effekts: damit kann man "rumspielen" um durch die Ethikkomission zu kommen. Man kann einen grösseren Effekt annehmen, als dass dann ev. rauskommt: dadurch wird die Power grösser
Poweranalysen: Post-hoc Poweranalysen (2 +1)
- Poweranalysen lassen auch nach der Versuchsdurchführung berechnen
- Hier stehen die Stichprobengrösse und die Effektstärken fest. Berechnet wird die Power des Tests
Man braucht es nicht, wenn man bereits signifikante Ergebnisse hat. Da macht es keinen Sinn. Lediglich bei nicht vorhandenen sign. Ergebnissen kann / soll / darf man eine Poweranalyse machen
Poweranalysen: Post-hoc Poweranalysen: Faktoren für die Berechnung
Für die Berechnung muss...
• ... das Alpha-Niveau (meist 0.05)
• ... die Stichprobengrösse
• ... und die Effektstärke
bekannt sein.
Probleme mit der Poweranalyse (3)
Die klinische Bedeutsamkeit von Effekten: Das Ziel, durch ein signifikantes Ergebnis unsere Forschungshypothese als gültig annehmen zu können, erreichen wir umso besser, je mehr Zeit und Geld für grosse Stichproben zur Verfügung stehen.
Die Wahrscheinlichkeit, ein signifikantes Ergebnis zu erzielen steigt mit wachsendem Stichprobenumfang: Bei grossen Stichproben können Effekte (Unterschiede, Zusammenhänge) signifikant werden, die ohne jede klinische Bedeutsamkeit sind. Z.B. Zusammenhang zwischen Körpergrösse und IQ als sign. erreicht weil grosses N
Deshalb: Wenn die Alternativhypothese (H1: Unterschied zwischen Behandlungsgruppen) verworfen wird bzw. H0 (kein Unterschied zwischen Gruppen) angenommen wird stellt sich die Frage nach der Power des statistischen Tests. Wenn aber die Alternativhypothese (H1: Unterschied zwischen Behandlungsgruppen) angenommen wird bzw. H0 (kein Unterschied zwischen Gruppen) verworfen wird stellt sich die Frage nach der klinischen Bedeutsamkeit des Effekts.
Was versteht man unter dem Allegiance-Effekt? (3)
Allegiance = Gefolgschaft, Untertanentreue
Ein beachtlicher Teil der Therapieoutcomevarianz wird durch die Identifikation der Forschergruppe mit dem Ansatz erklärt (= Allegiance-Effekt).
Luborsky: Korrelation der Befunde mit Vorlieben der Forscher bis .85.
Konsequenz des Allegiance-Effekt:
Ergebnisse aus Therapiestudien sollten von Forschergruppen repliziert werden, die nicht an der Entwicklung der zu überprüfenden Intervention beteiligt waren bzw. Vertreter aller untersuchten Ansätze sollten in der Studienleitung repräsentiert sein.
Vorteile von RCTs (5)
- KAUSALE Wirksamkeitsbelege nur durch experimentelle Studien möglich: RCTs erlauben kausale Wirskamkeitsbelege da alles andere (durch die Randomisierung) kontrolliert werden kann
- Hohe interne Validität
- Empirisch validierte Manuale können gerade für Anfänger- TherapeutInnen Vorteile bieten (klare Struktur und Regeln; bringt Sicherheit)
- Erhöhte Konkurrenzfähigkeit von Psychotherapie in politischen Diskussionen. Überlegenheit von Psychotherapie im einfachen Vergleich mit Alternativbehandlungen ist leicht zu kommunizieren: RCT kommt aus der Medizin - und wird deshalb auch von vielen verstanden.
- Dank ESTs wurden Fortschritte in der psychotherapeutischen Ergebnisforschung erzielt und viele Initiativen zur Überprüfung der Wirksamkeit initiiert. Früher war es so, dass einzelne Ansätze der Meinung waren, dass sie nicht überprüft werden müssen - dies lässt sich mit RCTs umgehen: alle kann man überprüfen
Probleme mit RCTs (6 + 3)
- Bedingung: Hinreichend ähnliche Patienten + Vorgehen
- Patienten in Alltagspraxis oft mit komplexeren Problemen als in RCTs (z.B. hohe Komorbidität) -> schränkt die Generalisierbarkeit der Ergebnisse von RCTs ein
- Patienten oft auch mit Problemen/Zielen, die nicht in Diagnosen erfasst werden:
- Patienten haben oft (auch) andere Ziele als die Beseitigung der Störung
- Ziele in nur einem Bereich kommen selten vor
- Die Diagnose bestimmt die anderen Ziele wenig
- Unzureichende Nutzung des Outcome-Varianzanteils, der nicht von Techniken, sondern z.B. der therapeutischen Beziehung abhängt: Techniken erklären nur ein Teil der Outcome-Varianz: Aber die anderen werden nicht erklärt.
d.h. Outcomevarianz wird stärker durch Variablen innerhalb eines bestimmten Therapieansatzes erklärt, als durch den spezifischen Therapieansatz - Unmöglichkeit, den ganzen Bereich psychischer Störungen mit spezifischen Manualen abzudecken
- Reine Wirksamkeitsforschung nur eingeschränkt
nützlich: kostet viel, verschlingt viele Forschungsgelder generiert aber z.B. kein Wissen über Wirkungsweisen bzw. Wirkfaktoren in Psychotherapien