VL22
Kartei Details
Karten | 162 |
---|---|
Sprache | Deutsch |
Kategorie | Psychologie |
Stufe | Universität |
Erstellt / Aktualisiert | 10.07.2022 / 27.07.2024 |
Weblink |
https://card2brain.ch/box/20220710_methoden_der_skalierung
|
Einbinden |
<iframe src="https://card2brain.ch/box/20220710_methoden_der_skalierung/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Was sind weitere Voraussetzungen guter Forschung?
- Schädigungsfreiheit von Teilnehmenden
- Achtung der Würde und Rechte aller Menschen
- keine negativen Befindlichkeiten erzeugen
- Freiwilligkeit der Teilnahme (Informed Consent)
- vollständiges Informieren über (1) Zweck, (2) erwartete Dauer, (3) geplanten Prozeduren der Untersuchung
- einholen des Einverständnisses
Bei welchem Journal reicht man Manuskripte ein?
- neue Erkenntnisse: high impact Journal
- spezifische Erkenntnisse: specialized Journal
Welche Modelle der Zeitschriften gibt es?
- submission-based
- Leser zahlen für Artikel
- Open Access
- hybrid (einzelne Artikel = open access)
Welchen Kennwert gibt es für Journals?
- Impact Factor
- Zahl der Zitationen in einem Jahr im Verhältnis/geteilt durch alle Veröffentlichungen der vorherigen zwei Jahre
- Bsp.: Journal publiziert 2020 +2021 insgesamt 100 Artikel
2022 wurden Artikel insgesamt 200 mal zitiert
> IF = 2
Welchen Kennwert gibt es für Forscherinnen?
- Hirsch Index (h-Index)
- x Publikationen wurden mindestens x-mal zitiert
- h von ihren insgesamt n Publikaitonen wurden mindestens h-mal zitiert
- Bsp.: h-Index = 24
24 der Publikationen wurden mindestens 24-mal zitiert
Was umfasst ein Manuskript bei der Einreichung?
- Cover Letter
- Manuskript
- Titel Page
- Supplementary Material
- Figures/Tables
Was ist die Retraction Watch?
- Blog, der die Rücknahmen (Retraction) von wissenschaftlichen Papern veröffentlicht
- Ziel: Transparenz in Retraction Prozess bringen
- seit 2010
- Grund: zuvor wurden Retractions i.d.R. nicht berichtet (daher Ergebnisse oft fälschlicherweise noch weiterverwendet)
- wesentlich höhere Anzahlen werden jährlich zurückgenommen, als zuvor angenommen
Welche Folgen hat das?
- Vertrauen in Wissenschaft beschädigt
- öffentliche Gelder verschwendet
- nutzlose Nachforschungen
Welche Ursachen hat das?
- steile Hierarchien
- Konkurrenzdruck
- Belohnungssystem (publish-or-perish)
- fehlende Kontrollinstanzen
- wissenschaftliche Interessen der Publisher
Was ist die Reproduction Crisis?
- signifikante Ergebnisse müssen eigentlich repliziert werden (nicht nur Folgestudien durchführen!)
- Fehler aus Messdesign, SV etc. kann zu nicht replizierbaren Ergebnissen führen
- z.T. aber auch systematische Fehler
- Publikationsdruck, Forschende wollen ihre Ergebnisse nicht challengen, falsch gebrauchte oder missverstandene Stiatistik
Was sind Ursachen der Replikationskrise?
- kleine Stichproben
- wobei bei großen Stichproben Effekte schneller signifikant werden
- kleine Effekte
- geringe Teststärke (power)
- geringe Anteil tatsächlich bestehender Effekte im Vgl. zu abwesenden Effekten
- große Anzahl an AVs (> cherry picking, significance fishing)
- viele Freiheitsgrade bei Auswertung
- in Kombi mit Erwartungen der Forschenden = Biases
- p-Hacking
- statistische Parameter so verändern, dass etwas signifikantes herauskommt
- z.B. spontaner Erhebungsstopp, Stichprobenvergrößerung, Analysemethoden ändern etc.
- file-drawer Problem (nur positive Befunde werden veröffentlicht)
Was sind Vorteile der Veröffentlichung von Rohdaten
- Daten bleiben länger erhalten
- mehrere Wissenschaftlerinnen nutzen eine Datensatz
- Betrug geschieht seltener (wirkt abschreckend)
- Betrug kann besser entdeckt werden
Was sind Nachteile der Veröffentlichung von Rohdaten
- VP potentiell identifizierbar
- aufwändige und große Datensätze werden noch lange weiter bearbeitet
- Längsschnittprojekte = immense Datensätze
- Wissenschaftler, die erhoben haben, haben Vorrecht
- Zusatzarbeit für Forschende
Wie fallen gefälschte Daten auf?
- zu perfekte Verteilungen (Normalverteilung)
- sehr ähnliche Muster bei mehreren Studien aus einem Paper (z.B. ähnliche SD und MW)
- alles sehr knapp signifikant
- keine Ausreißer
- etc.
Prüfen mittels Simulationsansatz
Wie funktioniert der Simulationsansatz?
- Simulieren, dass es eine solche Verteilung mit gegebenen MW und SD gibt
- "ziehen" aus simulierten Datensatz von der Anzahl an VP, die im Artikel vorkamen
- Wie hoch ist die Wahrscheinlichkeit, dass genau diese Ergebnisse herauskommen?
- Anschließend: Vgl. wie andere Experimente mit den gleichen Interventionen abschneiden - gibt es dort ähnliche Ergebnisse?
Was kann man mit Rohdaten anstellen?
- Darstellungsfehler ausschließen
- Alternativerkärung (z.B. verteilungsbedingt) ausschließen
- Erkärungen der Autoren prüfen (z.B. Kodierungsfehler)
i.d.R. haben Fälscher bestimmte statistische Fehlvorstellungen, die sich in gefälschten Daten widerspeigeln
- Wie ähnlich sind Maxima und Minima
- Wie häufig kommt Mittelwert vor
- Sind bestimmte Werte überzufällig häufig/selten?
- unwahrscheinlich verteilte Angaben (z.B. Menschen sollen Wert eines T-Shirts angeben: Fälscher ignorieren Fakt, dass Menschen oft in 5er Schritten angeben)
Was sollte man statt Witch-Hunt machen?
- Analyse über mehrere Studien replizieren
- Vgl. der auffälligen Studie mit Studien anderer Autoren mit ähnlichen Maßen
- Vgl. der auffälligen Studien mit Studien desselben Autors
- Raw Data einfordern und anschauen
- Autoren privat und transparent kontaktieren
- Daten mit unbefangenen und statistisch kompetenten Dritten diskutieren
- Diskretion
Was ist heute noch nicht ganz Standard, aber wird es immer mehr?
- Open Science Framework
- Rohdaten, Auswertungsskripte und Untersuchungsmaterial auf Website veröffentlichen
- Zeitschriften, die Data Sharing als Voraussetzung für Veröffentlichung von Artikeln machen
- Drittmittelgeber, die data sharing der finanzierten Forschung verlangen
- Aber:
- Großteil verlangt nur ein "data sharing statement"
- Mehrzahl der Forschenden teilt Daten nicht vollständig/verständlich
- Gründe:
- zu wenig Zeit
- zu wenig Erfahrung
- keine Anerkennung/Entlohnung
- Sorge vor negativen Folgen
Was ist das Problem mit falsch positiven Ergebnissen?
- bleiben in Literatur und in Gedächtnis
- null-Resultate werden selten veröffentlicht
- nicht-Replikationen schwer interpretierbar und selten eindeutig (und selten veröffentlicht)
- Verschwenden Ressourcen
- inspirieren sinnlose Forschung
- inspirieren nutzlose politische Veränderungen
- führen zu Glaubwürdigkeitsverlust
Welche Freiheitsgrade haben Forschende?
- Umgang mit Ausreißern
- Analysemethode
- Auswahl der berichteten AV
- Einschluss von Kovariaten
- Auswahl der UV die berichtet werden
- Auswahl der Stichprobengröße
- systematische Weitererhebung bis zum signifikanten Ergebnis
- Hypothesizing after result is known (HARKing > explorative Befunde werden konfirmatorisch berichtet)
+ Suche nach Signifikanzen (publish or perish) + Unwissenheit über Konsequenzen und Zulässigkeit mancher Entscheidungen
Tipps für Forschende
- Datenerhebung an vorher festgelegten Punk abgeschlossen werden (und berichtet)
- verhindert systematisches Weitererheben
- 20 Beobachtungen pro Zelle oder gutes Argument für weniger/mehr
- besser: explizite sample-size calculation auf Basis erwarteter ES, Alpha-Niveau und Teststärke
- alle UV und AV berichten
- alle Bedingungen, Manipulationen (auch die, die nicht gewirkt haben) berichten
- Wurde Fälle/Beobachtungen ignoriert, trotzdem berichten
- Kovariate berichten + berichten ohne Kovariate
Tipps für Reviewer
- sicherstellen, dass Richtlinien eingehalten wurden
- mehr Toleranz bei imperfekten Ergebnissen
- Autoren ermutigen, deutlich zu zeigen, dass berichtete Befune nicht auf willkürliche Erhebungs- und Analysemethoden beruhen
- enn Argumente für Erhebung/Analyse nicht stichhaltig: Einfordern von Replikationen
Wie macht man Publikationsverzerrungen sichtbar?
- Funnel Plots
- Begg & Mazumdar's test (Metaanalysen)
- p-curve
Wie funktioniert die p-Curve?
- zeigt Verteilung der p-Werte signifikanter Befunde verschiedener Studien einer Fragestellung
- Abtragen aller Signifikanzwerte der Studien in Koordinatensystem (x-Achse = p-Werte, y-Achse = Wie viele Studien berichten welchen p-Wert/% der p-Werte)
- unter Gültigkeit H0 sind alle p-Werte zwischen 0.0 und 0.05 gleich wahrscheinlich
- p-Kurve ist flach
- bei tatsächlichen Effekt (ES > 0) ist p-Kurve positiv abgeschrägt (fällt)
- je größer ES, desto steiler
- besonders viele Werte bei 0.01
- Annahme: bei p-Hacking sind v.a. viele Werte bei 0.05% abgetragen, d.h.Kurve steigt
- Grund: so viele Leute über 0.05 eliminiert, bis meisten Befunde gerade so unter 0.05 sind
- daher viele Studien mit p-Wert von ca. 0.05
Was ist der R-Index?
- Replicability-Index: Index für ein ganzes Forschungsfeld
- Power = Wahrscheinlichkeit eines signifikanten Ergebnisses bei gegebener Stichprobengröße und ES
d.h. wenn Effekt existiert, wird er gefunden- z.B. Power = 0.5 = 50% der Studien finden signifikante Effekte
- Berechnung:
- beobachtete Power ("post-hoc power estimates")
- Median der power aller einbezogener Studien
- aus exaktem p-Wert
- p = .05 entspricht 50% power
- p = 0.005 entspricht 80% power
- Schätzer für % der Studien, die signifikant sein sollten
- Erfolgsrate berechnen
- % der tatsächlich berichteten Signifikanzen in den einbezogenen Studien
- R-Index = 2* beobachtete Power - Erfolgsrate
- Bedeutung:
- R-Index < 50%: Indikator für ungenügende Power und selektive Berichterstattung
- R-Index < 22%: Indikator für p-Hacking (nicht allein durch Publicationbias erklärbar)
Nenne die 21 word Solution
We report how we determined our sample size, all data exclusions (if any), all manipulations, and all measures in the study
Was ist eine "direct replication"?
Studie ist dem Original so ähnlich wie möglich (z.B. Setting, Instruktion, Stimuli etc. alles exakt so)
Was ist eine "conceptual replication"?
Studie untersucht die gleiche Idee wie das Original, die Implementierung kann sich aber unterscheiden
Was ist WEIRD Science?
- Großteil psychologischer Forschung = WEIRD
- Westlich, educated, industrialized, rich, democratic Menschen
- von und an WEIRD Menschen
- Replikationen somit nie wirklich generalisierbar
Was ist eine Präregistrierung?
- Spezifikation der Hypothesen, das methodische und statistische Vorgehen vor Durchführung der Studie
- standardisierte Vorlagen
- aber: wenn Präreg nicht gut ist, bringt das auch nicht viel
- Vorsicht: viele haben zwar eine Präreg, die ist aber sehr schlecht (missbraucht die Glaubwürdigkeit)
Was sind Vorteile einer Präregistrierung?
- Verbessert die Planung des Experiments und der Analysen
- zeigt, welche Analysen explorativ waren und welche konfirmatorisch
- Reduziert HARKing (Hypothesizing after results are known)
- Reduziert df der Forschenden
- reduziert p-Hacking
Was ist ein "registered Report"?
- Spezifikation des Intros, der Fragestellung, Hypothesen, methodisches und statistisches Vorgehen vor Durchgührung der Studie und Senden an Zeitschrift
- nach Reviewprozess kann Zeitschrift Artikel annehmen und erst dann Durchführung der Studie
- möglicher Game Changer (weniger Notwendigkeit, Ergebnisse zu fälschen)
- zusätzlicher Vorteil zu Präreg
- Reduziert publicaiton bias, weil Nullbefunde berichtet und publiziert werden
Was ist eine Result-Blind Review?
- Forschende senden Intro, Frage, Hypothesen, Methoden der bereits durchgeführten Studie an Zeitschrift
- Reviewer begutachten, ohne Ergebnisse zu kennen (werden so nicht durch Ergebnisse beeinflusst)
- Problem: Editoren sehen Ergebnisse
Was ist eine Theorie?
Geordnete Menge von Begriffen und Aussagen, die ein Phänomen beschreiben und erklären.
Was ist eine Hypothese?
Vorläufige und überprüfbare Aussage zu Zusammenhängen, Unterschieden oder Ursache-Wirkungs-Beziehungen
Was sind wissenschaftliche Methoden?
Menge geordneter Schritte zur objektiven Ergebung und Analyse von Daten
Woraus besteht der wissenschaftliche Kreislauf?
Theorie (allgemein) -> Deduktion -> Empirie (speziell) -> Induktion -> Theorie -> ...
Welche Kriterien muss eine Hypothese erfüllen?
- empirisch untersuchbare reale Sachverhalte
- allgemeingültig (geht über Einzelfall/singuläres Ereignis hinaus)
- hat (implizit) die Formalstruktur eines sinnvollen Konditionalsatzes ("wenn-dann", "je-desto")
impliziert Widerspruchsfreiheit - potenziell falsifizierbar
Was sind Hindernisse bei Befragungen?
Dunning-Kruger Effekt (je mehr man weiß, desto mehr weiß man, was man nicht weiß)
Was ist der Rosenthal Effekt?
- VL-Effekt
- durch positive Erwartungen, Einstellungen, Überzeugungen, positive Stereotype des VL -> selffulfilling Prophecy bei Ergebnis des Experiments