Methodenlehre Psychologie

Einführung in die Methoden der Psychologie

Einführung in die Methoden der Psychologie


Set of flashcards Details

Flashcards 453
Students 55
Language Deutsch
Category Psychology
Level University
Created / Updated 12.01.2019 / 04.02.2025
Weblink
https://card2brain.ch/box/20190112_methodenlehre_psychologie
Embed
<iframe src="https://card2brain.ch/box/20190112_methodenlehre_psychologie/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Was sollte bei der Beurteilung einer Hypothese neben statistischer Signifikanz noch berücksichtigt werden und warum?

- die Effektgröße --> macht die praktische Relevanz deutlich 

Inwiefern enthalten statistische Tests eine subjektive Komponente?

- es wird zwischen einer Null- und einer Alternativhypothese unterschieden 

- ob man nun bei Signifikanz die Nullhypothese verwirft oder nicht, kommt auf den Forscher an 

- zeigt die Effektgröße einen sehr kleinen Effekt, sollte sie eigentlich beibehalten werden

- der Forscher kann sie aber aufgrund eines erreichten Signifikanzniveaus dennoch verwerfen 

Was bedeutet Datenaggregation und wozu braucht man diese?

- Aggregieren von Daten = Kondensieren von Daten, so dass eine Datenstruktur entsteht, auf die statistische Tests sinnvoll angewendet werden können, z.B. ein Proband pro Zeile und relevante AVn in Spalten 

Müssen wir für statistische Software immer Geld bezahlen? 

- Nein, es gibt auch freie statistische Software Pakete 

Wozu braucht man überhaupt Inferenzstatistik und von welchen Wortstämmen leitet sich der Begriff ab?

- lat. "in-ferre" --> hineintragen

- heute: bedeutet es schussfolgern (zweiwertiges Prädiakt: von... auf...) 

- hier: von Stichprobe auf Population  

Was ist der Unterschied zwischen Statistik und Stochastik? 

- Stochastik (gr.): "Mutmaßen"

- Stochastik umfasst die Wahrscheinlichkeitstheorien, Kombinatorik und Statistik 

- Statistik (lat.): "den Staat betreffend"

- deskriptiv vs. schließend 

Erläutern Sie das Prinzip statistischen Testens in einem Satz unter Verwendung der Begriffe H0 (bzw. Zufallsannahme) und Stichprobenkennwerte. 

Wie wahrscheinlich ist das zufällige Zustandekommen eines Stichprobenkennwerts? 

Ist er wahrscheinlich handelt es sich um eine Zufallsannahme, ist er weniger wahrscheinlich kann die Zufallsannahme verworfen werden und die Gegenhyoothese angenommen werden 

Geben Sie ein psychologisches Beispiel wann die Binomialverteilung als Stichprobenkennwertverteilung genutzt werden kann. 

- Fragestellung: Wie wahrscheinlich ist es, dass bei zufälliger Betrachtung von 100 Studenten 10 depressiv sind?

- wenn man nun die Depressionsrate der Population kennt, kann man mit der Binomialverteilung arbeiten

Wie viele Personen brauche ich mindestens um einen signifikanten Effekt bei alpha =5% mittels eines Binomialtests erhalten zu können und warum?

???

Was besagt der p-Wert genau?

- wenn ich n- mal mit einer Münze werfe, ist die Wahrscheinlichkeit, dass k-mal "Kopf" fällt gleich

- besagt wie wahrscheinlich unter Zufallsannahme das Auftreten eines Stichprobenkennwertes ist oder ein extremerer Wert zu erwarten wäre 

- wenn p kleiner als alpha (z.B. = 5%) dann statistisch signifikanter Effekt 

Kann man mit 95% Wahrscheinlichkeit im Casino gewinnen? Begründen Sie ihre Antwort auch indem sie auf mit dieser Problematik verbundene potentielle Nachteile eingehen.

JA!

Problem: Wie gewinne ich mit ca. 95% Wahrscheinlichkeit im Casino 10 Euro?

Lösung: z.B. Martingale / Verlustprogression:

  1. im ersten Durchgang mit Eingangsbetrag anfangen (10 Euro) 
  2. a) wenn gewonnen nach Hause gehen, sonst b) im zweiten Durchgang doppelten Betrag setzen (20 Euro) 
  3. genauso weiter verfahren (schlimmstenfalls im 5. Durchgang 160 Euro setzen und beten...)

Nachteil:

- Interaktion von drei Variablen: Gewinnwahrscheinlichkeit (96,89%),  Gewinnhöhe (10 Euro), aber leider auch: Maximalrisiko (310 Euro)

- bei unendlich vielen Durchgängen: Nullsummenspiel (wenn das Casion nicht an der grünen "0" verdienen würde---) 

Wie funktioniert Bootstrapping / Resampling? Erläutern Sie dies anhand eines Beispiels. 

- Bootstrapping heißt aus den eigenen Stichprobendaten durch künstliche, immer neu gezogene Stichprobenzusammenstellungen (Resampling) eine Testverteilung basteln

- alle 10 Werte (n) in einen Hut werfen 

- möglichst oft zufällig die Werte auf zwei Gruppen aufteilen (oder alle möglichen Anforderungen erstellen= Permutationstest) und jeweils die Mittelwertsdifferenz berechnen (zur Erstellung einer Stichprobenkennwertverteilung: Abtragen, mit welcher relativen Häufigkeit welche Mittelwertsdifferenz vorkommt)

- Gehört die konkrete Mittelwertsdifferenz (=1.2) zu den 5% extremsten (=unwahrscheinlichsten) Mittelwertsdifferenzen unter Zufallsannahme?

Wie funktioniert Bayesianisches Testen als Alternative zum NHST (null hypothesis significance testing)?

- Wie wahrscheinlich ist eine konkrete Hypothese wahr auf der Basis eines Datenmusters?

(bei NHST: wie wahrscheinlich ist das Auftreten eines Stichprobenkennwerts unter Zufallsannahme?)

- Typischerweise hat eine Hypothese eine bestimmte Wahrscheinlichkeit bereits vor der Untersuchung, die sich dann angesichts der Daten eines Experiments verändert

- auch geeignet, um zwei konkurrierende Modelle / Hypothesen gegeneinandner "antreten" zu lassen 

Aufgrund welcher prinzipieller Entscheidungen können Sie bestimmen, welcher Test für Ihre Studie der Richtige ist? 

- Datentyp (qualitativ / quantitativ)

- Variablenanzahl (UV)

- Zusammenhang vs. Unterschied?

- Abhängige vs. unabhängige Messungen 

- Beispiel: Type od data (D), quantitative measurement, type of question (Z), differences, number of groups, multiple, relation between samples (A), independent, number of independent variables, multiple --> factorial ANOVA

 

Wozu sind Metaanalysen gut und welche Schritte muss man dabei beachten?

--> um gesichtertes Wissen über Studien hinweg zu erreichen, sind statistische Metaanalysen sinnvoll

  • Sammeln und Kategorisieren vin unabhängigen Experimenten / Studien 
  • Bestimmung von Stichprobengröße und Effektgröße 
  • Einbezug von Studien, die keinen Effekt gefunden haben 
  • Errechnung einer "Über-Alles"- Effektgröße (inkl. Signifikanztest) 

Was sind Grenzen von Metaanalysen?

- File-drawer-Problem / Publication bias: signifikante Studien werden oft selektiv berichtet, nicht-signifikante Befunde fallen unter den Tisch 

- Garbage-in-garbage-out Problem (Wie viel taugen die einzelnen Studien?)

- Apple-pears-Problem (Vergleichbarkeit der Studien gegeben?)

Was ist spezifisch für eine multifaktorielle ANOVA?

- geeignet für die Testung mehrerer UVn

- z.B. Testung von Einfluss des Geschlechts und Rauchgewohnheiten auf Intelligenz 

- zwei Haupteffekte und eine Interaktion

- diese Fragen kann die multifaktorielle Varianzanalyse (two way) beantworten (im Gegensatz zur unifaktoriellen, one way)

Welche Annahmen macht die ANOVA mit und ohne Messwiederholung?

  1. Varianzhomogenität: die Population hat in allen Bedingungen die jeweils gleiche Varianz (Homoskedastizität)
  2. Normalverteilung: der Population in jeder Bedingung
  3. Unabhängigkeit aller Beobachtungen 

Welche Bestandteile hat der F-Bruch?

- Quadratsummenzerlegung

- Freiheitsgradbestimmung

- Vergleich mit F-Tabellierung (Verteilung von F wenn H0 wahr)

Summiert sich die Treatment- und Fehlervarianz in der ANOVA zur totalen Varianz auf? 

Nein, die totale Varianz wird berechnet durch:

- quadrierte Abweichung aller Werte vom Gesamtmittelwert --> jeweils berechnen und dann aufsummieren

- das ergibt die Quadratesumme der totalen Varianz

- letztlich durch df (=Anzahl aller Werte minus eins) teilen 

Auf welche Weise wird bei der ANOVA Varianz zerlegt? Erläutern Sie dies anhand eines einfachen Zahlenbeispiels.

- Zähler einer Varianz: Quadratesumme

- Nenner der Varianz: df

- Zähler: Quadratsumme von 2,3 ist 4+9=13

- Nenner: bei 3 Werten und gegebenem Mittelwert sind 2 Werte beliebig wählbar, der letzte ergibt sich automatisch (unfrei), daher df 2 

Wie berichtet man F-Werte gemäß Konvention? Geben Sie ein Beispiel. 

F(3,16)=12.41, p< 0.05 für: 

- Errechnung der Stichprobenstatistik "F": Treatmentvarianz / Fehlervarianz 

- (hier: F= (70/3) / (30/16) = 12.41)

- Nachschauen des kritischen F-Werts bei gegebenen Zähler- (hier: 3) und Nenner- (hier: 16) Freiheitsgraden für a=5% --> Fkrit(3,16) = 3.24 

- da der empirische F-Wert > Fkrit, ist eine 12,5x größere Treatmentvarianz im Vergleich zur Fehlervarianz aufgrund der H0 nicht wahrscheinlich zu erwarten, daher wird die H0 abgelehnt: mindestens zwei Mittelwerte zwischen den Gruppen unterscheiden sich signifikant 

Welche Unterschiede bestehen zwischen einer 2x2 ANOVA und einem 4-Felder-Chi-Quadrat-Test?

- die AV ist keine Häufigkeit bei ANOVA, sondern intervallskalierte Variable

- getestet wird bei der ANOVA nicht nur die Interaktion, sondern auch die beiden Haupteffekte

Inwiefern gibt es einen Unterschied bei den Fehler-Freiheitsgraden zwischen der ANOVA für abhängige vs. unabhängige Messungen? Verwenden Sie bei ihrer Antwort den Begriff "ipsative Daten"?

- Ipsative Daten erstellen bedeutet, die Werte so zu ändern, dass die Mittelwerte pro Proband null sind

- im Gegensatz zur ANOVA für unabhängige Stichproben muss wegen der Umwandlung in ipsative Daten für jeden Proband ein df abgezogen werden, da der jeweilge Pbn-Mittelwert ja auf 0 fixiert wird und dadruch jeweils ein Wert weniger frei ist 

Welche zwei Alternativen gibt es zur Messwiederholungs-ANOVA und was sind (grob skizziert) die Unterschiede?

Multivariate ANOVA (>1 AV):

- die Daten der verschiedenen Messzeitpunkte werden als verschiedene AVn behandelt --> beide Prozeduren können daher zu verschiedenen Ergebnissen führen (z.B. gibt SPSS standardmäßig immer beide Ergebnisse aus) 

Linear mixed effect models:

- gewinnen zunehmend an Popularität 

- normale Annahme bei ANOVAs: UV als "fixed effect" (bedeutet Stufen der UV sind festgelegt und würden bei Replikation des Experiments genau gleich sein, z.B. Geschlecht)

- hier neu: UV als "random effect" spezifizierbar: Stufen der UV sind nicht festgelegt, sondern eine Zufallsauswahl (z.B. Wortfrequenzeffekt): konkret ausgewählte Wörter könnten in einem nächsten Experiment ganz anders sein

- erlaubt auch Multilevel-Analysen: (Schüler- Klasse- Stadt- Bundesland)

- kann besser mit missing data und Sphärizitätsverletzungen umgehen als Messwiederholungs-ANOVA

Wie viele Haupteffekte und Interaktionen kann man bei einer vierfaktoriellen Anova testen? 

- vier Haupteffekte

- sechs Interaktionen 

- (?)

Inwiefern wird bei der multifaktoriellen ANOVA die Varianz anders zerlegt als bei der einfaktoriellen ANOVA?

... funktioniert im Prinzip wie bi der einfaktoriellen ANOVA, z.B. bei zwei Faktoren:

- Berechnung von QS(tot): wie gehabt (df=N-1)

- Berechnung von QS(Treatment des Faktors 1): so als ob Faktor 2 nicht existiert (df= Faktorstufen-1)

- Berechnung von QS(Treatment des Faktors 2): so als ob Faktor 1 nicht existiert (df= Faktorstufen-1)

- Berechnung von QS(error): summierte quadrierte Abweichungen der Einzelwerte von ihrem Zellenmittel (df= N-Zellenanzahl)

- was noch übrig bleibt bis zur QS(tot), wenn man die letzten drei QS addiert, entspricht QS(Interaktion): df= df(Treat1)*df(Treat2)

--> für den jeweiligen F- Bruch setzt man dann die jeweils interessierende MS ins Verhältnis zu MS(error)

WelcheTypen von Interaktionen gibt es? Zeichnen Sie jeweils Datenbeispiele (mittels Liniengrafiken).

- ordinale Interaktion: eine EHE größer als der andere, aber beide in gleicher Richtung 

- disordinale Interaktion: ein EHE in anderer Richtung als der andere --> beim Vorliegen disordinaler Interaktionen sind die Haupteffekte nicht mehr sinnvoll zu interpretieren 

- hybride Interaktionen: ordinal bzgl. einer und disordinal bzgl. der anderen Variablen 

Welche Effektgrößen gibt es bei der multifaktoriellen ANOVA, und wie unterscheiden sie sich?

Effektstärken

- Effektstärken müssen zur Hypothesenbeurteilung immer mitberücksichtigt (und mitberichtet) werden!

- für Haupt- und Interaktionseffekte (Varianzanteile, als sog. r-Maße): 

  1. n^2/w^2 (Schätzer für Anteil der jeweiligen QS an QStot) wie bei One-way ANOVA
  2. Partielles n^2/w^2: im Nenner nicht die gesamte Varianz, sondern die Summe aus der interessierenden Treatment- plus der Fehlervarianz 

- Idee: partielle Maße sind unabhängig davon, wie viele zusätzliche Faktoren in Experiment / ANOVA vorhanden 

- für einzelne Kontraste:

- d-basierte Effektmaße (wie bei t-Tests)

Wozu eignet sich eine ANCOVA und wie funktioniert sie im Prinzip?

Funktionen ANCOVA:

- ANCOVA zur post hoc-Kontrolle von Störvariablen (z.B. Herausrechen des Alters) 

- ANCOVA zur Teststärkenerhöhung 

Vorgehen

- Regression rechnen, bei der man aufgrund der Kovariate (z.B. Alter), die AV (z.B. Lernleistung) vorhersagt

- Originaldaten der AV durch Residuen ersetzen (also den Teil, der nicht schon durch das Alter vorhergesagt / erklärt wird)

- ANOVA über die Residuen rechnen (--> Auspartialisieren der Variable "Alter") 

 

Was muss beim Schluss auf die Sachhypothese (nach Auswertung der Daten) beachtet werden?

Berücksichtigung der Qualität von: 

  • Operationalisierung
  • SV-Kontrolle
  • Stichprobe (Generalisierbarkeit)
  • Versuchsplan
  • Hypothese (Hintergrundwissen) 
  • statistische Verfahren 

Was sollte im Rahmen der Diskussion eines Experiments thematisiert werden?

Gütekriterien des Experiments (bzgl. o.g. Aspekte)

  • interne Validität bzw. CP-Validität (SV-Kontrolle?)
  • externe Validität (Generalisierbarkeit bzgl. Probanden/Situationen?)
  • Konstruktvalidität (bzgl. UV/AV?)
  • statistische Validität (Angemessenheit der eingesetzten statistischen Prozeduren zum Schluss auf die Sachhypothese?)

- Diskussion möglicher Ursachen erwartungskonträer Ergebnisse

- Verbesserungsvorschläge für die Zukunft

- neue interessante Fragestellungen?

- Fazit: Was wissen wir jetzt mehr?

 

Wozu ist Modellierung gut, und welche Arten von psychologischen Modellen kann man unterscheiden?

- Modelle helfen, komplexe Daten und Zusammenhänge verstehbar zu machen 

- Beispiele für Modelloptionen:

  • mathematisch / komputational
  • metaphorisch / konzeptionell 
  • Modell, das empirische Vorhersagen erlaubt (falsifizierbar) vs. Modell, das Vokabular zum Reden über einen Gegenstandsbereich zur Verfügung stellt (analytisch)
  • Box / Arrow
  • neuronale Netze 

Bilden psychologische Modelle die Realität ab? Begründen Sie.

- Nein, aber sie versuchen die Realität so annähernd wie möglich abzubilden

Was sind zentrale Kriterien, die bei der Abfassung eines Berichts zu beachten sind?

- Bericht --> dient der Veröffentlichung des Experiments

KRITERIEN

- Standardisierung (z.B. APA-Regeln)

- Reproduzierbarkeit möglichst perfekt gewährleisten

- Transparenz (bzgl. aller Entscheidungen & Argumente)

- Einfachheit, Eindeutigkeit & Verständlichkeit 

Wie ist ein Bericht typischerweise gegliedert?

GLIEDERUNG

- Titel/ Autor/ Schlüsselwörter/ Zusammenfassung (Abstract)

- Einleitung & theoretischer Hintergrund

- Methode (Probanden, Apparatur & Materialien, Versuchsplan, Durchführung) 

- Ergebnisse

- Diskussion

- Literaturverzeichnis (References) 

In welchen Schritten verläuft das wissenschaftliche Publizieren?

PUBLIZIEREN

  1. Manuskript erstellen (APA-style)
  2. Journal wählen 
  3. Editor bei Journal überfliegt Paper: prinzipiell geeignet? 
  4. Editor wählt Experten als Gutachter: Peer-review-Prozess 
  5. Editor wägt aufgrund Reviews ab, ob Ablehnung (80% der Fälle) oder Überarbeitungsmöglichkeit 
  6. Autoren überarbeiten und gehen "point-by-point" auf alle Review-Anmerkungen ein, revidiertes Manuskript inkl. "point-by-point-responses" geht wieder an Gutachter
  7. Prozessschritt 6 wiederholt sich bis endgültige Ablehnung/ Acceptance (typisch: 3 Runden)
  8. Paper ist erst "in press" (nach Korrekturlesen), dann publiziert (mit Jahreszahl, Volume-Nummer und Seitenzahl)
  9. Paper wird hoffentlich von Kollegen rezipiert 

Was ist der "impact factor", und wovon hängt er (bzw. seine Bewertung) ab?

"Impact factor" (IF) eines Journals: 

- wie oft ein Paper in dem Journal im Schnitt pro (Referenz-)Jahr zitiert wird (Modalwert typischerweise = 0!) --> relevante Spanne: 2 oder 5 Jahre vor Referenzjahr 

- Beispiel: "experimentelle Grundlagenpsychologie": 

  • IF zwischen 1-2 ist "Mittelklasse"
  • über 2 "Spitzenklasse"
  • über 4 "Top Journal" 
  • aber z.T. ganz andere Referenzwerte für angewandte Psychologie, Neuropsycholohie etc.!

- IF nicht nur von Qualität abhängig, sondern auch von Journaltyp (z.B. Journals, die Übersichtsarbeiten publizieren, grundsätzlich häufiger zitiert) 

- Probleme: Selbstzitationen, Maßnahmen von Journals zur IF-Erhöhung etc. 

Was ist ein peer review-Prozess?

Peer-review-Prozess:

- Editor (meist ehrenamtlich arbeitender Wissenschaftler) wählt Experten als Gutachter (typ. 2-3 ehrenamtliche Reviewer)

- peer-review als Qualitätskriterium 

Mit welchen Instrumenten kann man die Zitationshäufigkeit eines Papers messen?

- Google Scholar

- Harzing's Publish or Perish 

- Thomson Reuters Journal Citation Reports