Statistik 7

Grundlagen der Interferenzstatistik

Grundlagen der Interferenzstatistik


Kartei Details

Karten 23
Sprache Deutsch
Kategorie Psychologie
Stufe Universität
Erstellt / Aktualisiert 20.01.2016 / 03.01.2023
Weblink
https://card2brain.ch/box/statistik_7
Einbinden
<iframe src="https://card2brain.ch/box/statistik_7/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Signifikanzniveau:

festgelegte Grenze der Wahrscheinlichkeit z.B. 0.05

Überschreitungswahrscheinlichkeit:

p (p-Wert)

Wahrscheinlichkeit, das gefundene Ergebnis oder noch ein stärker gegen die Nullhypothese sprechendes Ergebnis unter der Annahme, dass die Nullhypothese wahr ist, zu finden

Falsifikationismus;

Fisher war der Meinung, dass es nicht möglich sein nachzuweisen, dass die Nullhypothese gültig ist: Man kann sie nur verwerfen oder eben nicht verwerfen

Falsikationismus (Popper): wissenschafltiche Hypothesen können niemals durch empirische Beobachtungen beweisen oder verifiziert, sondern immer nur entkräftet oder falsifiziert werden

Kritik an Fisher:

in vielen Fällen unrealistisch, dass es überhaupt keinen Effekt gibt

Binäres Entscheidungskonzept nach Neyman und Pearson:

  • Null- und Alternativhypothese

  • Alternativhypothese ist in den meisten Anwendungen die

    Forschungshypothese, die von Interesse ist.

  • Nullhypothese ist der Gegenpart zur Alternativhypothese

  • Null- und Alternativhypothese schliessen sich gegenseitig aus

  • Binäre Entscheidung: Entscheidung für entweder

    • die Nullhypothese

      oder

    • die Alternativhypothese 

Fehler erster Art \(\alpha\):

H0 ist wahr, wird aber verworfen

Fehler zweiter Art \(\beta\):

H0 ist falsch, wird aber beibehalten

Verwerfen der Nullhypothese wenn:

  • P(H1 annehmen | H0 wahr) ≤ α 

  • p ≤ α 

Unterschied p-Wert und α-Fehler:

  • Überschreitungswahrscheinlichkeit p ist ein empirisches Ergebnis

  • Irrtumswahrscheinlichkeit α wird vor der Untersuchung festgelegt 

  • Zusammengesetzte Hypothese: 

  • H0: μ ≤ 50 H1: μ > 50 

  • Nullhypothese besteht aus einem Wertebereich

  • Für jeden Wert des Wertebereichs kann eine Verteilung betrachtet werden

  • Festlegung des Ablehnungsbereichs:

    • Betrachtung der Verteilung unter dem Wert der Nullhypothese, der gerade noch mit der Nullhypothese vereinbar ist (μ = 50)

  • Irrtumswahrscheinlichkeit stellt Obergrenze dar 

Teststärke (Power):

\(1 - \beta\)

wovon hängen β und (1 — β) ab? 

  • Effekt(grösse)

  • Signifikanzniveau α

  • Streuung der Populationsmerkmalsverteilung

  • Stichprobengrösse

  • Art des Tests (einseitig vs. zweiseitig)

Statistisches Testen an Stichproben:

einseitiger Test, gerichtete Hypothese:

zemp = 3,58

zkrit = 1,645

zemp > zkrit 

Hverworfen

Teststärke ist umso höher, ...

  • je grösser die Stärke des Effekts ist,

  • je grösser der Stichprobenumfang ist,

  • je geringer die Merkmalsstreuung ist,

  • je grösser α ist.

Einstiproben-Gauss-Test (z-Test)

Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert bei bekannter Populationsvarianz 

Einstichproben-t-Test:

Vergleich eines Stichprobenmittelwertes mit einem Populationsmittelwert bei unbekannter Populationsvarianz 

Zweiseitiger Test: p-Wert

  • Wahrscheinlichkeit, unter H0 den beobachteten Prüfgrössenwert oder einen (in Richtung der Alternative) noch extremeren Wert zu erhalten.

  • Bezieht sich auf Betrag der Prüfgrösse

  • Gleicher Wert der Prüfgrösse geht beim zweiseitigen Test – im Vergleich

    zum einseitigen Test - mit doppeltem p-Wert einher

  • Computerprogramme geben typischerweise den p-Wert für zweiseitigen

    Test aus --> muss für einseitigen Test halbiert werden.

  • Einseitiger T est hat mehr Power

Standardisierte Effektgrössen:

  • Unstandardisierte Grösse des Effekts

    Population: ε = μ − μ0

    Postuliert unter Alternativhypothese: ε1 = μ1 − μ0

    Schwer vergleichbar über Studien, in denen Effekt mit unterschiedlicher Metrik erfasst wurde

  • Daher: Standardisierung der Effektgrössen 

Cohens δ :

\(\delta = 0.14 \space\space\space\space\delta = 0.35 \space\space\space\space\delta = 0.57 \)

Testplanung:

  • Bestimmung des optimalen Stichprobenumfangs, um bei einem festgegelgtem Signifikanzniveau eine a priori festgelegte Teststärke zu erhalten
  • Grösse des Effekts und Populationsstandardabweichungen müssen bekannt sein bzw. festgelegt werden 

  • Rückgriff auf standardisierte Effektgrössen 

Take Home Messages:

  •   Ein nicht-signifikantes Ergebnis zeigt nicht, dass die Nullhypothese wahr ist.

  • Das Signifikanzniveau muss vor einer Untersuchung festgelegt werden.

  • Hypothesen müssen vor der Untersuchung formuliert werden.

  • Erstellt man Hypothesen anhand von Zusammenhängen in den Daten, müssen diese an neuen Daten überprüft werden.

  • Ein signifikantes Ergebnis bedeutet nicht zwangsläufig, dass der Unterschied/ Zusammenhang praktisch bedeutsam ist.

  • Ein signifikantes Ergebnis bedeutet nicht, dass der Effekt präzise geschätzt wurdeèKonfidenzintervalle sind notwendige Ergänzung

  • Der p-Wert entspricht NICHT der Wahrscheinlichkeit, mit der die Nullhypothese wahr ist:

    p = P(E|H0) ≠ P(H0 |E

Probleme des Nullhypothesentest, welche das binäre Entscheidungskonzept lösen kann:

1) Zwingt den Forschenden, eine Annahme bezüglich des erwarteten Effekts zu treffen

• inhaltlicheHypothesemussbegründetundspezifiziert werden --> Theorien gehaltvoller

2) Erlaubt Prüfung der Alternativhypothese: Alternativhypothese kann abgelehnt / Nullhypothese angenommen werden

• Fehler, der mit dieser Entscheidung verbunden ist, quantifizierbar

3) H0 beibehalten ≠ Populationseffekt gleich 0

• sondern lediglich,dass ein emirisches Ergebnis unter der Annahme eines Effekts der spezifizierten Grösse unwahrscheinlich ist, wenn die Untersuchung so angelegt wurde, dass die gewünschte Power erreicht wurde.

4) H1 annehmen ≠ Populationsmittelwert exakt μ1

• sondern lediglich, dass ein solches Ergebnis unter der Annahme der Nullhypothese unwahrscheinlich ist. 

Unterschied allgemeine und spezifische Alternativhypothese:

Allgemeine Alternativhypothese: Die Person stammt aus einer Population mit einem

Mittelwert von μ > 100. H1: μ > 100 (μ > μ0)

Spezifische Alternativhypothese: Die Person stammt aus einer Population mit einem Mittelwert von μ = 110. H1: μ = 110 (μ = μ1)