Epidemiologie & Biostatistik

Zu den Themen Daten, Hypothesen, Evidence, Studien, Tests & Ausbruch (Für Veterinärmediziner/innen)

Zu den Themen Daten, Hypothesen, Evidence, Studien, Tests & Ausbruch (Für Veterinärmediziner/innen)


Set of flashcards Details

Flashcards 292
Language Deutsch
Category Medical
Level University
Created / Updated 27.01.2015 / 18.06.2020
Weblink
https://card2brain.ch/box/epidemiologie_biostatistik
Embed
<iframe src="https://card2brain.ch/box/epidemiologie_biostatistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Varianz (Population)

Masszahl für die Abweichung aller Werte einer Variable von ihrem Erwartungswert (Mittelwert); beschreibt die Streuung der Messwerte einer Variablen innerhalb der Population. Die Varianz einer Population wird durch das griechische Symbol σ2 beschrieben. Für den Varianzschätzer aus einer Stichprobe wird das Symbol s2 verwendet.

Beschreiben Sie die Varianz als Funktion

Die Varianz (s2) ist eine Funktion der Summe der quadrierten Abweichungen aller Einzelmesswerte vom arithmetischen Mittelwert der Werte einer Intervall-Variablen;

die Standardabweichung (SD, s) ist die positive Quadratwurzel der Varianz, und der Standardfehler (SEM) die Standardabweichung geteilt durch die Wurzel der Stichprobengrösse.

\(s^2 = {Summe(xi-x)^2 \over n-1}\)und \(SD = s = \sqrt{s^2}\) und \(SEM = {s \over \sqrt{n}}\)

wobei x= Summe (Addition von 1 bis n), SD = Standardabweichung, SEM = Standardfehler der Messwerte der Variablen x

Standardabweichung

Die Standardabweichung (SD) ist die positive Quadratwurzel der Varianz, kann zur Beschreibung der Breite des Wertebereiches (unter Annahme der Normalverteilung) verwendet werden. Für die Populations-SD wird , für die Stichproben-SD das Symbol s verwendet.

Bei Normal-verteilten Daten kann die Standardabweichung dazu benutzt werden, sogenannte Vertrauensintervalle (Konfidenz-Intervalle, englische Abkürzung CI) zu berechnen.

Bei Stichproben wird die Standardabweichung und der daraus zusätzlich berechnete Standard-Fehler für die Berechnung derjenigen Intervalle eingesetzt, in denen wir den entsprechenden Populationsparameter mit entsprechender Sicherheit erwarten können.

Standardfehler

Abgekürzt SEM; berechnet sich aus Standardabweichung (SD) geteilt durch die positive Quadratwurzel der Stichprobenzahl (n), wird zur Berechnung des Vertrauensintervalls für die Schätzung des Stichproben-Mittelwertes eingesetzt.

Vertrauensintervall (Konfidenzintervall)

Das Vertrauensintervall (Abkürzung CI) beschreibt den Wertebereich, in welchem wir den (wahren) Populationsparameter basierend auf den Resultaten einer Studie (Stichprobe) mit angegebener Wahrscheinlichkeit (beispielsweise 95%) erwarten. Je nach Fragestellung wird für die Berechnung die Standardabweichung (SD) oder der Standardfehler (SEM) benutzt.

Für Populationen schätzen (beschreiben) diese dann den Wertebereich (Intervall), in dem die zentralen 90%, 95% oder 99% (je nach Vorgabe) aller Messwerte liegen (= den sogenannten „Normalbereich“ – ein Beispiel sind die von  Kinderärzten benutzten Wachstumskurven).

Welche Elemente sollte das "Werkzeug" Grafik immer enthalten?

Grafiken sind ein sehr gängiges „Werkzeug“, um Daten umfassend / zusammenfassend darzustellen, und den Leser gezielt auf wichtige Dinge aufmerksam zu machen. Sie sollten immer die folgenden Elemente enhalten:

* Abbildungslegende UNTER der eigentlichen Grafik, in der die wichtigsten Inhalte der Abbildung sowie die Quelle der Daten angegeben wird.
* Klare Achsenbezeichnungen mit Angabe der Mess-Einheiten
* Gruppen-Legenden bei Darstellung mehrerer Gruppen

Auf zu viele Farben, Muster und 3D-Effekte sollte besser verzichtet werden; diese erhöhen nicht unbedingt die Lesbarkeit.

Balkendiagramm, Säulendiagramm, Tortendiagramm

Balken-, Säulen- und Tortendiagramme dienen der visuellen Beschreibung (Darstellung) von Häufigkeiten oder Proportionen (%) der Klassen einer nominalen oder ordinalen Variable.

Histogramm

Ein Histogramm ist eine graphische Darstellung der Häufigkeitsverteilung von Intervall-Daten (kontinuierlich). Dabei wird der Gesamt-Wertebereich in (meist) gleich grosse (breite) Klassen eingeteilt (X-Achse), und die Anzahl (Frequenz) oder Anteil (Proportion) Messwerte je Klasse auf der Y-Achse aufgetragen. Dieses führt zu einer empirischen (gemessenen) Häufigkeitsverteilung. Histogramme sind erst bei einer grösseren Anzahl von Messwerten (> 30) sinnvoll.

Extremwerte, Ausreisser

Messwerte einer Variablen, welche deutlich ausserhalb des „normalen Spektrums“ liegen, werden als Aussreisser bezeichnet und in entsprechenden Graphiken und statistischen Testverfahren also solche gekennzeichnet. Ausreisser können einen grossen Einfluss auf Parameterschätzungen und statistische Testverfahren haben.

Kistendiagramm (Box plot)

Der Boxplot dient der graphischen Darstellung der Verteilung von Messwerten einer Intervall-Variablen und ist auf Quartilen aufgebaut. Die Box umfasst die 25, 50 (Median) und 75%ile, die sogenannten Federn (Striche) den verbleibenden Wertebereich. In einigen Statistik-Programmen werden Extremwerte (Ausreisser) gesondert (ausserhalb der Federn) als Sterne oder Kreise angezeigt.

Punkte-, Streu- oder Liniendiagramm

Diagramm, in der die (Streuung der) Messpunkte basierend auf zwei Variablen (X-Achse, Y-Achse) aufgezeigt wird. Die Punkte können, müssen aber nicht durch eine Linie verbunden sein.

Wahrscheinlichkeit

Die Wahrscheinlichkeit wird durch das Verhältnis der günstigen (uns interessierenden) Ereignisse zu allen möglichen Ereignissen bestimmt, wobei die Anzahl der günstigen Ereignisse und die Anzahl der möglichen Ereignisse klar bestimmt werden kann. Wahrscheinlichkeiten eines relevanten Ereignisses können aus einer grösseren Anzahl
Beobachtungen (Häufigkeitsverteilung) empirisch geschätzt oder durch eine theoretische Wahrscheinlichkeits-Verteilung (Funktion) beschrieben werden.

\({günstige Ereignissse \over mögliche Ereignisse}\)

Nennen Sie 3 einfache Grundsätze im Umgang mit "echten" Wahrscheinlichkeiten

Ein paar einfache (weil logische) Grundsätze im Umgang mit „echten“ Wahrscheinlichkeiten:

* Es gibt keine Wahrscheinlichkeiten unter 0 und über 1 (100%);
* Etwas, dass nie vorkommen kann, hat die Wahrscheinlichkeit 0, und etwas, dass immer vorkommt, die Wahrscheinlichkeit 1;
* Wenn Ereignisse nie gleichzeitig auftreten können, dann schliessen sie sich gegenseitig aus (Kopf und Zahl einer Münze).

Wahrscheinlichkeitsregel 1+2

* Bei mehreren sich gegenseitig ausschliessenden Ereignissen A und B aus einer Gesamtheit ist die Wahrscheinlichkeit, dass eines von zwei Ereignissen (A oder B) eintritt, die Summe der Einzel-Wahrscheinlichkeiten;
* In einer Situation mit genau zwei möglichen sich gegenseitig ausschliessenden Resultaten (Ergebnissen) muss die Gesamtwahrscheinlichkeit (Summe) des Auftretens beider Ereignisse P(A) + P(B) = 1 sein. Dieses ist das Additiv-Gesetz

Wahrscheinlichkeitsregel 3

* Die Wahrscheinlichkeit des gleichzeitigen Auftretens von zwei voneinander unabhängigen Ereignissen aus unterschiedlichen Ereignisräumen ist das Produkt (Multiplikation) der (voneinander unabhängigen) Einzelwahrscheinlichkeiten (Beispiel zwei 6er-Würfel mit Zahl 1 durch den ersten und Zahl 2 durch den zweiten Würfel);
Multiplikationsgesetz

Wahrscheinlichkeitsregel 4

* Wenn die Wahrscheinlichkeit eines Ereignisses A eine Untermenge des Auftretens des Ereignisses B ist (also A nur dann auftreten kann, wenn B bereits zutrifft), nennt man dieses eine konditionelle Wahrscheinlichkeit, und die  Wahrscheinlichkeit des Auftretens von A kann nie grösser sein als die von B.
Gesetz der konditionellen Wahrscheinlichkeit (modifiziertes Multiplikationsgesetz)

Liegt KEINE konditionelle Abhängigkeit vor, dann ist P(A) unabhängig von P(B) und P(A|B) = P(A)

Bedingte Wahrscheinlichkeit

Wahrscheinlichkeit von Ereignis B unter der Voraussetzung (konditionell), dass bereits Ereignis A zutrifft.         Schreibweise P(B|A).

Venn-Diagramm

Zur Darstellung entsprechender Zusammenhänge zwischen Ereignisräumen, Wahrscheinlichkeiten und deren Zusammenhängen werden neben den o.a. Formel häufig sogenannte Venn-Diagramme eingesetzt.

Wird durch zwei Kreise dargestellt, die sich auch überschneiden können = Schnittmenge

Theoretische Wahrscheinlichkeitsverteilungen

Im Umgang mit Wahrscheinlichkeiten von Ereignissen stossen wir in der Natur immer wieder auf Phänomene, die wir (a) messen können (ggf. müssen) und deren Messwerte (b) hinsichtlich Verteilung der Frequenzen gewissen Gesetzmässigkeiten folgen, welche durch theoretische Wahrscheinlichkeitsverteilungen beschrieben werden können.

Verteilung

Die Messwerte einer Variablen folgen jeweils einer für sie charakteristischen Häufigkeits-Verteilung. Diese Verteilung kann beispielweise „normal“ oder „schief“ sein. Empirische Häufigkeits-Verteilungen werden durch das Sammeln und  Beschreiben vieler Messdaten erzeugt.

Binomialverteilung

Diskrete Häufigkeitsverteilung der Anzahl “Erfolge” (erwünschter Ereignisse, bspw. Kopf) in einer Serie von (n)  voneinander unabhängigen Wiederholungen eines Versuches (Experimentes), in dem es bei jedem Versuch nur zwei  Möglichkeiten (Kopf, Zahl) mit jeweils definierten Erfolgswahrscheinlichkeiten gibt. Eine solche Testserie wird auch Bernoulli-Experiment / -Versuch genannt. Bei n=1 entspricht die Binominal-Verteilung der Bernoulli-Verteilung.

Nennen Sie ein Beispiel anhand dem die Binominal-Verteilung veranschaulicht werden kann.

Die Binomial-Verteilung ergibt sich auf einer Serie von sogenannten Bernoulli-Versuchen, jeweils mit zwei möglichen Ausgängen. Sie kann anhand des Galton-Brettes veranschaulicht werden; auf jeder Stufe des Brettes hat die Kugel die Möglichkeit, nach rechts (X=1) oder links (X=0) zu fallen.

* Ist das Galton-Brett richtig konstruiert, dann ist auf jeder Ebene die Einzelwahrscheinlichkeit, nach rechts (oder links) zu fallen, 0.5 (50%), und die Wahrscheinlichkeiten zwischen den Ebenen sind unabhängig voneinander.
* Jeder Pfad vom Trichter zu den Sammelröhren am Ende beinhaltet in Galton-Brett (Abbildung links) 6 Ebenen.
* Von allen Wegen führt jeweils eine fest definierte Gruppe (Anzahl) zu einem spezifischen Sammelröhrchen, und die Wahrscheinlichkeit für eine Kugel, in einem Röhrchen zu enden, kann entweder über viele Versuchs-Wiederholungen ausgezählt (empirische Frequenzverteilung) und somit geschätzt oder über die diesen Prozess beschreibende Binomial-Verteilung exakt berechnet werden.
* Um nach ganz links zu gelangen, muss die Kugel beispielsweise an allen 6 Gabelungen nach links fallen und keinmal nach rechts (R=0); um zur Mitte zu gelangen, 3x nach rechts und für rechts aussen 6x nach rechts fallen (R=6)

Die recht komplexe Binomial-Funktion erlaubt uns nun in diesem Kontext, die Häufigkeit (Frequenz) zu berechnen, mit der wir ein entsprechendes Resultat (Kugel in erster Säule; R=0=k) aus n=6 Versuchen (Ebenen) mit  Einzelwahrscheinlichkeit p=0.5 erwarten können: \(Binominal-Wahrscheinlichkeit (Kugel Geht Nach Ganz Links) = {n! \over(n-k)!k!}\) = 0.05625 (1.56%)

Normalverteilung

Die Normalverteilung, auch Gauss’sche Normalverteilung oder Glockenkurve genannt, ist symmetrisch, hat eine Glockenform, und wird durch zwei Parameter (Mittelwert und Varianz) beschrieben (Abkürzung N(µ, σ2)). Viele statistische Testverfahren beruhen auf der Annahme, dass die Messwerte „normal verteilt“ sind, also eine Häufigkeitsverteilung aufweisen, welche der einer Normalverteilung entspricht.

Die Normalverteilung, zuerst beschrieben durch den Mathematiker Gauss, ist eine kontinuierliche (stetige) Verteilung. Die Abweichungen (als Streuung) der (Mess-) Werte vom Mittelwert vieler natur-, wirtschafts- und  ingenieurswissenschaftlicher Vorgänge lassen sich durch die Normalverteilung entweder exakt oder wenigstens in sehr guter Näherung beschreiben.

!Wichtig zu merken!: es gibt nicht EINE Normalverteilungskurve, sondern eine ganze Kurven-Schar, welche durch Variationen der zwei Parameter Mittelwert (μ) und Varianz (σ2) erzeugt werden.

Die STANDARD-Normalverteilung hat den Mittelwert 0 und die Varianz 1.

Welche statistisch wichtigen Eigenschaften hat die Normalverteilung? (Repetition)

* Sie ist Spiegel-Symmetrisch um den Mittelwert
* Ihre Standardabweichung (SD) ist die positive Quadrat-Wurzel der Varianz (also σ)
*  ~68.3 % aller Messwerte liegen im Intervall von +/- 1 σ vom Mittelwert,
*  ~95.5 % aller Messwerte liegen im Intervall von +/- 2 σ vom Mittelwert,
*  ~99.7 % aller Messwerte liegen im Intervall von +/- 3 σ vom Mittelwert.

Messdaten, welche auf der natürlichen biologischen Variabilität von Individuen beruhen, sind häufig annähernd „normal“ verteilt. Ein Beispiel sind die Körpergrössen von Erwachsenen (Frauen und Männer)

Poisson-Verteilung

Diskrete Wahrscheinlichkeitsverteilung, die beim mehrmaligen Durchführen eines Bernoulli-Experiments entsteht. Führt man ein solches Experiment sehr oft durch und ist die Erfolgswahrscheinlichkeit gering (Ereignis selten), so ist die Poisson-Verteilung eine gute Näherung für die entsprechende Wahrscheinlichkeitsverteilung. Die jeweilige Form der Poisson-Verteilung wird durch den Wert lambda (λ), welcher gleichzeitig Mittelwert und Varianz ist, bestimmt.   

Wie bei der Normal- und der Binomial-Verteilung ergeben sich für unterschiedliche Eingabewerte auch verschiedene Wahrscheinlichkeitsverteilungen (Kurven).

Nennen Sie ein Beispiel aus dem Leben zur Poisson-Verteilung

Die Blitzhäufigkeit in Westeuropa beträgt durchschnittlich 10 Einschläge pro km² und Jahr; dieses entspricht in etwa 0.1 Einschläge pro ha Fläche und Jahr. Mittels Poisson-Verteilung (welche diesen Prozess recht gut beschreibt) kann man die Wahrscheinlichkeit berechnen, dass es in einer Parzelle von 1 ha zu genau n Blitzeinschlägen pro Jahr kommt. Aus λ = 0.1 Einschläge pro Hektar und Jahr (λ =Mittelwert und Varianz der Poisson-Verteilung) folgt:

* P λ=0.1(n = 0) (kein Einschlag im betrachteten Jahr): 90%
* P λ=0.1(n = 1) (ein Einschlag im betrachteten Jahr): 9%
* P λ=0.1(n = 2) (zwei Einschläge im betrachteten Jahr): 0.5%
* P λ=0.1(n = 3) (drei Einschläge im betrachteten Jahr): 0.02%

Statistisch gesehen ist es somit nicht verwunderlich, wenn ein Blitz innerhalb von 200 Jahren zweimal am gleichen Ort einschlägt, wobei es praktisch unmöglich ist, diesen Ort voraussagen zu können.

Schiefe Verteilung

Als schiefe Verteilungen bezeichnet man solche, die deutlich NICHT-symmetrisch sind. Sie entstehen durch wenige (im Verhältnis) sehr grosse Messwerte auf einer Seite der Verteilung (links = linksschief; rechts = rechtsschief). Diese Extremwerte haben starken Einfluss auf Parameter, welche die Symmetrie der Verteilung voraussetzen (insbes. Mittelwert und Varianz / Standardabweichung).

Bei einer rechts- oder links-schiefen Verteilung ist eine Seite der Häufigkeitsverteilung deutlich länger als die andere, die Kurve ist nicht spiegel-symmetrisch. Es gibt rechts- und links-schiefe Verteilungen. Für die statistische Auswertung von schiefen Verteilungen sind spezielle statistische Verfahren erforderlich.

Hypothese

Eine Hypothese (gr. hypóthesis= ‚Unterstellung‘, ‚Voraussetzung‘, ‚Grundlage‘) ist eine Aussage, deren Gültigkeit angenommen wird, aber noch nicht bewiesen ist.
Eine Hypothese
1. ist prinzipiell der sinnlichen Erfahrung zugänglich (empirisch)  --> Hören, Sehen, etc.
2. ist prinzipiell widerlegbar (falsifizierbar)
3. beansprucht eine gewisse Allgemeingültigkeit und ist theoretisch begründet

Nennen Sie ein Beispiel für einen t-Test

Beispiel t-Test für eine Stichprobe
Es ist bekannt, dass Hausschweine ca. 100 kg im Alter von sechs Monaten wiegen. Ein Mäster, dessen Betrieb Schweine hat, die durchschnittlich 100 kg mit sechs Monaten wiegen, verwendet ein neues Futtermittel. Er hat den Eindruck, dass seine sechs Monate alten Schweine mit dem neuen Futtermittel ein höheres Gewicht haben. Er möchte wissen, ob sich diese Beobachtung bestätigen lässt. Im statistischen Jargon hiesse das, er möchte seine Hypothese testen, dass seine Schweine mit dem neuen Futtermittel signifikant mehr wiegen als der Durchschnitt mit sechs Monaten.
Wenn er z.B. 36 Tiere aus dem letzten Mastdurchgang nimmt und ihr Gewicht mit sechs Monaten
bestimmt, lässt sich seine Frage als Hypothese für einen statistischen Test so formulieren:
H0: μ ≤ 100 kg
HA: μ > 100 kg

Beim Hypothesentesten gibt es zwei Hypothesen, die Nullhypothese H0 und die Alternativhypothese HA. Der Mittelwert der Population (hier der Schweine mit sechs Monaten) wird mit μ bezeichnet.

Nullhypothese

Die Nullhypothese (H0) sagt, dass es keinen Unterschied gibt bzw. die Stichproben aus der gleichen Grundgesamtheit kommen. Es wird beim Hypothesentesten die Entscheidung getroffen, ob eine Nullhypothese auf Basis der erhobenen Daten abgelehnt (verworfen werden kann oder nicht). Unter der Nullhypothese wird diejenige Behauptung oder Annahme formuliert, die man mittels statistischen Tests ablehnen möchte.

"Die Alles-nur-Zufall!-Aussage" mit einer bestimmten Wahrscheinlichkeit

Die Nullhypothese (H0) aus dem Beispiel lautet in Worten: das mittlere Gewicht der der Schweine beträgt 100 kg oder weniger.

Alternativhypothese

Die Alternativhypothese (HA) sagt, dass es einen signifikanten Unterschied (Assoziation, Effekt oder Wirkung) gibt bzw. die Stichproben aus verschiedenen Grundgesamtheiten stammen. Die Alternativhypothese wird angenommen, wenn die Nullhypothese abgelehnt wurde. In der Regel ist die Alternativhypothese das, was der Untersuchende „nachweisen“ möchte oder was ihn motiviert hat, eine Studie durchzuführen.

"Die es-ist-nicht-Zufall-Aussage" mit einer bestimmten Wahrscheinlichkeit

Die Alternativhypothese (HA) im Beispiel lautet, dass das mittlere Gewicht der Schweine mehr als 100 kg beträgt. Ein andere Formulierung wäre, dass die Schweine mit dem neuen Futtermittel signifikant mehr als die durchschnittlichen 100 kg wiegen.

Statistischer Test, Testverfahren

Nennen Sie 5 Beispiele

Mit einem statistischen Testverfahren kann man prüfen, ob erhobene Daten für eine Hypothese sprechen oder ob sich diese Daten auch durch zufallsbedingte Abweichungen erklären lassen. Dafür wird eine Test-oder Prüfgrösse (Zahl) berechnet, welche die Differenz zwischen angenommender H0-Situation und den erhobenen Daten reflektiert,
und letztendlich eine Entscheidung zwischen den beiden sich gegenseitig ausschliessenden Hypothesen (H0 und HA) ermöglicht.

Beispiele für elementare statistische Tests sind der t-Test, der Wilcoxon-Rangsummen-Test, der exakte Test nach Fisher, der Chiquadrat-Test und Varianz-Analysen (ANOVA).

p-Wert

Der p-Wert gibt die Wahrscheinlichkeit an, dass das Ergebnis oder Ergebnisse der Studie (Stichprobe) mit noch extremeren Werten auftreten, unter der Annahme, dass die Nullhypothese H0 zutrifft .

Er gibt einen Hinweis darauf, wie stark die Evidenz gegen die Nullhypothese ist. Je niedriger er ist, desto unwahrscheinlicher ist die Nullhypothese. Üblicherweise wird ein Schwellenwert (p=0.05) ausgewählt, unterhalb dessen die Nullhypothese abgelehnt und stattdessen die Alternativhypothese akzeptiert wird. Ein signifikanter p-Wert bedeutet nicht automatisch, dass es einen kausalen Zusammenhang gibt, dass das Ergebnis klinisch relevant oder von wissenschaftlicher Bedeutung ist.

Der p-Wert beschreibt den Grad an statistischer Signifikanz. Üblicherweise wird ein Signifikanzlevel von p< 0.05 (Konvention) gewählt. Mit dem p-Wert wird also angedeutet, wie wahrscheinlich das Ergebnis im Vergleich zur „Erwartung“ basierend auf der H0 ist: je kleiner der p-Wert, desto mehrspricht das Ergebnis gegen die Nullhypothese.

„Der p-Wert ist die Wahrscheinlichkeit, dass die Nullhypothese stimmt“ - Ist diese Aussage richtig?

NEIN!

Das diese Aussage falsch ist, lässt sich daran erkennen, dass der p-Wert definiert ist unter der Annahme, dass die Nullhypothese zutrifft. Sie kann nicht gleichzeitig angenommen werden und falsch sein.

> Ein häufiges Missverständnis zum p-Wert! <

Signifikanz(-level oder -niveau)

Die maximal zulässige oder akzeptierte Irrtumswahrscheinlichkeit bei der Entscheidung über die Annahme der HA wird als Signifikanzniveau α (alpha) bezeichnet. Beispielsweise bedeutet α = 0.05, dass die maximal zulässige Wahrscheinlichkeit für irrtümliches Ablehnen einer eigentlich richtigen Nullhypothese (Annehmen der HA) 5 % beträgt (Fehler 1. Art).

Die Signifikanz hat auch damit zu tun, wie streng man mit seiner Umfrage/Hypothese umgehen will.

Einseitig testen

Für δ = Differenz zwischen Mittelwerten, Medianen oder Proportionen von zwei Gruppen: bei einseitigem Testen sind die Nullhypothese H0: δ = 0 und die zwei möglichen Alternativhypothese HA: δ > 0 oder HA: δ < 0. Hierzu bedarf es einer plausiblen biologisch belegbaren Begründung, warum ein Unterschied nur in einer Richtung plausibel ist.

Bei dem Beispiel mit dem Mäster ging es darum, eine Aussage zu treffen, ob die Tiere aus dem Mastdurchgang mit dem neuen Futter mehr wiegen. Hier wurde „einseitig“ gefragt.

Zweiseitig testen

Für δ = Differenz zwischen Mittelwerten, Medianen oder Proportionen von zwei Gruppen: bei zweiseitigem Testen sind die Nullhypothese H0: δ = 0 und die Alternativhypothese HA: δ ≠ 0.

Beim Mäster-Beispiel ist es natürlich auch denkbar, dass die Tiere mit dem neuen Futtermittel weniger wiegen. Oder, dass die Frage lautet, ob sich das Gewicht der Tiere mit dem neuen Futtermittel signifikant von den üblichen 100 kg
unterscheidet (und man vorher nicht weiss in welcher Richtung).
Dann liesse sich die statistische Hypothese so formulieren und wäre „zweiseitig“:
H0: μ = 100 kg
HA: μ ≠ 100 kg

Hypothesentest

Zusammengefasst ist ein Hypothesentest nichts anderes als eine Prozedur zur Entscheidung zwischen zwei sich gegenseitig ausschliessenden Annahmen: der Nullhypothese (H0) und der Alternativhypothese (HA).

Das Konzept des Hypothesentestens lässt sich natürlich nicht nur auf die Frage nach Unterschieden zwischen einem Gruppenmittelwert und einem bekannten Populationsmittelwert anwenden, sondern auch auf die Frage nach Unterschieden zwischen zwei oder mehr Gruppenmittelwerten oder -medianen, nach unterschiedlichen Proportionen in zwei oder mehr Gruppen u.a.m..

Aus welchen sechs Schritten besteht das Standardschema jedes Hypothesentests?

1. Aufstellung von Nullhypothese und Alternativhypothese
* Was soll überprüft werden (z.B. unterscheiden sich die Mittelwerte oder Proportionen zwischen Gruppen)?
* Wie viele Vergleichsgruppen (eins, zwei oder mehrere)?
* Zweiseitig oder einseitig formulierte Alternativhypothese?
2. Prüfung der Bedingungen für die jeweiligen Testverfahren
* Abhängige oder unabhängige Messwerte?
* Prüfung auf Normalverteilung (parametrischer oder nicht-parametrischer Test)
* Gleiche oder ungleiche Varianzen (bei kontinuierlichen Daten)
3. Wahl eines Prüfverfahrens („Test“) bzw. einer Prüfgrösse (z.B. t, W, χ2)
4. Festlegung der Irrtumswahrscheinlichkeit α (des Signifikanzniveaus)

5. Testdurchführung
* Berechnung des empirischen Wertes der Prüfgröße mit den Daten der Stichprobe
* Ermittlung des P-Wertes und prüfen, ob statistische Signifikanz vorliegt
6. Entscheidung über Annahme oder Ablehnung der Nullhypothese und Interpretation der Testergebnisse

(In Statistikprogrammen wie NCSS, SPSS, R oder auch in einer Excel-Anwendung wird der Schritt 5 teilweise automatisch durchgeführt und es folgt eine Darstellung der Ergebnisse ohne Zwischenresultate.)

α, α-Fehler, Fehler 1. Art

Der Fehler besteht darin, die Nullhypothese abzulehnen, obwohl diese zutrifft. Der α-Fehler wird mit der Irrtumswahrscheinlichkeit und dem Signifikanzlevel (α ) gleichgesetzt. Er sollte vor der Testdurchführung festgelegt werden. Er kann nicht durch den Stichprobenumfang beeinflusst werden.

In vielen Bereichen (auch in der Tiermedizin) ist ein α von 0.05 üblich. In einigen exakten Wissenschaften wie z.B. der Physik wird auch mit kleineren α gearbeitet (z.B. 0.01 oder 0.001).

(Man sagt z.B.: "Mein Test besagt, dass Männer grösser sind als Frauen." In der Realität trifft das aber nicht zu sondern ist rein zufällig.)