Epidemiologie & Biostatistik
Zu den Themen Daten, Hypothesen, Evidence, Studien, Tests & Ausbruch (Für Veterinärmediziner/innen)
Zu den Themen Daten, Hypothesen, Evidence, Studien, Tests & Ausbruch (Für Veterinärmediziner/innen)
Set of flashcards Details
Flashcards | 292 |
---|---|
Language | Deutsch |
Category | Medical |
Level | University |
Created / Updated | 27.01.2015 / 18.06.2020 |
Weblink |
https://card2brain.ch/box/epidemiologie_biostatistik
|
Embed |
<iframe src="https://card2brain.ch/box/epidemiologie_biostatistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>
|
Epidemiologie
Definition
Unterscheidungen
Studium des Auftretens von gesundheitsrelevanten Ereignissen (bspw. Krankheit) und den sie beeinflussenden Faktoren (Risiken) in Populationen.
Man unterscheidet unter anderem zwischen beschreibender Epidemiologie, analytischer Epidemiologie und experimenteller Epidemiologie.
Was sind die 5 W-Fragen im Kontext von Krankheiten?
Wer? --> Betroffene Individuen
Wo? --> Ort(e) des Auftretens der Krankheit (geografische Verteilung)
Wann? --> Zeit(en) des Auftretens (zeitliche Verteilung)
Wie viele? --> „Menge“ des Auftretens (Häufigkeit)
Warum? --> Gründe für das Auftreten (Ursachen = „Risikofaktoren“)
Was sind die Anwendungsgebiete der Epidemiologie in der Veterinärmedizin?
(6 Punkte)
* Untersuchen von Krankheitsausbrüchen (Epidemien): wo kommen sie her? Wie kann man sie bekämpfen? Beispiel: Blauzungenkrankheit in Europa (2006-2008);
* Welche Tiere erkranken an einer bestimmten Krankheit besonders häufig und was ist der Grund dafür? Beispiel: Veranlagung für Hüftgelenkserkrankungen (HD) bei bestimmten Hunderassen;
* Wie gross ist die Chance, eine bestimmte Erkrankung mit Methode (Operation oder konservativ) zu behandeln? Beispiel: Koliken beim Pferd;
* Ist die Massenimpfung gegen bestimmte Seuchen wirksam / gerechtfertig? Beispiel: Impfen gegen Blauzungenkrankheit bei Tieren (2008) oder „Schweinegrippe“ beim Menschen (2009);
* Was ist die Aussagekraft eines Laborresultats? Beispiel: Schwangerschaftstest bei Frauen oder HIV-Untersuchung von gesunden Blutspendern.
Statistik
Statistik ist eine (mathematische) Disziplin, welche sich insbesondere mit der Analyse, Interpretation und Präsentation von Daten befasst. Sie lässt sich ebenfalls in mehrere Bereiche unterteilen (siehe spätere Karte)
Statistik ist die Lehre von Methoden zum Umgang mit quantitativen Informationen (Daten). Sie ist eine Möglichkeit, eine systematische Verbindung zwischen Erfahrung (Empirie) und Theorie herzustellen, und stellt dafür eine Sammlung von Methoden bereit, um Daten zu analysieren.
In welche drei Bereiche lässt sich die Statistik unterteilen?
Deskriptive Statistik: (auch beschreibende Statistik oder empirische Statistik): Vorliegende Daten werden in geeigneter Weise beschrieben, aufbereitet und viele Daten (= Information) in Tabellen und Abbildungen komprimiert (zusammengefasst).
Induktive Statistik: (auch mathematische Statistik, schließende Statistik oder Inferenzstatistik): In der induktiven Statistik leitet man aus den Daten einer Stichprobe Eigenschaften einer Population (Grundgesamtheit) ab, und vergleicht diese dann zwischen Populationen oder Gruppen.
Explorative Statistik: (hypothesen-generierende Statistik, Datenschürfung (data mining)): Mittels deskriptiver Verfahren und induktiver Testmethoden sucht sie systematisch mögliche Zusammenhänge (oder Unterschiede) zwischen Daten in vorhandenen Datenbeständen. Die so gefundenen Ergebnisse lassen sich als Hypothesen verstehen, welche durch weitergehende gezielte Studien bestätigt werden müssen.
Was ist der Unterschied zwischen der Tätigkeit eines Individualmediziners und der eines Epidemiologen/Statistikers?
Die Tätigkeit des Individualmediziners/-medizinerin, des/der Epidemiologen/Epidemiologin und des/der Statistikers / Statistikerin sind in ihren Abläufen grundätzlich vergleichbar. Während sich erstere/r um Einzeltiere kümmert, „behandeln“ Epidemiologen und Statistiker Gesundheits- probleme in Populationen und extrahieren dabei Informationen aus (meist) grösseren Datenmengen.
Machen Sie eine Gegenüberstellung von Verantwortlichkeiten in Individual- und Populationsmedizin
(Verantwortliche, "Anamnese", Gezielte Untersuchungen, "Diagnose", "Therapie)
Individualmedizin:
Verantwortlich: Praktizierende(r) Tierarzt, Tierärztin
„Anamnese“: Erfasst Krankheitszustand am Einzeltier durch Beobachtungen am Tier, Befragung Besitzer und Entnahme von Proben für Laboruntersuchungen. Beschreibt Resultate (Krankheit) inkl. der klinischen Symptome (Bericht)
Gezielte Untersuchungen: Probenahme und Laboruntersuchungen zur besseren Identifikation von Fällen auf Einzeltierebene
„Diagnose“: Die (Verdachts-) Diagnose versucht, die verfügbaren Daten (Evidenz) zu einem Patienten mit bekannten Kausal-Zusammenhängen (Erfahrung, wissenschaftliche Erkenntnisse) zu verknüpfen
„Therapie“: kausale und / oder symptomatische Behandlung von erkrankten Individuen
Populationsmedizin:
Verantwortlich: Epidemiologe, Epidemiologin, Statistiker, Statistikerin
„Anamnese“: Deskriptive Epidemiologie / Statistik - Erfasst (epidemiologische Studie) und beschreibt (Statistik) die beobachtete Häufigkeit einer Krankheit über Zeit, Ort und betroffenen Gruppen von Individuen
Gezielte Untersuchungen: Untersuchung von repräsentativen „Stichproben“ zur Identifizierung von „Problemen“ in Populationen
„Diagnose“: Analytische Epidemiologie / Statistik - Untersucht die Ursachen für Krankheiten: Studie der Assoziation von Krankheiten und deren auslösenden Faktoren, Wirt und Umwelt (Studien, statistische Tests)
„Therapie“: Experimentelle Epidemiologie / Statistik - Erforschung von Interventionsmassnahmen auf Populationsebene (bspw. Wirksamkeit von Therapien oder Massnahmen zur Ausrottung von Krankheiten) durch Modellierungen (Simulationen)
„klinische Epidemiologie“
Alle Bereiche der Epidemiologie, die auch für klinische Fragestellungen (Diagnose, Behandlung, Prognose) relevant sind., werden unter dem Begriff „klinische Epidemiologie“ zusammengefasst.
Nennen Sie ein Beispiel für die enge Vernetzung zwischen Epidemiologie und Statistik
Bevölkerungs-Statistiken, in denen demographische Informationen zur Bevölkerung eines Landes im Rahmen von epidemiologischen Studien (Auswahl und Befragung von Individuen) gesammelt und diese Informationen dann statistisch ausgewertet (zusammengefasst; „kondensiert“) werden:
Nennen sie 3 relevante Definitionen der Weltgesundheitsorganisation (WHO)
Gesundheit (Health): ist der Zustand eines vollständigen physischen, psychischen und sozialen Wohlbefindens und nicht nur die Abwesenheit von Krankheit oder Einschränkung / Behinderung.
Öffentliche Gesundheit (Public Health): umfasst alle analytischen und organisatorischen Anstrengungen, die sich mit der Erkennung von Gesundheitsproblemen in der Bevölkerung, ihrer Verbesserung oder ihrer Verhinderung beschäftigen. Public Health bezieht sich auf Populationen und organisierte Systeme der Gesundheitsförderung, der Krankheitsverhütung (Prävention), der Krankheitsbekämpfung, der Rehabilitation und der Pflege (Walter u. Paris, 1996).
Veterinärmedizinisch relevante öffentliche Gesundheit (Veterinary Public Health = VPH): ist der Beitrag zum vollständigen physischen, psychischen und sozialen Wohlbefinden (Health) von Menschen durch das Verstehen und Anwenden Tiermedizinischen Wissens (übersetzt von der englischen Definition der (WHO 1999).
Zoonose
Griechisch zoon „Lebewesen“ und nosos „Krankheit“: von Tier zu Mensch und von
Mensch zu Tier natürlicherweise übertragbare Krankheiten.
Im Kontext von VPH befassen wir Veterinärmediziner uns auch regelmässig mit sogenannten Zoonosen. Früher bezeichnete man in diesem Kontext Krankheiten, die vom Mensch auf ein Tier übertragen werden können, als Anthropozoonosen, und solche, die vom Tier auf den Menschen übertragen werden, als Zooanthroponosen; heute wird einheitlich der Begriff Zoonose verwendet. Beispiele sind Tollwut (Rabies), Toxoplasmose und „Vogelgrippe“ (Influenza H5N1).
Was sind die Ziele der Epidemiologie?
(9 Beispiele)
* Ursachen von Krankheiten erforschen
* Evaluation von Ursachen und Übertragung von Krankheiten mit bekanntem Erreger
(Aetiologie). Beispiele: Salmonellose-Durchfall
* Bekämpfung und Prävention von Krankheiten, deren Ursache vorerst nicht bekannt ist.
Beispiel: Rinderwahnsinn (Bovine spongiforme Encephalopathie, BSE)
* Verbesserung der allgemeinen Gesundheit der Population. Beispiel: Verbesserung der
Haltungssysteme bei Legehennen, Massnahmen gegen Euterentzündungen (Mastitis) bei
Milchkühen
* Grundlagen für die Therapie erarbeiten
* Prüfen der Wirksamkeit von Therapiemethoden, Diagnostik und Prognosen. Beispiel:
Klinische Studien von Impfstoffen
* Grundlagen für die Kontrolle und Prävention erarbeiten
* Planen und Überprüfen von Bekämpfungsprogrammen, Kosten-Nutzen Analysen. Beispiel:
BSE, Aviäre Influenza (Vogelgrippe), Blauzungenkrankheit
* Verbesserung der menschlichen Gesundheit durch Verringerung von Zoonose-Erregern in
Lebensmitteln tierischer Herkunft. Beispiele: Salmonellen, Campylobacter
Was sind die wichtigsten Aktivitäten von Epidemiologen und Epidemiologinnen?
Welches sind die wichtigsten Werkzeuge die sich daraus ergeben?
Daten sammeln, verarbeiten und auswerten, und die Resultate kommunizieren.
Werkzeuge:
* Epidemiologische Studien, oft mit Fragebögen (Sammlung von Informationen)
* Datenbanken (Speicherung, Archivierung der Informationen)
* Statistische Methoden (Auswertung, Interpretation)
Hypothese (Wissenschaftliche)
Eine wissenschaftliche Hypothese ist eine ausformulierte Vermutung / Frage, welche
mittels Erhebung, Auswertung und Interpretation von Daten beantwortet werden soll.
Im klinischen oder wissenschaftlichen Kontext formulieren wir zu den Werkzeugenm regelmässig Fragen oder Thesen (Hypothesen), welche wir dann mittels weitergehender Untersuchungen oder Studien zu beantworten versuchen. Auch bei John Snow stand am Anfang seiner Cholera-Episode sicher die Frage „Wieso sind die Cholera-Fälle so ungleichmässig verteilt?“.
Studie
Eine Studie beschreibt das Vorgehen, um eine explizit formulierte Fragestellung
(Hypothese) wissenschaftlich fundiert zu beantworten.
Bei einer epidemiologischen Fragestellung (Wie häufig kommt eine Krankheit in einer Population
vor? Welche Faktoren sind für das Auftreten einer Krankheit ursächlich verantwortlich?) formulieren
wir entsprechende Hypothesen und planen dann Studien, um diese Hypothesen wissenschaftlich
fundiert zu prüfen (zu beantworten).
Um eine Studie durchzuführen muss welche Fragestellung erst formuliert werden und wie fährt man danach fort?
Hierfür muss zuerst die Fragestellung bezüglich bestimmter Variablen von Interesse wie
beispielsweise Alter, Geschlecht oder Krankheitsstatus formuliert werden. Dann wird eine für die
Fragestellung geeignete Zielpopulation zur Beantwortung der Frage identifiziert und daraus (meist)
eine repräsentative Stichprobe von Individuen ausgewählt.
(Ziel-)Population einer Studie
Die (Ziel-) Population einer Studie umfasst alle Elemente (Individuen), auf welche die
Resultate der Studie extrapoliert werden sollen. Der Stichprobenrahmen (sampling frame)
beschreibt die Individuen (Elemente) aus der Zielpopulation, aus welcher die Teilnehmer
für eine Studie (zufällig) ausgewählt wurden. Zielpopulation und Stichprobenrahmen
stimmen nicht immer vollständig überein.
Stichprobe
Die Stichprobe beeinhaltet eine ausgewählte Gruppe von Elementen (Individuen) aus
einer Population. An diesen Individuen wird die Studie durchgeführt. Damit eine
Stichprobe repräsentativ für (bezüglich der für die Studie wichtigen Variablen
vergleichbar zusammengesetzt ist wie) die Population, sollte sie zufällig (randomisiert)
ausgewählt sein.
Variable
Variablen sind spezifische im Studienplan (Design) festgelegte Eigenschaften (wie
Geschlecht, Grösse, Haarfarbe, Blutdruck), für welche von allen Individuen in der
Stichprobe (Mess-) Werte erhoben / dokumentiert werden.
Die Messwerte der Variablen, welche wir in unseren Studien erfassen („messen“), können
verschiedene Formate haben. Entweder handelt es sich um Werte (Zahlen) auf einem
kontinuierlichen Zahlenstrahl (Temperatur in Grad Celsius vom absoluten Nullpunkt bis sehr heiss),
geordnete Klassen oder Kategorien (Schweregrad einer Erkrankung von mild bis sehr schwer) und
ungeordneten sich gegenseitig ausschliessenden Klassen (Hunderassen).
Auf welche Dinge hat das Format der Variablen Einfluss?
(3 Punkte)
* Vorgehensweise beim Erfassen (Messen) der Daten
* Methoden, mit denen die Information in den gemessenen Daten am besten
zusammengefasst (beschrieben) werden kann;
* Methoden, die zur weitergehenden (statistischen) Auswertung benutzt werden dürfen.
Es ist daher erforderlich, sich vor Beginn einer Studie und während der Auswertung ein klares Bild
von den vorliegenden Datenformaten zu machen.
Messwert
Messwerte sind die für jedes Individuum und jede Variable in der Erhebung (Stichprobe)
effektiv gemessenen Werte.
Parameter
Parameter sind aus allen Messwerten einer Variable ermittelte oder berechnete
Masszahlen, welche die Verteilung der Messwerte einer Variable in der Ziel-Population
beschreiben.
Schätzer, Schätzwert (bester)
Ein (bester) Schätzer oder Schätzwert ist der aus einer Stichprobe ermittelte
wahrscheinlichste Wert (maximum likelihood eximator) für einen Populationsparameter.
Zufallsfehler
Jede Schätzung eines Populationsparameters aus einer Stichprobe hat einen Zufallsfehler
(Unsicherheit) – hervorgerufen durch die zufalls-bedingte Streuung der Auswahl von
Individuen aus einem System mit biologisch bedingter Variabilität.
Unsicherheit
Die Unsicherheit eines Parameter-Schätzwertes beruht auf dem Stichproben-Konzept,
und wird durch das Vertrauensintervall ausgedrückt. Grössere Stichproben führen zu
kleinerer Unsicherheit (Zufallsfehler) und kleinere Stichproben zu grösserer Unsicherheit.
Intervall-Daten
Intervall-Daten (kontinuierliche Messdaten) können auf einem Zahlenstrang dargestellt
werden, und die Intervalle zwischen zwei Messpunkten haben an jeder Stelle des Strangs
die gleiche Bedeutung. Es gibt dabei Parameter mit einem definierten Nullpunkt / Anfang
(Minimum) und solche ohne definierten Nullpunkt.
Ordinale Daten
Ordinale Daten beschreiben ebenfalls Zustände einer Variablen, diese Zustände folgen
aber einer logischen Rangfolge (Ordnung). Diese Zustände können mit Worten (sehr gut,
gut, ausreichend, ungenügend) oder mit Zahlen (6,5,4,3) beschrieben werden. Je nach
Anzahl der Zustände (Klassen, Scores) können ordinale Daten wie nominale Daten oder
wie Intervall-Daten „behandelt“ (statistisch ausgewertet) werden.
Nominale Daten
(Kategorisch) Nominale Daten „beschreiben“ Zustände (verschiedene Klassen) einer Variablen. Ein
Beispiel ist Rasse; jede Rasse wird mit einem Namen benannt. In bestimmten Situationen
können diese Namen auch durch Zahlen (= Platzhalter; numerische Kodierung) ersetzt
werden. Eine binäre Variable (zwei Klassen, bspw. Geschlecht) ist der Extremfall einer
nominalen Variable.
Was versteht man unter "umkodieren" oder transformieren?
Was ist das Ziel einer solchen Umkodierung?
Das Datenformat kann im Rahmen der Auswertung geändert werden; dieses nennt man „umkodieren“ oder transformieren. Dabei werden beispielsweise Klassen von nominalen oder ordinalen Variablen zusammen gefasst, oder Messwerte von Intervall-Variablen werden „kategorisiert“, also in (ordinale) Klassen eingeteilt.
Ziel solcher Umkodierungen ist es, Fragestellungen (Hypothesen) besser / gezielter beantworten zu können.
(Ein Beispiel wäre eine Tabelle, in der Milchkühe basierend auf den gemessenen Körpergewichten (Variable) in Gruppen (ordinale Kategorien) von sehr leicht bis sehr schwer und im Extremfall in nurnoch zwei Klassen (leicht/schwer) eingeteilt wurden. Bei dieser Umkodierung von Intervall-Daten auf ordinate oder sogar binäre Klassen geht ein Teil der Information verloren; es ist vergleichbar mit der Reduzierung der Auflösung eines Bildes.)
Zähler & Nenner
Viele in der Epidemiologie und Statistik benutzte Masszahlen beruhen auf Fraktionen oder Verhältnissen (Brüchen). Diese bestehen aus dem Zähler und dem Nenner, wobei der Nenner den Zähler entweder beeinhaltet (einschliesst = Fraktion, Proportion) oder nicht (Verhältnis, Ratio).
Zähler: Der über dem Bruchstrich stehende Wert einer Proportion oder eines Verhältnisses (Ratios).
Nenner: Der unter dem Bruchstrich stehende Wert einer Proportion oder eines Verhältnisses (Ratios). Der Nenner darf nie 0 sein, da eine Division durch 0 nicht definiert ist.
(In Mathematik/Statistik-Jargon sehen Proportionen und Ratios dann so aus: Proportion = a / a+b
wobei der Nenner a+b = n das Total aller Individuen ist und den Nenner a beeinhaltet (Anteil Männer im 1 JK Vetmed, angegeben in Prozent von allen Studierenden).)
Proportion
Fraktion: Anzahl (Zähler) aller Individuen (Nenner), welche ein gewisses Merkmal aufweisen; wird oft in Prozent (%) zwischen 0 und 100 ausgedrückt.
Ratio = a/b wobei a und b voneinander unabhängige Werte sind (Verhältnis Männer zu Frauen im aktuellen Vetsuisse-Jahrgang).
Verhältnis (Quotient)
Quotient (Bruch), in welchem zwei eigenständige Grössen (Werte) miteinander numerisch in Beziehung gesetzt werden.
(In vielen Fachtexten, aber auch in allgemeineren Informationen von Behörden / Ämtern oder auch in der Presse und im Internet, werden Proportionen und Verhältnisse (in Form von einfachen Zahlen, Tabellen und Abbildungen) zur „schnellen“ und übersichtlichen Darstellung von Informationen in kondensierter Form eingesetzt.)
Deskriptive Statistiken (Repetition)
Deskriptive Statistiken versuchen, die in einem Datensatz (Stichprobe oder Population) enthaltene Information (in Form von Messwerten für verschiedene Variablen) zu kondensieren, also in definierten Parametern mit bekannten Eigenschaften zusammen zu fassen, um die Information so besser sichtbar zu machen und zwischen Stichproben / Gruppen / Populationen vergleichen zu können.
Hierzu werden gewissen Annahmen bezüglich Verteilung der Daten (Messwerte) gemacht - siehe später -
"Masszahlen der mittleren Lage"
Die sogenannten Masszahlen der mittleren Lage beschreiben die Position des durchschnittlichen (zu erwartenden) Wertes einer Variablen in der untersuchten Gruppe. Hierzu zählen bei Intervall-Daten der arithmetischen Mittelwert, der Median (50%til) sowie der Modus (mode). Letzterer benennt den am häufigsten beobachtenen Einzelmesswert und wird hier nicht weiter behandelt.
Lage-Parameter
Lage-Parameter beschreiben die Position (in Prozent aller rangierten Messwerte) von Einzelwerten.
Bei nominalen und meist auch bei ordinalen Variablen werden meist Proportionen (Anteile) verwendet, um die Information zu beschreiben. Nennen Sie die für die jeweiligen Datenformate am häufigsten eingesetzten Parameter:
Nominal, Ordinal & Intervall
Nominal (kategorisch):
Detail: Binär (z.B. JA/NEIN) Lage-Parameter: Anteil (Proportion, %); Detail: Mehrere Klassen Lage-Parameter: Anteile (Proportionen, %)
Ordinal (kategorisch):
D: wenige Klassen LP: Anteil (Proportion, %); D: Viele Klassen LP: Anteil (Proportion); D: Viele Klassen numerisch kodiert LP: Median, Perzentil, Minimum, Maximum
Intervall (kontinuierlich):
D: Normal verteilt LP: Mittelwert, Median, Perzentil, Minimum, Maximum; D: Nicht normal verteilt LP: Median, Perzentil, Minimum, Maximum
Mittelwert (Population)
Populationsparameter: Arithmetisches Mittel (Durchschnitt, Average) der
Einzelmesswerte (für eine spezifische Variable) aller Individuen einer Population. Hierzu
werden die Einzelmesswerte aufsummiert und das Resultat durch die Anzahl der
Messungen geteilt. Aus einer Stichprobe kann ein Schätzwert für den Populations-
Mittelwert berechnet werden. Der Mittelwert wird stark durch Extremwerte (Ausreisser)
beeinflusst. Aus einer Stichprobe kann der Populations-Mittelwert (Parameter) geschätzt
werden.
Median (Population)
Median (oder Zentralwert, 50%il) bezeichnet eine Grenze zwischen zwei Hälften einer Verteilung von nach Grösse rangierten (sortierten) Messwerten. Gegenüber dem arithmetischen Mittel, auch Durchschnitt genannt, hat der Median den Vorteil, robuster gegenüber Ausreißern (extrem abweichenden Werten) zu sein und sich auch auf ordinal skalierte Variablen anwenden zu lassen. Aus einer Stichprobe kann ein Schätzwert für den Populations-Median berechnet werden.
Der 50%il (50 Perzentil)-Wert bezeichnet genau die Mitte der nach Grösse der Messwerte rangierten Daten
Perzentile
Durch Perzentile (lat. „Hundertstelwerte“), auch Prozentränge genannt, wird eine Verteilung in 100 gleich große Teile (1-%-Segmente) unterteilt. Der 50%il-Wert ist derjenige, der ein Verteilung aller Messwerte halbiert (Median). Andere Perzentile
bezeichnen beispielsweise einen „Normalbereich“ (5%ile – 95%ile)
Der 25%il-Wert ist z.B.derjenige Wert, bei dem 25% aller Messwerte darunter und 75% darüber liegen etc.
Steuung
Die Steuung (Variation) oder Variabilität der Werte einer Intervall-Variablen wird durch die Parameter Varianz und Standardabweichung beschrieben.