Epidemiologie & Biostatistik

Zu den Themen Daten, Hypothesen, Evidence, Studien, Tests & Ausbruch (Für Veterinärmediziner/innen)

Zu den Themen Daten, Hypothesen, Evidence, Studien, Tests & Ausbruch (Für Veterinärmediziner/innen)


Set of flashcards Details

Flashcards 292
Language Deutsch
Category Medical
Level University
Created / Updated 27.01.2015 / 18.06.2020
Weblink
https://card2brain.ch/box/epidemiologie_biostatistik
Embed
<iframe src="https://card2brain.ch/box/epidemiologie_biostatistik/embed" width="780" height="150" scrolling="no" frameborder="0"></iframe>

Einfache, zweifache & dreifache Verblindung
 

Einfache Verblindung (single blind study): Patient/in oder Tierhalter/in weiss nicht, in welcher Behandlungsgruppe sie/er sich befindet.
Zweifache Verblindung (double blind study): Zusätzlich weiss auch der/die behandelnde Tierarzt/Tierärztin, welche(r) den Endpunkt erfasst („die Resultate abliest“) nicht, in welcher Behandlungsgruppe sich das Tier befindet.
Dreifache Verblindung (triple blind study): auch der Studienleiter, welcher die Behandlung (Exposition) induziert, weiss nicht, um welches Medikament es sich handelt.

Verzerrung (systematisch) / bias

Unter Bias versteht man eine systematische Verzerrung (Verfälschung) von Studienresultaten. Durch Bias verliert eine Studie an Validität (Korrektheit). Bias hat nichts mit dem durch Zufalls-Auswahl entstehenden Zufallsfehler (statistische Unsicherheit) zu tun.

Durch was kann Bias hervorgerufen werden?

Bias kann durch fehlerhaftes Studiendesign (Planung), fehlerhafte Informations-Erfassung sowie den Einfluss verzerrender zusätzlicher Variablen hervorgerufen werden, und führt zu einem Mangel an (interner oder externer) Validität von Studienresultaten.

!Keine epidemiologische Studie ist vollständig frei von Bias!

Der Zufallsfehler ist KEIN Bias - Ist diese Aussage richtig?

(Rep.P-Wert)

JA.

Zufallsfehler ist KEIN Bias; es handelt sich hier um Fluktuationen um den wahren Wert herum auf Grund der Stichproben-Variabilität. Die Grösse dieser Fehlerquelle kann auf Grund statistischer Berechnungen bestimmt werden. (Rep.) Der P-Wert eines statistischen Tests ist ein Hinweis darauf, wie gross die Wahrscheinlichkeit ist, dass Unterschiede rein zufällig (Konsequenz eines Zufallsfehlers) sind. Anders ausgedrückt: der P-Wert gibt an, wie wahrscheinlich es ist, dass eine beobachtete Assoziation noch durch Zufall entstanden sein könnte.

Zwischen welchen 3 Haupttypen von systematischen Fehlern (Bias) wird unterschieden?

* Selektionsbias
* Informationsbias
* Confounding

Verhindern von Bias

Bias muss in erster Linie bei der Planung und Durchführung einer Studie berücksichtigt werden. Vor allem bei Fall-Kontroll-Studien kann leicht ein Bias auftreten.

Präzision & Richtigkeit

Präzision (Genauigkeit) kennzeichnet die Tatsache, dass eine Messung / ein Experiement / eine Studie immer zum gleichen Resultat führt (geringe Streuung).
Korrektheit (Richtigkeit) beschreibt, wie nahe an der Wahrheit die aus der Studie geschätzte Assoziation liegt (kleiner Fehler, kein Bias).

Auswahlfehler / selection bias

Auswahlfehler führen dazu, dass die Individuen der Stichprobe entweder ungeeignet sind für die Fragestellung, oder dass sie nicht die Zielpopulation repräsentieren, für die die Aussage der Studie Gültigkeit haben soll (begrenzte  Extrapolierbarkeit; Verlust externe Validität).

!Selektions- und Informationsbias lassen sich bei der Analyse kaum mehr korrigieren!

Beispiele sind eine sogenannte Bequemlichkeitsauswahl (die Tiere am nächsten zur Stalltür) oder ein freiwilliges Mitmachen (nur diejenigen, die das Thema sehr interessiert). Als Konsequenz ist die Studienpopulation nicht mehr repräsentativ zur Zielpopulation, und eine statistisch gesichterte Schätzung der Populationsparameter durch die  Stichprobe ist nicht mehr gewährleistet.

Fehlklassifikation / misclassification = information bias

Beispiele?

Bezeichnet die Tatsache, dass Individuen entweder bezüglich Expositionsstatus oder Krankheitsstatus falsch klassifiziert werden. Führt je nach Häufigkeit zu mehr oder weniger starkem Bias (Verzerrung der Studienresultate).

Beispiele für Missklassifikation bezüglich
* Exposition sind Erinnerungs-Bias oder Interview-Bias
* bezüglich Endpunkt sind Beobachter-Bias, Antwort-Bias, Mess-Bias (Fehler der diagnostischen Tests)

Welche zwei Arten der Missklassifikation gibt es?

Welche Art ist gravierender?

* Nicht-Differenzierende Missklassifikation: erfolgt unabhängig von der Exposition (resp. des Endpunktes), also gleich in beiden Expositions- oder Endpunktgruppen. Es entsteht ein Bias in Richtung der H0 (OR nähert sich 1), d.h. die Stärke der Assoziation zwischen Faktor und Endpunkt wird unterschätzt. Man spricht hier auch von einer „konservativen Schätzung“ einer Assoziation
* Differenzierende Missklassifikation: Die Missklassifikation erfolgt unterschiedlich je nach Exposition oder Endpunkt. Es entsteht ein Bias weg von der H0 (OR entfernt sich von 1), d.h. die Stärke der Assoziation zwischen Faktor und Endpunkt wird überschätzt.

Generell wird die nicht-differenzierende Missklassifikation als weniger gravierend eingestuft.

Confounding

Anwesenheit eines zusätzlichen (zum Studienfaktor) Risikofaktors für den Endpunkt, welcher gleichzeitig mit dem Studienfaktor in der Studie numerisch assoziiert ist. Dieses führt je nach Stärke der jeweiligen Assoziationen zu mehr oder weniger starkem Bias (Verzerrung der Studienresultate).

Ein Beispiel für einen Confounder Rauchen bei einer Studie über den Zusammenhang zwischen Alkohol-Konsum (Exposition) und Lungenkrebs (Endpunkt). Wenn die Rohdaten beispielsweise einer Fall-Kontroll-Studie bei Individuen mit Lungenkrebs (Cases) und ohne Lungenkrebs (Controls) durchgeführt wird, dann stellt man fest, dass Cases eine höhere Alkohol-Exposition angeben als Controls. Biologisch ist es allerdings nicht plausibel, dass Alkohol Lungenkrebs induziert.
Es gibt allerdings einen nachgewiesenen (kausalen) Zusammenhang zwischen Rauchen und Lungenkrebsrisiko, und es gibt eine positive Assoziation zwischen Rauchen und Alkohol-Konsum. Somit haben Individuen mit höherem Alkoholkonsum zwar ein erhöhtes Lungenkrebsrisiko; dieses ist aber auf die (gleichzeitig) erhöhte Zigaretten-Exposition zurück zu führen.

Confounding bias

Confounding bias kann, sofern die Confounder bekannt sind und für alle Individuen in der Studie auch Daten bezüglich dieser Variablen erhoben wurden, bei der statistischen Analyse noch korrigiert werden.

Diagnose

Sowohl in der tierärztlichen Praxis wie auch in der öffentlichen Seuchenbekämpfung bestehen die Aufgaben des Tierarztes und der Tierärztin hauptsächlich darin, Diagnosen und Prognosen zu stellen sowie Therapien und Präventionsmassnahmen durchzuführen. Die Diagnose bildet den Grundstein für alle anderen Massnahmen. Eine Diagnose zu stellen ist ein Prozess. Die Diagnose ist meist eher eine Wahrscheinlichkeitsaussage als eine Gewissheit.

Welche Methoden zur Erreichung einer Diagnose gibt es?

(4 Punkte)

*„Pattern recognition“: Arbeitsmethode des Chefs. Dank seiner grossen Erfahrung erkennt er sofort das typische Bild der gegebenen Krankheit
* Algorithmen: Arbeitsmethode der Laien. Sie folgen Schritt für Schritt einer Vorschrift oder einem Organigramm
*„Exhaustion“: Oftmals Arbeitsmethode der Studenten und Assistenten. Sie machen alles, was möglich ist.
*„Hypothetico-deduktiv“: Methode des systematischen Vorgehens und Ausschlusses (der richtige Weg für die meisten Diagnosen)

„hypothetico-deduktiven“ Methode

Mit der „hypothetico-deduktiven“ Methode wird durch Beobachtung (Anamnese, Beobachtungen am Tier) eine geringe Anzahl von Hypothesen gestellt (Verdachtsdiagnosen). Dann werden Tests (weitere Untersuchungen) durchgeführt, um diese Hypothesen zu bestätigen oder auszuschliessen. Die Testresultate werden anhand von wissenschaftlich fundierten Methoden ausgewertet, um die Wahrscheinlichkeit der verschiedenen Hypothesen zu schätzen („rule in / rule out“). Diese Methodik stellt die Basis für die sogenannte Evidenz-basierte Medizin (EBM) dar.

Diagnostischer Test

Ein diagnostischer Test besteht aus einer Messung oder Beobachtung und der daraus folgenden Beantwortung einer Frage (normal/abnormal, negativ/positiv, … ).

Klassische diagnostische Tests in der Tiermedizin sind beispielsweise ELISAs (Enzyme-Linked Immuno Sorbent Assays) zum Nachweis von Antikörpern, die die Tiere gegen Krankheitserreger gebildet haben, oder die Anzucht (Kultivierung) eines bakteriellen Krankheitserregers und Nachweis unter dem Mikroskop.

Nennen Sie 2 Beispiele von diagnostischen Tests

klinische Untersuchungen (wie Fiebermessen, Nachweis von Flöhen, Feststellung des Patellarreflexes, … ) oder
bildgebende Verfahren (Röntgenbild zur Diagnose von Lungenmetastasen, Ultraschall zur Trächtigkeitsdiagnose, … )

Was für Daten liefern Messungen und was passiert mit ihnen weiter?

Messungen (oder Beobachtungen) liefern Daten, die nominal/kategorisch, ordinal oder kontinuierlich sind. In der Regel werden die ordinalen und kontinuierlichen Daten aus diagnostischen Tests weiter umgewandelt (reduziert) zu qualitativen Testresultaten wie „vorhanden“/“nicht vorhanden“ oder „geringradig“/„mittelgradig“/ „hochgradig“.

Präzision

Die Präzision eines Messverfahrens wird quantifiziert durch Wiederholungen der Messung unter gleichen Bedingungen. Die Präzision macht keine Angaben darüber wie weit die einzelnen Messwerte „danebenliegen“ oder abweichen vom wirklichen Wert.

Richtigkeit

Richtigkeit, Genauigkeit, auch Treffsicherheit oder Akkuratheit genannt, beschreibt den Grad an Übereinstimmung zwischen gemessenen, angezeigtem Wert und dem wahren Wert.

Was für Ergebnisse sollte ein Test liefern und wie wird diese Anforderung veranschaulicht?

Ein Test sollte natürlich zuverlässige Ergebnisse liefern. Veranschaulicht wird diese Anforderung mit dem Bild der Schiessscheiben. Dabei ist das Gewehr des Schützen oder der Schützin das Messinstrument, das von ihm oder ihr bedient wird und die Ergebnisse werden von der Position der Treffer auf der Zielscheibe bestimmt.

Hohe Präzision & Gute Richtigkeit: Der "geschossene" Punkt liegt genau in der Mitte und entspricht der Grösse des innersten Zielscheibenkreises; Hohe Präzision & Schlechte Richtigkeit: Der Punkt befindet sich nicht in der Mitte, die Grösse des Punktes entspricht aber der Grösse des innersten Zielscheibenkreises; Geringe Präzision & Gute Richtigkeit: Der Punkt liegt genau in der Mitte der Zielschreibe, ist aber grösser als der innerste Zielscheibenkreis; Geringe Präzision & Schlechte Richtigkeit: Der Punkt befindet sich weder in der Mitte der Zielscheibe noch entspricht seine Grösse der des innersten Zielscheibenkreises
 

Wiederholbarkeit

Mass für die Übereinstimmung von Resultaten, die der gleiche Beobachter (Kliniker, Laboratorium) mit dem gleichen Tier oder der gleichen Probe erhalten hat.

Reproduzierbarkeit

Mass für die Übereinstimmung von Resultaten, die verschiedene Beobachter (Kliniker, Laboratorium) mit dem gleichen Tier oder der gleichen Probe erhalten hat.

Als was werden Wiederholbarkeit und Reproduzierbarkeit für qualitative Testresulate ausgedrückt?

Welcher Test könnte durchgeführt werden, um die Korrelation zwischen Wiederholungen zu beweisen?

Wiederholbarkeit und Reproduzierbarkeit werden für qualitative Testresultate als Anteil der wiederholbaren Resultate ausgedrückt. (Wie oft bekommt man bei mehrmaligem Prüfen der gleichen Probe die gleichen Resultate?).

Ein statistischer McNemar-Test könnte durchgeführt werden, um die Korrelation zwischen Wiederholungen zu beweisen.

Als was werden Wiederholbarkeit und Reproduzierbarkeit für quantitative Testresulate ausgedrückt?

Für quantitative Resultate kann man die Reproduzierbarkeit und die Wiederholbarkeit als Streuung der Resultate für
dieselbe Probe oder dasselbe Tier ausdrücken
(Standardabweichung, Variationskoeffizienten bei Normalverteilung).

Komplexere statistische Auswertungsmethoden sind für solche Fälle ebenfalls möglich.

Was für Kontrollen sollten für eine kontinuierliche Überwachung der Reproduzierbarkeit, Präzision und Richtigkeit regelmässig durchgeführt werden?

Für eine kontinuierliche Überwachung der Reproduzierbarkeit, Präzision und Richtigkeit sollten regelmässig interne und externe Kontrollen durchgeführt werden.

Für interne Kontrollen werden bekannte positive und negative Untersuchungsobjekte mitgeführt. Wenn die mitgeführten Kontrollen nicht den Erwartungen entsprechen, sind die Testergebnisse unbrauchbar.

Für externe Kontrolle können Ringversuche (verschiedene Laboratorien testen die gleichen Proben) zur  Qualitätskontrolle durchgeführt werden.

Analytische Sensitivität

Hiermit wird die untere Nachweisgrenze („lower limit of detection“) eines Tests beschrieben.

Bsp. 3 ppb Penicillin, xx mg/ml Cobalamin, 1 Larve in 20 g Muskel.

Analytische Spezifität

Hiermit wird beschrieben, ob der Test das misst, was er messen soll.


Beispielsweise in der Virusdiagnostik nur die Influenzaviren H1N1, nicht aber H1N7 oder in der klinischen Chemie nur die knochenspezifische alkalische Phosphatase, nicht aber das Iso-Enzym aus der Leber.

Diagnostische Sensitivität

Der Anteil Proben von betroffenen (kranken) Individuen, die im Test positiv sind (i.e. als krank klassifiziert werden).

Diagnostische Spezifität

Der Anteil von NICHT betroffenen/gesunden Individuen, die im Test negativ sind (i.e. S. als gesund klassifiziert werden).

Wovon hängen Sensitivität und Spezifität in erster Linie ab?

Sensitivität und Spezifität hängen in erster Linie vom Testsystem selber ab.

Sensitivität und Spezifität können auch in verschiedenen Populationen (aus unterschiedlichen Regionen, verschiedenen Altersgruppen, Koinfektionen mit anderen Erregern….) schwanken. Serologische Tests, die Antikörper messen, können beispielsweise spezifischer sein bei Jungtieren, da es weniger Kreuzreaktionen gibt.

Was bedeutet eine Spezifität von 98% in einem Test auf Salmonellen?

Eine Spezifität von 98% heisst, dass Proben von 98% der Patienten, die keine Salmonellen ausscheiden, im Schnelltest korrekt als negativ (Nicht- Ausscheider) klassifiziert werden; und dass nur 100% - 98% = 2% im Test falsch positiv reagieren.

Falsch-positiv

Mit falsch-positiv werden die Testresultate bezeichnet, die positiv sind, aber von nicht betroffenen Tieren stammen. Je niedriger die Spezifität ist, desto höher die Rate der falsch-positiven Testresultate.

Falsch-negativ

Mit falsch-negativ werden die Testresultate bezeichnet, die negativ sind, aber von betroffenen Tieren stammen. Je niedriger die Sensitivität ist, desto höher die Rate der falsch-negativen Testresultate.

Testprävalenz & wahre Prävalenz

Mithilfe der Testresultate eines fehlerbehafteten Tests (Sensitivität und/oder Spezifität unter 100%) lässt sich die Test- oder apparente Prävalenz bestimmen.

Wenn Sensitivität und Spezifität bekannt sind, lässt sich diese Prävalenz korrigieren und die wahre Prävalenz bestimmen.

Nennen Sie die Formeln von der Sensitivität, Spezifität, Testprävalenz und der wahren Prävalenz.

Stellen Sie dazu zuerst eine Tabelle auf.

                                 Wahrer Zustand
                                Krank      Gesund
Test-           Positiv       a               b          a+b
Ergebnis   Negativ     c               d          c+d
                                      a+c           b+d        n=a+b+c+d

a: richtig-positiv (RP); b: falsch-positiv (FP), c: falsch-negativ (FN); d: richtignegativ (RN)

Sensitivität = a/a+c
Spezifität = d/b+d
Testprävalenz = (a+b)/(a+b+c+d)
Wahre Prävalenz = (a+c)/(a+b+c+d)

Zu was führt ein Test mit geringer Sensitivität bzw. geringer Spezifität?

Ein Test mit geringer Sensitivität (< als 100%) führt zu einer Unterschätzung der Prävalenz einer Krankheit (Testprävalenz niederiger als wahre Prävalenz).

Ein Test mit einer geringeren Spezifität (< als 100%) führt hingegen zu einer Überschätzung der Prävalenz einer Krankheit.

Um die Sensitivität und Spezifität eines Tests zu bestimmen, muss man den wahren Zustand der Individuen kennen. Diese Bedingung ist in der Praxis oft schwierig zu gewährleisten.

Erläutern Sie die Rogan-Gladen-Schätzer Formel

Wenn die Sensitivität und die Spezifität eines Tests bekannt sind, können jedoch die inhärenten Fehler des Tests
kompensiert und eine korrigierte oder wahre Prävalenz berechnet werden:

\(Wahre.oder.korrigierte.Prävalenz = {gemessene.Prävalenz(Test) + Spezifität - 1\over Sensitivität + Spezifität - 1}\)

Diese Formel (Rogan-Gladen-Schätzer) ist insbesondere bei sehr niedrigen und bei sehr hohen Prävalenzen sehr empfindlich auf Abweichungen der Spezifität und Sensitivität. Sie darf dort nur mit Vorsicht gebraucht werden.

Goldstandard

Ein absoluter Goldstandard sollte alle Proben (von betroffenen und nicht betroffenen Tieren) immer (100%) richtig klassifizieren. Häufig wird als „Goldstandard“ eine Methode genommen, die als „Referenzmethode“ schon lange verwendet wird und anerkannt (aber nicht zwingend fehlerfrei) ist.

Schwellenwert (cut-off) oder Grenzwert

Wenn klinische Daten einen Bereich von Werten annehmen, ist die Festlegung eines Schwellen- oder Grenzwerts auf dem Kontinuum zwischen „normal“ und „nicht normal“ eine erforderliche (und manchmal willkürliche) Entscheidung.