Verständnis der relativen Risikoredukation (RRR) und der absoluten Risikoreduktion (ARR) in Impfstoffstudien

Print Friendly, PDF & Email

von Dr. Ivan Iriarte und Dr. Simon Phoenix

Die jüngste Kontroverse über die für den Notfalleinsatz zugelassenen Impfstoffe gegen COVID-19 hat viele Diskussionen über die relative Risikoreduzierung (RRR) und die absolute Risikoreduzierung (ARR) ausgelöst. Grob gesagt, vergleicht die ARR die Gesamtergebnisse eines Ereignisses mit denen eines anderen; um wie viel ist die Gesamtwahrscheinlichkeit eines Ergebnisses verringert oder erhöht? Die RRR ignoriert die Gesamtverbesserung – sie vergleicht nur den Nutzen eines Ereignisses mit dem eines anderen, egal wie gering er ist.

Relativ zu was?

Obwohl wir uns hier auf das Risiko konzentrieren, ist es erwähnenswert, dass die Verwendung (und der Missbrauch) von relativen und absoluten Maßen für viele medizinische und wissenschaftliche Ergebnisse gilt. Wir müssen aufpassen, dass wir uns nicht ausschließlich auf ein relatives Maß verlassen, insbesondere wenn dieses relative Maß in einer schlagzeilenträchtigen Weise verwendet wird. Angenommen, wir haben zwei Krebsmedikamente, A und B. Man sagt uns, dass die Tumorverkleinerung durch das Medikament B um 100 % besser war als die durch das Medikament A. Das Medikament B klingt sehr wirksam, nicht wahr? Nehmen wir jedoch an, dass das Medikament A den Tumor absolut gesehen um 0,1 % verkleinert, was bedeuten würde, dass das Medikament B den Tumor um 0,2 % verkleinert. Keines der beiden Medikamente kann als insgesamt oder absolut gesehen sehr wirksam bezeichnet werden, aber relativ gesehen ist Medikament B sicherlich wirksamer als Medikament A.

Sollten Sie einen Gummianzug tragen?

Um technische Ideen zu verstehen, ist es oft hilfreich, extreme Beispiele zu betrachten. Stellen wir uns die Erfindung eines Gummianzugs mit Kapuze vor, der den Träger vor Blitzschlag schützen soll. Es stellt sich heraus, dass der Anzug die Zahl der Todesfälle durch Blitzschlag reduziert, so dass auf 100 Todesfälle durch Blitzschlag bei Nicht-Anzugträgern nur ein Todesfall bei Anzugträgern kommt. Dies ist ein Beispiel für eine hohe relative Risikominderung (RRR). Die absolute Risikoreduzierung (ARR) wird jedoch sehr gering sein, da Blitzeinschläge in Menschen sehr selten sind. Mit anderen Worten: Durch das Tragen des Schutzanzugs wird aus einem extrem geringen Risiko ein noch geringeres Risiko.

Die eigentliche Frage ist, ob es für jeden sinnvoll ist, gummierte Anzüge zu tragen, um sich vor Blitzschlag zu schützen. Man kann davon ausgehen, dass die meisten von uns wahrscheinlich mit “Nein” antworten würden, auch wenn die Anzüge den Tod durch Blitzschlag sehr wirksam verhindern. Das setzt jedoch voraus, dass kein Zwang, keine Propaganda oder irrationale Angst die Entscheidung beeinflusst – eine schlechte Annahme im Zeitalter von COVID. Dennoch kann es Berufe geben, wie z. B. die Wartung von Fernmeldetürmen, bei denen das Tragen des Schutzanzugs sinnvoll wäre. 

Die ARR ist also eine wichtige Überlegung, wenn es darum geht, die Frage zu beantworten, ob es sich lohnt, etwas zu tun. Man könnte sogar argumentieren, dass die ARR eine entscheidende Überlegung ist, insbesondere bei Fragen der gesellschaftlichen Auswirkungen.
Neben dem Verständnis der Definitionen und Bedeutungen von ARR und RRR ist es auch wichtig zu verstehen, wie sie verwendet werden sollten und wie nicht. Obwohl diese Begriffe im Zusammenhang mit den COVID-19-Impfungen bekannt geworden sind, werden sie seit Jahrzehnten als Standardindikatoren zur Messung der Wirksamkeit von Präventionsmaßnahmen verwendet. 

So werden sie zum Beispiel bei der Früherkennung von Prostatakrebs eingesetzt, um Todesfälle zu verhindern. Folglich wurden Studien konzipiert, um das Sterberisiko von Personen, die an der Vorsorgeuntersuchung teilnehmen, mit dem von Personen zu vergleichen, die nicht daran teilnehmen. 

Führt eine randomisierte kontrollierte Studie(RCT) immer zu brauchbaren Ergebnissen?

Bei dieser Art von Studien handelt es sich in der Regel um randomisierte kontrollierte Studien (RCTs), die allgemein als Goldstandard für die Validierung der Wirkung einer medizinischen Maßnahme gelten. Bei einer randomisierten kontrollierten Studie können die Prüfer viele der Einschränkungen und Verzerrungen vermeiden, die bei anderen Forschungsmethoden auftreten können. Die Ergebnisse einer RCT sind jedoch nicht unproblematisch und sollten mit Vorsicht interpretiert werden. Auch hier müssen die Implikationen von RRR und ARR verstanden werden.

Bei einer RCT werden in der Regel Probanden nach bestimmten Kriterien ausgewählt und nach dem Zufallsprinzip einer von zwei Gruppen zugeteilt: der Interventionsgruppe und der Kontroll- oder Vergleichsgruppe. Die Vergleichsgruppe erhält in der Regel ein Placebo, d. h. eine inerte Substanz ohne biologische Wirkung, z. B. eine Kochsalzlösung oder eine Zuckerpille, während die Interventionsgruppe die untersuchte Maßnahme erhält. Sowohl die Probanden als auch die Prüfer wissen nicht, wer die tatsächliche Intervention erhält, so dass eine mögliche Verzerrung bei den Beobachtungen und der Berichterstattung über die Daten ausgeschlossen ist.

Abbildung 1: Die Grundstruktur einer RCT, bei der die Teilnehmer entweder das Studienmedikament oder ein Placebo erhalten. Die Anzahl der Personen, die in den beiden Gruppen erkranken, kann verglichen werden, und es wird eine relative Risikoreduzierung geschätzt. Dabei ist zu beachten, dass die Testgruppe nach dem Zufallsprinzip aufgeteilt werden muss, damit jede Behandlungsgruppe wirklich vergleichbar ist. Viele Studien scheitern an diesem grundlegenden Schritt, weil die Behandlungsgruppen verzerrt sind und nicht wirklich gleichwertige Populationen darstellen.

Die Pfizer-Impfstoffstudie: auf Erfolg und nicht auf Aussagekraft ausgelegt?

Bei den Impfstoffversuchen von Pfizer-BioNTech wurde die RCT-Methode angewandt. Die Prüfer wiesen 21 720 Personen ab 16 Jahren nach dem Zufallsprinzip zwei Dosen des neuen Impfstoffs und 21 728 Personen zwei Dosen eines Placebos zu. Sie beobachteten die Probanden im Durchschnitt zwei Monate lang nach dem Eingriff.

Es ist auch wichtig das Studiendesign selbst zu berücksichtigen. In diesem Fall wurde die Studie von Pfizer konzipiert, einem Unternehmen, das sehr erfahren darin ist, erfolgreiche Studien zu konzipieren. In der Studie wurden die Fallzahlen in den geimpften Gruppen mit denen der Kontrollgruppen (Placebo) verglichen, wobei ein COVID-19-Fall als eine Person definiert wurde, bei der Symptome auftraten und ein positiver Test auf eine SARS-CoV-2-Infektion vorlag. Dies ist wohl ein schwacher Endpunkt, da die Inzidenz von schweren Erkrankungen und Todesfällen, also genau die Folgen, die der Impfstoff hoffentlich verhindert, nicht berücksichtigt wurden. Es wurden auch andere Daten erhoben, darunter das Auftreten von schweren Nebenwirkungen.

Die Studie meldete acht Fälle von COVID-19 (wie oben definiert) in der geimpften Gruppe und 162 in der Placebogruppe. Das COVID-19-Risiko in der geimpften Gruppe betrug also 8/21.720 = 0,037 % und das Risiko in der nicht geimpften Gruppe 162/21.728 = 0,745 %. Die ARR ist einfach definiert als der Unterschied im Risiko zwischen den beiden Gruppen. In diesem Fall wäre sie = 0,745% – 0,037% = 0,708%; wir runden auf 0,7%. Die RRR ist die ARR, ausgedrückt als Prozentsatz des absoluten Krankheitsrisikos der nicht geimpften Personen. In diesem Fall ist es = 0,708/0,745 = 95%. Diese RRR wird (wie üblich) als die “Wirksamkeit” des Impfstoffs angegeben.

Abbildung 2: Die Grundstruktur der Impfstoff-RCT, bei der die Teilnehmer entweder den Versuchsimpfstoff oder ein Placebo erhalten. Die Anzahl der Personen, bei denen Symptome auftraten (und die einen positiven Test hatten), kann in den beiden Gruppen verglichen und eine relative Risikoreduzierung geschätzt werden.

So einfach ist das nicht

Der Impfstoff schien das relative Risiko von COVID-19 (gemäß der Definition von Pfizer) während der kurzen Studiendauer um schätzungsweise 95 % zu senken, aber die Interpretation dieser Zahl ist nicht so einfach. Es ist nahezu unmöglich, den potenziellen Nutzen in der realen Welt aus einem so begrenzten Studiendesign zu extrapolieren.

Zunächst einmal müssen wir die Rolle der Statistik verstehen. Wenn man eine Münze 10-mal wirft, würde man erwarten, dass im Durchschnitt 50 % Kopf und 50 % Zahl herauskommen. In der Praxis wäre es jedoch nicht allzu überraschend, wenn man bei 10 Münzwürfen 7 Mal Kopf und 3 Mal Zahl erhält. Ähnliche Überlegungen gelten für jede medizinische Studie. Auch wenn die Schlagzeile hier eine relative Risikoreduzierung von 95 % angibt, wie sicher sind wir, dass diese Zahl der Wahrheit entspricht? Hätten wir die Studie zu einem anderen Zeitpunkt durchgeführt, hätten wir vielleicht nur einen Wert von 90 % für die RRR ermittelt? Jede angegebene Verringerung muss also mit einem Hinweis darauf einhergehen, wie “gut” diese Zahl ist. Die Pfizer-Studie hatte zwar über 40000 Teilnehmer, aber nur relativ wenige waren mit COVID infiziert, so dass die Schlussfolgerungen auf kleinen Zahlen beruhen.

Um festzustellen, ob die Verabreichung des Impfstoffs an die Bevölkerung wirklich von Vorteil ist, müssen wir auch das tatsächliche Krankheitsrisiko derjenigen berücksichtigen, die die Maßnahme nicht erhalten haben. Zur Veranschaulichung ein überspitztes Beispiel: Wenn das Risiko, an einer Krankheit zu erkranken, nur eins zu einer Million beträgt, ist eine Halbierung des Risikos auf eins zu 2 Millionen keine große Sache. Wenn jedoch das Risiko, eine Krankheit zu bekommen, 30 % beträgt, ist eine Verringerung des Risikos auf 15 % sehr bedeutend. Wenn die von uns vorgeschlagene experimentelle Behandlung eine Todesrate durch Nebenwirkungen von eins zu einer Million zur Folge hätte, würden wir im obigen Beispiel zögern, sie zu empfehlen, aber im letzteren Fall würden wir sie viel eher empfehlen.

Die Pfizer-Studie enthält eine Abbildung, in der die kumulative Anzahl der geimpften Patienten, die krank wurden, mit der kumulativen Anzahl der Placebo-Patienten, die krank wurden, verglichen wird. Die Grafik sieht ähnlich aus wie diese:

Türkis: Impfung; Ocker: Placebo; x-Achse : Tage nach erster Dosis; Y-Achse: kumulative Inzidenz von Covid-19

Dies scheint ein beeindruckendes Ergebnis zu sein, da es in der Placebogruppe mehr Fälle gibt als in der geimpften Gruppe. Beachten Sie jedoch, dass die Y-Achse nur bis 2,5 % reicht – insgesamt erkrankten also 2,3 % der Placebopatienten gegenüber 0,3 % der geimpften Patienten. Wenn wir uns das

Betrachtet man das absolute Risiko der einzelnen Gruppen, sehen die Ergebnisse weit weniger beeindruckend aus:

Türkis: Impfung; Ocker: Placebo; X- Achse: Tage nach der ersten Impfung; Y-Achse kumulative Inzidenz von Covid-19

Überwiegt der Nutzen gegenüber den Kosten?

Dies ist dieselbe Frage, die wir im obigen Beispiel des gummierten Blitzschutzanzugs gestellt haben. Es ist die schwierigere subjektive Frage, ob die von uns vorgeschlagene Maßnahme es wert ist. Im Falle einer schweren Krankheit wie Covid19 ist dies eine komplexe Frage, denn wir wollen zwar Leben retten, sind uns aber auch darüber im Klaren, dass die Impfstoffe, wie alle medizinischen Eingriffe, nicht frei von schwerwiegenden Nebenwirkungen sind. Auch wenn nur ein kleiner Prozentsatz an solchen Nebenwirkungen leidet, müssen wir dies gegen die Tatsache abwägen, dass wir es auch mit einem meist kleinen Prozentsatz von Menschen zu tun haben (abhängig von persönlichen Risikofaktoren), die an COVID-19 sterben. Die ARR und die RRR sind beides wichtige Parameter, die uns helfen, diese komplexen Fragen zu beantworten.

Dies verdeutlicht, warum die Berücksichtigung der ARR hilfreich sein kann. In der oben erwähnten klinischen Studie von Pfizer lag das Risiko für COVID-19 bei 0,75 %; eine Verringerung dieses Risikos um 95 % scheint also keine sehr beeindruckende Wirkung zu haben. Aber die Interpretations des Problems ist noch komplexer. Innerhalb der klinischen Studie haben verschiedene Untergruppen von Personen ein unterschiedliches Risiko, an COVID-19 zu erkranken. Außerdem haben verschiedene Altersgruppen ein sehr unterschiedliches Risiko, an COVID-19 zu versterben. Wir können nicht einfach davon ausgehen, dass eine relative Risikoreduktion von 95 % aus den Studiendaten gleichmäßig für alle Altersgruppen gilt, ohne die Ergebnisse weiter zu stratifizieren. Im Allgemeinen haben jüngere Menschen ein wesentlich geringeres Risiko durch COVID-19, so dass die ARR in diesen Gruppen sehr gering ist. Darüber hinaus kann das Erkrankungsrisiko in verschiedenen Bevölkerungsgruppen und an verschiedenen geografischen Standorten unterschiedlich sein.

Ein letzter wichtiger Punkt ist in Bezug auf das Studiendesign und die berichteten Ergebnisse zu beachten. Während es wichtig ist, festzustellen, ob die Impfstoffe die Infektionen wirksam reduzieren, ist es ebenso wichtig zu wissen, ob sie die Gesundheitsergebnisse insgesamt verbessern – ist der Nutzen ausreichend, um das potenzielle Risiko zu rechtfertigen? So wurden beispielsweise in der oben erwähnten Impfstoffstudie 262 schwerwiegende unerwünschte Ereignisse in der geimpften Gruppe und 172 schwerwiegende unerwünschte Ereignisse in der Placebogruppe festgestellt (was zugegebenermaßen merkwürdig erscheint, da man bei einer Kochsalzspritze keine unerwünschten Ereignisse erwarten würde). Angesichts der Tatsache, dass COVID-19 für die überwiegende Mehrheit keine ernsthafte Erkrankung darstellt, sollten auch die während der Studien aufgetretenen unerwünschten Ereignisse in unsere Entscheidung über die allgemeine Eignung der vorgeschlagenen Maßnahme einfließen.

Die logische Schlussfolgerung ist, dass die in einer RCT gemeldete RRR und ARR einer Intervention (in diesem Fall eines Impfstoffs) mit Vorsicht zu interpretieren ist, wenn es darum geht, zu entscheiden, ob die Intervention in der Allgemeinbevölkerung wünschenswert ist. Es ist keine vernünftige Praxis im Bereich der öffentlichen Gesundheit, zu sagen: “Dieser Impfstoff ist zu 95 % wirksam, also sollten wir ihn allen verabreichen”. Bei der Entscheidung über die Durchführung von Maßnahmen in der Bevölkerung sollten die Ergebnisse einer RCT als wertvolle Informationen herangezogen werden, aber auch viele Faktoren berücksichtigt werden, wie z. B. das tatsächliche Risiko, in verschiedenen Bevölkerungsgruppen an COVID-19 zu erkranken (geografische Lage, unterschiedliches Alter, andere medizinische Bedingungen usw.), die Wahrscheinlichkeit, zu verschiedenen Jahreszeiten an COVID-19 zu erkranken, und die Wahrscheinlichkeit von Nebenwirkungen nach der Impfung.

Referenzen

  1. Olifaro, P. et al. COVID-19 vaccine efficacy and effectiveness-the elephant (not) in the room. https://www.thelancet.com/journals/lanmic/article/PIIS2666-5247(21)00069-0/fulltext
  2. Schröder FH, et al. Screening und Prostatakrebs-Mortalität in einer randomisierten europäischen Studie. N Engl J Med. 2009; 360:1320-8. https://www.nejm.org/doi/full/10.1056/nejmoa0810084
  3. Pollack, FP. Et al. Safety and Efficacy of the BNT162b2 mRNA Covid-19 Vaccine. https://pubmed.ncbi.nlm.nih.gov/33301246/

Quelle: https://www.pandata.org/understanding-relative-risk-reduction-and-absolute-risk-reduction-in-vaccine-trials/

Panda ist eine multidisziplinäre Gruppe von Experten mit dem Ziel der Förderung offener Wissenschaft und Debatte. Das Ziel der Gruppe ist es, inkorrekte Wissenschaft durch „gute“ Wissenschaft zu ersetzen und eine dystopische „neue Normalität“ zu vermeiden. Weitere Informationen unter pandata.org und Twitter.

(Visited 598 times, 598 visits today)