Wie ähnlich sind Schätzungen zur Wirksamkeit von Behandlungen aus randomisierten kontrollierten Studien und Beobachtungsstudien?

Kernaussagen

- Im Durchschnitt unterscheiden sich Schätzungen in randomisierten kontrollierten Studien (RCTs) und Beobachtungsstudien nur sehr geringfügig. Schätzungen sind statistische Konstrukte, die anhand des Unterschieds zwischen den Endpunkten zweier Personengruppen beschreiben, wie groß die Wirkung einer Behandlung in einem Versuch oder einer klinischen Studie ist.
- Es muss weiter erforscht werden, welche Faktoren sich auf Ähnlichkeiten und Unterschiede in den Schätzungen zur Wirksamkeit verschiedener Studientypen auswirken.

Was sind RCTs und Beobachtungsstudien, und warum unterscheiden sich ihre Schätzungen zur Wirksamkeit möglicherweise?

Randomisierte kontrollierte Studien (RCTs) sind ein experimenteller Ansatz in der Gesundheitsforschung. Dabei werden die Teilnehmenden nach dem Zufallsprinzip einer von zwei (oder mehr) Behandlungsgruppen zugewiesen. Eine Gruppe erhält eine experimentelle Behandlung (auch "Intervention" genannt), die andere Gruppe, die die Intervention nicht erhält, dient als "Kontrollgruppe". RCTs untersuchen, wie wirksam und sicher die experimentelle Behandlung unter idealen Bedingungen ist.

Beobachtungsstudien versuchen, die Wirksamkeit einer Intervention in nicht-experimentellen, "realen" Szenarien zu messen. Fall-Kontroll-Studien (oder retrospektive Studien) und Kohortenstudien sind zwei gängige Arten von Beobachtungsstudien. Fall-Kontroll-Studien vergleichen eine Gruppe von Personen mit einer bestimmten Erkrankung mit einer Gruppe, die diese nicht aufweist, aber ansonsten möglichst vergleichbar ist. Kohortenstudien beobachten eine Gruppe von Menschen mit einem gemeinsamen Merkmal über einen längeren Zeitraum, um herauszufinden, wie viele von ihnen einen Endpunkt erreichen, der von Interesse ist.

Manchmal können die Ergebnisse von RCTs und Beobachtungsstudien, die sich mit der gleichen Frage befassen, zu unterschiedlichen Ergebnissen führen. Die Studienarten unterscheiden sich in ihrer Durchführung und in ihrer Anfälligkeit für systematische Fehler.

Was wollten wir herausfinden?

Wir wollten den Einfluss des Studientyps (RCTs versus Beobachtungsstudien) auf die zusammengefasste Schätzung der Wirksamkeit untersuchen und methodische Aspekte herausfiltern, die etwaige Unterschiede erklären könnten.

Wie gingen wir vor?

Wir suchten in Datenbanken nach Reviews, die Schätzungen zur Wirksamkeit aus RCTs und Beobachtungsstudien zur gleichen medizinischen Frage systematisch miteinander verglichen. Wir haben nach Reviews gesucht, die jegliche Endpunkte von Interventionen der Gesundheitsversorgung untersuchten. Einschränkungen hinsichtlich der Sprache der Veröffentlichung wurden nicht vorgenommen. Gesucht wurde nach Reviews, die zwischen dem 01. Januar 1990 und dem 12. Mai 2022 veröffentlicht wurden. Anschließend verglichen wir die Ergebnisse der Reviews und fassten die Evidenz zusammen. Wir bewerteten unser Vertrauen in diese Evidenz auf der Grundlage von Faktoren wie den angewendeten Methoden, der Größe sowie der Konsistenz der Ergebnisse zwischen den einzelnen Reviews.

Was fanden wir?

Wir identifizierten 47 relevante Reviews; 34 davon haben Daten zu unserer Hauptanalyse beigetragen. In den Reviews wurden die Schätzungen zur Wirksamkeit aus RCTs mit denen aus Kohortenstudien, Fall-Kontroll-Studien oder beiden verglichen. Die Reviews befassten sich mit einer Vielzahl gesundheitsbezogener Themen. Sie wurden in Ländern auf der ganzen Welt durchgeführt, die meisten jedoch in den USA. Zwölf Reviews enthielten keine Angaben zur Finanzierung. Bei acht Reviews gaben die Autoren an, keine finanzielle Unterstützung erhalten zu haben. In 23 Reviews gaben die Autoren an, dass sie öffentliche Mittel erhalten hatten, z. B. staatliche Förderung oder Mittel von Universitäten oder Stiftungen. Zwei Reviews wurden von der Europäischen Union finanziert, zwei weitere wurden von der Industrie finanziert. Die meisten geförderten Reviews gaben mehrere Finanzierungsquellen an.

Hauptergebnisse

- Wir stellten fest, dass sich die Schätzungen zur Wirksamkeit aus RCTs und Beobachtungsstudien sehr wenig bis gar nicht unterscheiden.
- In Studien, die nur Arzneimittel untersuchen, könnte es kleine Unterschiede bezüglich der Schätzungen zur Wirksamkeit geben (im Vergleich zu Studien, die andere Maßnahmen der Gesundheitsversorgung untersuchen, wie chirurgische Eingriffe oder Physiotherapie).

Geringe Unterschiede bezüglich der Schätzungen zur Wirksamkeit wurden auch festgestellt, wenn die Daten aus folgenden Quellen stammten:
- Metaanalysen von RCTs und Beobachtungsstudien, die eine erhebliche statistische Heterogenität aufwiesen, also Unterschiede in der Wirkung der Interventionen, die in den verschiedenen Studien bewertet wurden;
- Beobachtungsstudien, die entweder keine Methoden zur Berücksichtigung von bestimmten Merkmalen ihrer Studienteilnehmenden angewendet haben, die sich auf die Wirksamkeit einer Intervention auswirken könnten, oder bei denen unklar blieb, wie sie diese angewendet haben (Propensity-Score-Anpassung);
- Beobachtungsstudien, die keine ausreichenden Informationen zu ihrem Studiendesign enthielten.

Was schränkt die Evidenz ein?

Wir haben wenig Vertrauen in die Evidenz, da die eingeschlossenen Reviews aufgrund der Art ihrer Durchführung ein Risiko für systematische Fehler aufweisen könnten. Darüber hinaus befassten sich die Reviews mit verschiedenen Arten von Menschen und Maßnahmen. Das bedeutet, dass die einzelnen Ergebnisse der Reviews erheblich voneinander abwichen.

Wie aktuell ist dieser Review?

Es wurden Studien bis Mai 2022 eingeschlossen.

Anmerkungen zur Übersetzung: 

C. Meiling, B. Schindler, freigegeben durch Cochrane Deutschland

Tools
Information