Übergewicht : Darf’s auch ein bisschen mehr sein?

Jedes Kilo zu viel verkürze das Leben, sagen die einen. Andere dagegen glauben, dass ein bisschen mehr auf den Rippen sogar nützen könnte. In unserer Blogserie zu „Ernährung und kardiovaskuläre Erkrankungen“ geht es in diesem sechsten Artikel um den Forscher-Streit über den Zusammenhang zwischen Body Mass Index (BMI) und Sterblichkeit. Das Thema ist ein Lehrstück darüber, wie schwer es sein kann, die Ergebnisse großer Beobachtungsstudien zu deuten.

„Ich bin nicht dick! Nein, mein Herr! Nur kräftig gebaut!“ So wie dem Comic-Gallier Obelix geht es vielen Menschen: Dicksein ist Ansichtssache. Manche finden sich trotz oder gerade wegen des Rettungsrings um den Bauch gut so, wie sie sind. Andere hadern mit jedem vermeintlich überzähligen Pfund und stürmen gerade zum Jahresanfang voller guter Vorsätze auf die Joggingstrecke oder konsultieren Diätratgeber.

Als halbwegs objektives und unkompliziertes Maß für die Körpermasse hat sich der Body Mass Index (BMI) durchgesetzt. Er berechnet sich aus dem Körpergewicht in Kilogramm geteilt durch das Quadrat der Körpergröße in Metern. Der Weltgesundheitsorganisation WHO zufolge entsprechen Werte zwischen 18,5 und 24,9 Normalgewicht, mit 1,80 Meter sollte man (oder Frau) demnach zwischen 60 und 81 Kilo wiegen. Niedrigere Werte gelten als Untergewicht, von Übergewicht spricht man ab einem BMI von 25 als Übergewicht und von Fettleibigkeit oder Adipositas ab einem BMI von 30. Sie beginnt für den 1,80-Meter-Mensch bei einem Gewicht von 97 Kilo.

So bemessen sind offiziellen Zahlen des Robert-Koch-Instituts zufolge zwei Drittel der Männer (67 %) und gut die Hälfte der Frauen (53 %) in Deutschland übergewichtig. Knapp ein Viertel der Erwachsenen beider Geschlechter ist fettleibig. Österreicher und Schweizer sind im Schnitt etwas schlanker, in beiden Ländern liegt der Anteil der Übergewichtigen und Adipösen bei gut 40 Prozent.

Die Ursache für Übergewicht und Adipositas ist in den meisten Fällen eine Kombination aus ungünstigen Ernährungsgewohnheiten und Bewegungsmangel. Sie führt zu einem Überschuss in der Kalorienbilanz, den der Körper in Form von Fettgewebe einlagert (siehe auch den Artikel Ernährung und kardiovaskuläre Erkrankungen – eine neue Serie auf Wissen Was Wirkt)

Dabei ist Körperfett per se weder gut noch böse. Ein bisschen Speck als Isolierschicht und Speicherstoff für schlechtere Zeiten gehört von Natur aus zu einem gesunden, wohlgenährten Körper. Wer jedoch allzu große Mengen davon mit sich herumträgt, bekommt Probleme. Und das nicht nur in Form der sozialen und ästhetischen Erwartungen unserer Gesellschaft, unter denen viele übergewichtige Menschen leiden. Wenn aber schon die Treppe in den ersten Stock eine bergsteigerische Herausforderung darstellt, wird Dicksein auch ganz real zur Quälerei.

Vor allem jedoch spielt Fettleibigkeit die erste Geige im „tödlichen Quartett“ des metabolischen Syndroms, zu dem sich noch Bluthochdruck, erhöhte Blutfette und Insulinresistenz gesellen. Diese Symptomkombination gilt neben dem Rauchen als wichtigster Risikofaktor für Herz-Kreislauferkrankungen und andere Zivilisationskrankheiten wie Diabetes oder Krebs und damit als eine der Hauptursachen für vorzeitige und vermeidbare Todesfälle in Industriestaaten.

Über welche biologischen Mechanismen das überschüssige Fett die anderen schädlichen Veränderungen nach sich zieht, ist nicht vollständig geklärt. „Fettgewebe ist jedenfalls nicht nur ein passiver Kalorienspeicher“, sagt Michael Leitzmann, Direktor des Instituts für Epidemiologie und Präventivmedizin an der Universität Regensburg: „Vor allem das sogenannte Viszeralfett im Bauchraum produziert eine Vielzahl von Hormonen und greift damit aktiv in den Stoffwechsel ein. Hat man zu viel davon, so verschiebt sich das Gleichgewicht dieser Stoffe auf Dauer offenbar in Richtung Krankheit.“

Echte Fettleibigkeit ist also ein erheblicher Risikofaktor für potentiell tödliche Krankheiten. Aber wie steht es um die große Zahl der Übergewichtigen, die nur ein paar Kilos zu viel mit sich herumtragen? Müssen auch diese Menschen schädliche Auswirkungen ihrer Fettpolster fürchten? Oder gilt für sie vielmehr der Spruch „ein bisschen rund ist gesund“?

Das Adipositas-Paradoxon – Realität oder nur „ein Haufen Müll“?

Über diese Frage ist unter Wissenschaftlern in den letzten Jahren ein erstaunlich erbitterter Streit entbrannt. Den Anfang machte 2005 eine Studie von Wissenschaftlern um Katherine Flegal von der amerikanischen Gesundheitsbehörde CDC im Fachblatt JAMA. Flegal nutzte Daten des National Health and Nutrition Examination Survey, einer seit 1971 mehrfach aufgelegten Kohortenstudie, für die Tausende repräsentativ ausgewählte Amerikaner über Jahre hinweg immer wieder nach ihrem Lebensstil befragt und medizinisch untersucht wurden. Für Fettleibige mit einem BMI über 30 hatte die Analyse erwartungsgemäß schlechte Nachrichten: Auf das Jahr 2000 und die gesamte Bevölkerung der Vereinigten Staaten (damals gut 280 Millionen) hochgerechnet, waren demnach unter Fettleibigen im Vergleich zu Normalgewichtigen rund 112.000 zusätzliche Todesfälle aufgetreten. Auch Untergewichtige hatten wie erwartet eine leicht erhöhte Sterblichkeit. Doch für Übergewichtige (BMI zwischen 25 und 30) zeigte sich unerwartet der umgekehrte Effekt: Sie hatten ein deutlich geringeres Sterberisiko als ihre normalgewichtigen Mitmenschen.

Diese Ergebnisse legen nahe, dass „ein bisschen rund“ tatsächlich gesund ist und offenbar mit der Definition von „Normalgewicht“ etwas nicht stimmt. Flegal war durchaus nicht die Erste, die auf dieses sogenannte Adipositas-Paradoxon stieß. Es war bereits aus einer Reihe von Studien bekannt, etwa zu koronarer Herzkrankheit, Blut-Hochdruck, Diabetes oder chronischem Nierenversagen. Auch sie kamen zu dem Schluss, dass übergewichtige und zum Teil selbst leicht adipöse Patienten dieser Leiden offenbar bessere Überlebenschancen haben, als Normalgewichtige. Flegal hatte dies nun auch für das wichtige Maß der Gesamt-Sterblichkeit („all-cause-mortality“) gezeigt. 2013 legte sie dann im Fachblatt JAMA mit einer systematischen Übersichtsarbeit samt Metaanalyse nach, welche auf Daten aus fast hundert Studien mit annähernd drei Millionen Teilnehmern basierte. Auch diesmal schnitten übergewichtige Teilnehmer am besten ab – ihr Sterberisiko lag sechs Prozent unter jenem von Normalgewichtigen.

Viele ihrer Kollegen aus der Ernährungswissenschaft wollten davon allerdings nichts hören. Zu Flegals entschiedensten Kritikern zählt Walter Willett von der Harvard Medical School in Boston, Amerikas wohl prominentester Ernährungsmediziner. Sein Kommentar in einem Radiointerview zu Flegals Studie von 2013: „Das ist ein Haufen Müll, niemand sollte seine Zeit damit vergeuden, das zu lesen.“

Von Rauchern und dünnen Kranken

Starke Worte. Willett stößt sich vor allem daran, dass Flegal zwei Störfaktoren, sogenannte Confounder, nicht angemessen berücksichtigt habe, welche die Statistik zugunsten der Übergewichtigen verzerren. Störenfriede Nummer eins sind Raucher. Weil Nikotin den Appetit zügelt macht rauchen tatsächlich schlank. Gleichzeitig ist ihre Sterblichkeit wegen der zahlreichen Gesundheitsgefahren des Rauchens deutlich erhöht. Dadurch verzerren Raucher die Statistik zuungunsten des Normalgewichts, obwohl ihr erhöhtes Sterberisiko ursächlich nichts mit ihrem schlankeren Körper zu tun hat.

Ganz ähnlich ist dies mit den „dünnen Kranken“: Schon lange vor der Erstdiagnose können sich ernsthafte Krankheiten wie Krebs als schleichender Gewichtsverlust bemerkbar machen. Die in Studien offiziell noch als gesund eingestuften Betroffenen solcher versteckten Frühsymptome sind dann also schlank, weil krank, und nicht anders herum – reverse Kausalität nennen Epidemiologen einen solchen Effekt. Sowohl dünne Raucher als auch dünne Kranke führen also zu vermehrten Todesfällen unter Normalgewichtigen und verzerren dadurch das Gesamtbild.

Solche Confounder sind der große Knackpunkt von Beobachtungsstudien wie dem National Health and Nutrition Examination Survey, weil sich ihre verzerrenden Effekte nur schwer von echten Ursache-Wirkungszusammenhängen unterscheiden lassen. Mit Lehrbuch-Confoundern wie Alter, Geschlecht, Bildung und Einkommen lässt sich noch umgehen, subtilere Störgrößen dagegen lassen sich oft nur schwer identifizieren und noch schwerer von echten Effekten entwirren.

Die bessere Alternative wären im Prinzip randomisierte, kontrolliere Studien (RCTs). In solchen Studien unterscheiden sich die Angehörigen von Test- und Kontrollgruppe im Idealfall nur in dem zu untersuchenden Merkmal (in diesem Fall der BMI-Kategorie) und sind sich ansonsten möglichst ähnlich. Für den Zusammenhang von BMI und Sterblichkeit ist dies jedoch kaum machbar, weil man Studienteilnehmer schon aus ethischen Gründen kaum dazu verdonnern kann, sich im Namen der Wissenschaft dicke Fettpolster anzufressen.

Beobachtungsstudien sind daher für viele epidemiologische Fragen das Beste, was wir haben. Um die störenden Effekte der Confounder möglichst klein zu halten, gibt es verschiedene Möglichkeiten. Ein Weg ist, die Daten bestimmter Probanden, die das Ergebnis verzerren würden (zum Beispiel jene von Rauchern) von vornherein aus der Auswertung auszuschließen. Alternativ kann man versuchen, Confounder durch statistische Korrekturfaktoren zu kompensieren. Nur, welcher dieser beiden Wege ist der bessere? Um eben diese Frage geht es im erbitterten Forscherstreit zwischen den Lagern von Flegal und Willet.

Flegal setzt auf Korrekturfaktoren, die in der Statistik beispielsweise den Effekt des Rauchens ausgleichen sollen. Doch das ist leichter gesagt als getan: Wie viel raucht der einzelne Studienteilnehmer, wie tief inhaliert er, wie lange muss jemand das Rauchen aufgegeben haben, um nicht mehr als Raucher zu gelten? Weil Studiendaten auf all diese Fargen meist keine genauen Antworten geben können, basieren Korrekturverfahren auf mehr oder minder gewagten Mutmaßungen.

Wie repräsentativ ist eine Studie, wenn mehr als die Hälfte aller Datensätze von vornherein rausfliegen?

Viele Forscher, darunter auch der inzwischen emeritierte Walter Willett und sein Nachfolger in Harvard, Frank Hu, setzen stattdessen auf eine anderen Umgang mit Confoundern, nämlich eine strenge Auslese der in der Analyse berücksichtigten Probanden. Am Ende bleiben im Idealfall nur noch Studienteilnehmer übrig, die wirklich repräsentativ für den zu untersuchenden Zusammenhang sind. Das Problem mit diesem Ansatz: Er kann zum Ausschluss eines Großteils der Probanden führen.

So geschehen in der 2016 in The Lancet publizierten Studie der Global BMI Mortality Collaboration (GBMC) , an der auch Willett und Hu beteiligt waren. In ihrer Metaanalyse werteten die Forscher 239 Beobachtungsstudien aus aller Welt aus, nutzen jedoch nur die Daten von streng selektierten Teilnehmern. Berücksichtigt wurde nur, wer niemals geraucht hatte, zu Studienbeginn gesund war und danach wenigstens fünf Jahre überlebt hatte. Auf diee Weise blieben allerdings von den ursprünglich fast elf Millionen Teilnehmern weniger als vier Millionen übrig. Unter den handverlesenen Probanden fehlte vom Adipositas-Paradoxon denn auch jede Spur. Das geringste Sterberisiko hatten Normalgewichtige mit einem BMI zwischen 20 und 25. Für Übergewichtige mit einem BMI zwischen 25 und 27,5 fand die Studie ein im Vergleich dazu um sieben Prozent erhöhtes Sterberisiko, für einen BMI zwischen 27,5 und 30 war die Sterblichkeit bereits um 20 Prozent erhöht. Zur Einordnung: Raucher von mehr als 10 Zigaretten am Tag haben gegenüber Nichtrauchern ein doppelt bis dreifach erhöhtes Sterberisiko.

Zwei Studien, die zu weiten Teilen auf demselben Datenfundament stehen und doch zu ganz unterschiedlichen Ergebnissen kommen. Da stellt sich die Frage, welcher der beiden Ansätze der richtige ist: Kommt es auf einen realistischen Bevölkerungsquerschnitt an oder haben streng selektierte Daten die höhere Aussagekraft? Aus der wissenschaftlichen Debatte um diese Frage wurde schnell eine veritable Schlammschlacht zwischen den Lagern von Flegal und Willett, in der sich die Beteiligten gegenseitig der Manipulation und Rosinenpickerei bezichtigen.

Dabei hat das Thema „BMI und Sterblichkeit“ noch andere Streitfragen parat. So ist der BMI als Standardmesslatte für dick oder dünn durchaus umstritten. Er ist zwar einfach und praktisch, ignoriert aber die individuell unterschiedliche Konstitution verschiedener Menschen. So erreichen Bodybuilder ohne ein Gramm Fett zu viel auf den Rippen dank Muskelmasse leicht BMI-Werte von mehr als 30. Und auch unter Normalverbrauchern unterscheidet der BMI nicht zwischen physiologisch aktivem Viszeralfett und relativ harmlosen Unterhautfett. Alternativen wie den Body Shape Index (BSI), in dessen Berechnung auch der Bauchumfang einfließt, haben sich bisher aber noch nicht wirklich durchgesetzt.

Schließlich diskutieren Forscher auch die Idee einer „metabolically healthy obesity“. Unter Fettleibigen finden sich nämlich durchaus auch solche ohne metabolisches Syndrom. Ob diese „gesunden Dicken“ tatsächlich auf Dauer rund und gesund bleiben oder ob sie früher oder später doch noch erkranken, ist allerdings die nächste Streitfrage.

Fragen Sie ihren Arzt!

Sich als Laie in diesem Gefecht der Argumente ein Bild zu machen fällt nicht leicht. Zudem gilt wie immer, dass sich Erkenntnisse aus epidemiologischen Daten nicht automatisch auf den Einzelfall übertragen lassen.

Liegt der BMI deutlich über 25 hält es Präventivmediziner Michael Leitzmann aber schon für sinnvoll, sich Gedanken zu machen. „Für den ersten Schritt gilt die vielleicht etwas banale, aber fast alternativlose Empfehlung: Sprechen Sie mit ihrem Arzt darüber.“ Eine gründliche Anamnese und weitere Untersuchungen wie ein Bluttest helfen, gemeinsam mit dem Arzt den individuellen Handlungsbedarf einzuschätzen und gegebenenfalls den aussichtsreichsten Weg zum Abnehmen einzuschlagen. Der führt in den meisten Fällen über eine Ernährungsumstellung und mehr Bewegung. Es gibt gute Evidenz dafür, dass diese Kombination tatsächlich zu einer Gewichtsreduktion führt – ganz gleich, ob man nun zum Jahresbeginn oder sonst wann damit anfängt.

Text: Georg Rüschemeyer

Alle Teilnehmer sollten nachbeobachtet werden

Dies ist der 19. Beitrag einer Blogserie zu einer Zusammenstellung von „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Informed Health Choices (IHC) Projektes erarbeitet wurden. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem der Schlüsselkonzepte, die als wichtig dafür erachtet werden, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Dass Teilnehmer aus Studien ausscheiden oder nicht nachbeobachtet werden können ist in der Forschung nichts ungewöhnliches, kann jedoch zu verzerrten Einschätzungen der Wirkung von Behandlungen führen.

Es gibt viele Gründe, warum Teilnehmer aus Studien ausscheiden oder für die Nachbeobachtung ‚verloren gehen‘ („lost to follow-up“), das heißt, fehlen [1]. Zum Beispiel ist die Teilnahme an einer Studie häufig mit einem Zeitaufwand verbunden, den einige Teilnehmer wegen anderer alltäglicher Verpflichtungen nicht einhalten können. Oder das Studienteam verliert aus irgendeinem Grund Kontakt zu Studienteilnehmern.

Wann wird die fehlende Nachbeobachtung zum Problem?

Zum Problem werden fehlende Nachbeobachtungen, wenn viele Teilnehmer „verloren gehen“, besonders wenn der Anteil der fehlenden Teilnehmer zwischen den verschiedenen Behandlungsgruppen ungleich verteilt ist [2]. Wenn zum Beispiel 75 % der Teilnehmer aus einer Gruppe und nur 15 % der Teilnehmer aus einer Vergleichsgruppe bei der Nachbeobachtung fehlen, ist ein Vergleich der Ergebnisse der verbleibenden Teilnehmer in den beiden Gruppen kein fairer Vergleich mehr.

Nehmen wir einmal an, in einer Studie wird ein neues Medikament gegen Kopfschmerzen (das „Amustriptan“ heißt) mit einem herkömmlichen Medikament verglichen, um zu bewerten, ob das neue Medikament besser gegen Kopfschmerzen wirkt als das alte. Die Teilnehmer der Studie werden gebeten, noch vor der Injektion des Medikaments sowie eine Woche und einen Monat danach einen Fragebogen auszufüllen.

Acht Prozent der Patienten, die der Behandlung mit Amustriptan zugeteilt waren, haben den letzten Fragebogen nicht ausgefüllt (fehlten bei der Nachbeobachtung), im Vergleich zu nur einem Prozent der Patienten in der Gruppe mit dem alten Medikament. Die vorliegenden Ergebnisse deuten darauf hin, dass Patienten aus der Amustriptan-Gruppe nach einem Monat Behandlung im Vergleich zu den Patienten, die das herkömmliche Medikament bekommen haben, weniger Kopfschmerzen hatten. Was aber ist mit denen, die nicht nachbeobachtet werden konnten?

Irreführende Ergebnisse?

Möglicherweise haben die Patienten in der Amustriptan-Gruppe ihren Fragebogen nach einem Monat nicht ausgefüllt, weil bei ihnen die Anzahl der Kopfschmerzattacken gestiegen war, und zwar so stark, dass Sie den Fragebogen nicht ausfüllen konnten. Zum Zeitpunkt, als sie das hätten tun sollten, lagen sie mit Kopfschmerzen im Bett. In diesem Szenario lassen die fehlenden Nachbeobachtungen das neue Medikament viel besser aussehen, als es ist, da die Ergebnisse der nicht einbezogenen Teilnehmer negativ waren.

Das kann auch in die umgekehrte Richtung gehen. Die Teilnehmer in der Amustriptan-Gruppe könnten ausgeschieden sein, weil sie sich sehr viel besser fühlten. Womöglich hatten sie seit der Injektion überhaupt keine Kopfschmerzen mehr und haben sich daher entschieden, nicht länger an der Studie teilzunehmen. In diesem Falle lässt das Fehlen bei der Nachbeobachtungen das neue Medikament tatsächlich schlechter aussehen, als es ist, da die Ergebnisse der nicht einbezogenen Teilnehmer positiv waren.

Es gibt auch noch eine dritte Möglichkeit: Mitunter führen fehlende Nachbeobachtungen nicht zu irreführenden Ergebnissen [3]. Wenn in der Amustriptan-Gruppe zum Beispiel ein größerer Anteil von Teilnehmern für die Nachbeobachtung fehlten, weil der Studienkoordinator vergaß, einem zufälligen Teil der Teilnehmer den Fragebogen einen Monat nach der Injektion auszuhändigen, könnten die Ergebnisse immer noch gültig sein. Grund dafür ist, dass der Verlust für die Nachbeobachtung zufällig erfolgte und nicht auf einem Unterschied zwischen den ausgeschiedenen und den nicht ausgeschiedenen Teilnehmern beruht.

Verzerrungen durch Analysen entgegenwirken

Wissenschaftler können den Auswirkungen des Ausscheidens von Teilnehmern oder des Fehlens bei der Nachbeobachtung manchmal mit einer „Intention-to-treat-Analyse“ entgegenwirken. Das bedeutet ganz einfach, dass alle Teilnehmer, die an einer randomisierten Studie teilnahmen, in die Analyse einbezogen werden, unabhängig davon, was nach der Randomisierung (Zuteilung der Teilnehmer in Studiengruppen nach dem Zufallsprinzip) passiert ist [4].

Wie sich zeigt, ist die Thematik fehlender Nachbeobachtungen gar nicht so einfach, wie es zunächst aussieht. Manchmal sind Ergebnisse aufgrund fehlender Nachbeobachtungen scheinbar schlechter, manchmal scheinbar besser und manchmal entstehen dadurch gar keine Verzerrungen. Intention-to-treat-Analysen sind ein nützliches Werkzeug für Wissenschaftler, um Verzerrungen im Zusammenhang mit fehlenden Nachbeobachtungen zu minimieren.

Nach einer Faustregel führt ein hoher Anteil von Teilnehmern, die aus einer Studie ausscheiden, in der Regel zu einer Verzerrung der Ergebnisse [2]. Ist der Anteil dagegen gering, sind die Gründe für das Ausscheiden der Teilnehmer entscheidend dafür herauszufinden, inwiefern die Ergebnisse beeinflusst worden sind und ob die Schlussfolgerungen aus ihnen verlässlich sind [3].

Text: Ed Walsh

Übersetzt von: Katharina Jones

Zum Originaltext

Referenzen

Klicken Sie hier für weitere Materialien zum Thema, warum alle Teilnehmer nachbeobachtet werden sollten.

 

Die Gruppen in einem Behandlungsvergleich sollten gleich behandelt werden

Dies ist der 16. Beitrag einer Blogserie zu einer Zusammenstellung von „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Informed Health Choices (ICH) Projektes erarbeitet wurde. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem der Schlüsselkonzepte, die als wichtig dafür erachtet werden, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Nehmen Sie einmal an, Sie möchten herausfinden, ob Akupunktur eine wirksame Maßnahme zur Linderung von Rückenschmerzen ist. Sie gestalten also eine Studie, mit der Sie dieser Frage nachgehen…

In Anknüpfung an das Schlüsselkonzept 2.1 (Vergleiche sind notwendig, um die Wirkungen von Behandlungen zu ermitteln) entscheiden Sie, Akupunktur mit einer Schein-Akupunktur zu vergleichen. Bei einer Schein-Akupunktur könnten Nadeln verwendet werden, die in den Nadelschaft zurückgezogen werden anstatt die Haut zu durchstechen. Durch dieses Vorgehen können Sie sicherstellen, dass jegliche Behandlungseffekte (nützliche und schädliche) auf die echte Akupunktur-Behandlung und nicht auf andere Faktoren zurückzuführen sind.

Sie können sich jedoch nur dann sicher sein, dass Akupunktur im Vergleich zum Scheinverfahren einen Behandlungseffekt bewirkt, wenn Sie jegliche anderen Faktoren herausnehmen, die einen Behandlungseffekt beeinflussen könnten. Wie in Schlüsselkonzept 2.2 (Gruppen in einem Behandlungsvergleich müssen vergleichbar sein) beschrieben, stellen Sie also sicher, dass die Patienten* entweder der Akupunktur-Gruppe oder der Scheinakupunktur-Gruppe zufällig („randomisiert“) zugeteilt werden. Der entscheidende nächste Schritt, der nötig ist, damit Sie den Rückschluss ziehen können, dass jeglicher beobachtete Effekt auf die Akupunktur und nicht auf die mit ihr verglichene Scheinakupunktur zurückzuführen ist, ist, jede der zu vergleichenden Gruppen gleich zu behandeln, und zwar so umfassend wie möglich.

Die Gleichbehandlung der Gruppen ermöglicht den Rückschluss, dass jeglicher Behandlungseffekt auf die Behandlung (die echte Akupunktur) zurückzuführen ist und nicht auf Unterschiede in der Betreuung.

Lassen Sie uns zum Beispiel einmal die Akupunktur nicht mit der Scheinbehandlung sondern mit einer Kontrollgruppe von Rückenschmerz-Patienten auf einer Warteliste für eine anstehende Behandlung vergleichen. Jegliche Unterschiede in den Ergebnissen könnten auf Unterschiede in der Aufmerksamkeit, die jeder Gruppe zuteil wird, zurückzuführen sein, und nicht auf die Behandlung selbst. Wenn wir eine Scheinbehandlung einsetzen, um einen vergleichbaren Umfang an Betreuung und Zuwendung sicherzustellen, stellen wir möglicherweise fest, dass sich jegliche Effekte, die wir beobachtet haben, verlieren.

Eine Möglichkeit, unterschiedliche Grade an Zuwendung zwischen den beiden Studiengruppen zu vermeiden, ist es, diejenigen Personen, die die Behandlungen ausführen, unwissend („blind“) darüber zu lassen, welche Teilnehmer welcher Behandlung zugeteilt wurden. Bei der Verwendung versenkbarer Nadeln, die von echten Nadeln nicht zu unterscheiden sind, lassen die Behandler jeder Gruppe eher ein ähnliches Maß an Betreuung und Zuwendung zukommen.

Das bedeutet: Ergebnisse von Behandlungsvergleichen, bei denen die Betreuung der Teilnehmer in den Vergleichsgruppen (abgesehen von den verglichenen Behandlungen selbst) nicht auch ähnlich war, sind mit Vorsicht zu betrachten. Die Ergebnisse solcher Behandlungsvergleiche könnten irreführend sein.

Text: Jack Leahy

Übersetzt von: Katharina Jones

Originaltext
Referenzen
Klicken Sie hier für weitere Informationen zum Thema warum Gruppen in einem Behandlungsvergleich gleich behandelt werden sollten
Schlagworte: #Schlüsselkonzepte #Key Concepts

*Aus Gründen der besseren Lesbarkeit wird auf die gleichzeitige Verwendung männlicher und weiblicher Sprachformen verzichtet. Sämtliche Personenbezeichnungen gelten gleichermaßen für alle Geschlechter.

1.12 Spektakuläre Behandlungseffekte sind selten

Dies ist der zwölfte Beitrag einer Blogserie zu einer Zusammenstellung von „Schlüsselkonzepten zur besseren Bewertung von Aussagen zu Behandlungen“, die im Rahmen des Informed Health Choices (ICH) Projektes erarbeitet wurde. Jeder der insgesamt 36 Blogbeiträge befasst sich mit einem der Schlüsselkonzepte, die als wichtig dafür erachtet werden, Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

„Durchbruch“, „Wundermittel“, „Heilmittel“ Nur wenige Behandlungen verdienen solche dramatischen Schlagzeilen. Es ist also an der Zeit, solche Behauptungen zu hinterfragen und die Wissenschaft hinter den Schlagzeilen eingehend zu begutachten. [1]

Es gibt tatsächlich Behandlungen, die spektakuläre Wirkungen erzielen…

Behandlungen mit spektakulären Wirkungen sind solche, durch die jeder (oder fast jeder) Behandelte einen Nutzen (oder Schaden) erfährt. Zum Beispiel werden erstaunliche Erfolge mit Morphinen zur Schmerzbehandlung, Insulin bei Diabetes, Adrenalin bei schweren allergischen Reaktionen und mit Bluttransfusionen bei Schock erzielt. In diesen Fällen ist der Nutzen der Behandlungen offensichtlich, tritt sofort ein und ist durchschlagend: es besteht kaum Unsicherheit über die Wirksamkeit dieser Behandlungen [2]. Weiterlesen

1.11 Erklärungen zur Wirkung von Behandlungen können falsch sein

Dies ist der Elfte einer Reihe von über 30 Blog-Artikeln, der sich auf die Schlüsselkonzepte zur besseren Bewertung von Aussagen zu Behandlungen bezieht, die vom IHC-Projekt (Informed Health Choices) entwickelt wurden. Jeder Blog-Artikel erklärt eines dieser Schlüsselkonzepte, um Aussagen zu Wirkungen von Behandlungen besser verstehen und einordnen zu können.

Sollte man Erklärungen zu Behandlungen auf den Zahn fühlen? Woher weiß man, wann man ihnen vertrauen kann?

Vielleicht haben Sie schon davon gehört, dass Nahrungsergänzungsmittel mit Fischöl die Konzentration von Schulkindern steigern können (1). Vielleicht haben Sie als Frau auch schon eine Hormonersatztherapie nach der Menopause zur Vorbeugung von Herzinfarkt und Schlaganfall angeboten bekommen (2). Weiterlesen