GRADE Logo

Die Vertrauenswürdigkeit von Evidenz nach GRADE

5
(1)

In Cochrane Reviews sind sie allgegenwärtig: Die Bewertungen der Vertrauenswürdigkeit von Evidenz nach dem System von GRADE. In diesem Beitrag wollen wir eine Kurzanleitung für die Interpretation von GRADE-Angaben liefern.

Das Akronym GRADE steht für Grading of Recommendations, Assessment, Development and Evaluation. GRADE ist ein seit 20 Jahren stetig weiterentwickeltes, international anerkanntes System, mit dessen Hilfe sich die Vertrauenswürdigkeit (oft auch „Qualität“) der Evidenz in systematischen Übersichtsarbeiten und Leitlinien einschätzen lässt. Auch Cochrane nutzt seit vielen Jahren GRADE, um auszudrücken, wie zuverlässig bestimmte Teilergebnissergebnisse eines Reviews sind.

Das Verfahren ist komplex. Mindestens zwei Gutachter*innen (in der Regel Autor*innen eines Reviews) bewerten dabei unabhängig voneinander nach dem transparenten System von GRADE die vorliegende Evidenz aus wissenschaftlichen Studien. Wie das im Einzelnen funktioniert und welche Kriterien dabei eine Rolle spielen, ist Thema eines älteren Beitrags auf Wissen Was Wirkt. GRADE lässt sich sowohl auf randomisierte kontrollierte Studien (RCTs, sie gelten als idealer Studientyp in der Evidenzbasierten Medizin), als auch auf Beobachtungsstudien anwenden, mit leicht unterschiedlichen Regeln für die Bewertung.

GRADE-Bewertungen beziehen sich stets auf die Gesamtheit der Evidenz aus u. U. zahlreichen Studien zu einer sogenannten PICO-Fragestellung. Das Akronym PICO steht für: Population (oder Patienten), Intervention, Comparison (Vergleich) und Outcome (Behandlungsziel). Es handelt sich also um klar definierte Fragen wie:

Ist bei Patienten mit starkem Übergewicht (P) das neue Medikament (I) im Vergleich zum Standardmedikament (C) wirksamer, um den Blutdruck zu senken (O)?

Die Ergebnisse der GRADE-Bewertung werden ganz einfach als eine von vier Stufen der Vertrauenswürdigkeit nach GRADE angegeben. Eine zentrale Rolle spielt dabei die Frage, wie sicher man sich sein kann, dass die aus der Zusammenschau der Studien abgeleiteten Ergebnisse der Wahrheit nahe kommen. Statistiker sprechen von dem aus der (immer begrenzten) Evidenz abgeleiteten Effektschätzer und der Frage, wie gut dieser den eigentlich gesuchten wahren Effekt wiedergibt.

Die vier Stufen der Vertrauenswürdigkeit von GRADE

  • Sehr niedrig:
    Der aus den Studienergebnissen abgeleitete Effekt (also der Effektschätzer) unterscheidet sich wahrscheinlich deutlich vom gesuchten, wahren Effekt. Weitere Studien werden den Effektschätzer mit hoher Wahrscheinlichkeit noch in die eine oder andere Richtung verändern.
  • Niedrig:
    Die Autor*innen sind etwas zuversichtlicher, dass ihr Ergebnis dem wahren Effekt nahe kommt. Weitere Studien können das Ergebnis aber noch merklich verändern.
  • Moderat:
    Die Autor*innen kommen zu dem Schluss, dass das Ergebnis dem wahren Effekt nahe kommen.
  • Hoch:
    Die Autor*innen sind sich sicher, dass das Ergebnis dicht am wahren Effekt liegt.

Was bedeutet dies in der Praxis?

  • Sehr niedrige Vertrauenswürdigkeit der Evidenz bedeutet, dass wir uns nicht darauf verlassen können und dass die Evidenz keine brauchbare Grundlage für Entscheidungen (etwa für oder gegen eine bestimmte Behandlung) abgibt.
  • Niedrige Vertrauenswürdigkeit wird in Cochrane Reviews sprachlich meist mit Beschreibungen wie „Maßnahme X könnte den Effekt Y haben“ wiedergegeben. Solche Evidenz sollte man nur mit entsprechender Vorsicht für Entscheidungen nutzen.
  • Moderate Vertrauenswürdigkeit: „Maßnahme X hat wahrscheinlich den Effekt Y“.
  • Hohe Vertrauenswürdigkeit: „Maßnahme X hat den Effekt Y“. Die Bewertung moderat oder hoch bedeutet, dass die vorliegende Evidenz unter Beachtung aller Einschränkungen eine brauchbare Basis für Entscheidungen abgibt.

Wie gefällt Ihnen dieser Artikel?

Klicken Sie auf einen Stern, um den Artikel zu bewerten.

Durchschnittsbewertung: 5 / 5. Anzahl an Bewertungen: 1

Bisher keine Bewertungen. Seien Sie die/der Erste!

Wir freuen uns über Rückmeldung von Ihnen!

Schreiben Sie uns, was wir in Zukunft verbessern oder beibehalten sollten?

Scroll to Top