Horst D. Deckert

Gedanken eines Statistikers zur Übersterblichkeit während der Coronapandemie (1/2)

Vergleicht man die offiziellen Angaben zur Übersterblichkeit mit den vom RKI veröffentlichten Zahlen der Corona-Toten, klafft dort eine größere Lücke. Der Statistiker Günter Eder hat die Daten mit Hilfe statistischer Methoden angepasst und dabei eine erstaunlich präzise Korrelation herausgearbeitet. So kann er statistisch belegen, dass es auch eine „zeitverzögerte Untersterblichkeit“ gab, aus der man schließen kann, dass zwei Drittel der Verstorbenen ohne eine Ansteckung mit Corona durchschnittlich gerade einmal zehn Wochen länger gelebt hätten. Nur ein Drittel der Coronatoten hätte ohne Infektion eine durchschnittliche Restlebenserwartung von mehr als zehn Wochen gehabt. Es ist erstaunlich, dass dieser Erkenntnis von offizieller Seite niemals in Erwägung gezogen wurde. Eder hat nun seine Gedanken in einem zweiteiligen Artikel für die NachDenkSeiten zusammengefasst.

Seit Beginn des Coronapandemie interessieren sich Menschen verstärkt für statistische Daten zum Sterbegeschehen in Deutschland. Sie verfolgen nicht nur die vom Robert-Koch-Institut (RKI) regelmäßig ausgewiesenen Daten zur Zahl der Coronatoten, sondern vielfach auch die vom Statistischen Bundesamt (StBA) veröffentlichten Angaben zur Zahl der insgesamt Verstorbenen. Von besonderem Interesse bei den Daten des Statistischen Bundesamtes ist die Frage nach der Höhe der Übersterblichkeit. Es ist die wichtigste Kenngröße zur Beurteilung des allgemeinen Sterbegeschehens. Sie hat allerdings ihre Schwächen und Tücken, die man kennen und beachten muss, wenn man sie angemessen interpretieren und falsche Schlussfolgerungen vermeiden will.

Übersterblichkeit gemäß der Definition des Statistischen Bundesamtes

Die Übersterblichkeit gibt an, wie stark zu einem bestimmten Zeitpunkt oder in einem bestimmten Zeitabschnitt die aktuelle Zahl der Sterbefälle von der erwarteten Anzahl (Basislinie) abweicht. Die Höhe der Übersterblichkeit ist somit nicht allein von der Zahl der Verstorbenen abhängig, sondern wird wesentlich mitbestimmt von der Basislinie, auf die sie sich bezieht. Abgeleitet werden Basislinien (mittels komplexer statistischer Verfahren) aus dem Sterbegeschehen und den demographischen Strukturdaten vorangegangener Jahre.

Dem Statistischen Bundesamt zufolge sollte die Übersterblichkeit aus den Sterbedaten der letzten vier Jahre abgeleitet werden. Um systematische Unter- oder Überschätzungen zu vermeiden, sollten darüberhinaus die demographischen Veränderungen in der Altersstruktur der Bevölkerung berücksichtigt werden. Ein an diesen Vorgaben orientiertes Verfahren liefert für die Coronajahre 2020 und 2021 sowie für das erste Halbjahr 2022 die in Tabelle 1 angegebenen Übersterblichkeitswerte. Die Werte sind das Resultat eigener Berechnungen, da das Statistische Bundesamt die offiziellen Übersterblichkeitswerte (gemäß obiger Definition) bis heute nicht bekannt gegeben hat. Zwar weist die Behörde durchaus Übersterblichkeitswerte aus, doch beziehen sich diese meist nur auf das Vorjahr und nicht auf die vier vorangegangenen Jahre. Und wenn tatsächlich einmal die vier Vorjahre als Referenz genutzt werden, wird die Entwicklung der Alterstruktur nicht angemessen berücksichtigt. Das führt zu einer systematischen Überschätzung der Übersterblichkeit.

Aus den eigenen Berechnungen geht hervor, dass die Coronajahre durchweg mit erhöhten Übersterblichkeiten verbunden sind. Den höchsten Wert mit einer Quote von 4,0% weist das Jahr 2021 auf. Das Jahr 2020 ist mit einer deutlich niedrigeren Übersterblichkeitsquote von 1,6% verbunden und im ersten Halbjahr 2022 liegt die Quote bei 2,2%.

Die in Tabelle 1 ausgewiesenen Übersterblichkeiten können nur sehr eingeschränkt miteinander verglichen werden, da die Basislinien, auf die sie sich beziehen, stark voneinander abweichen. So ist die Basislinie für das Prognosejahr 2020 abgeleitet aus den Grippejahren 2017 und 2018 sowie den (weitgehend) grippefreien Jahren 2016 und 2019, während die Basislinie für 2022 auf einem Grippejahr (2018), einem grippefreien Jahr (2019) und zwei Coronajahren (2020 und 2021) beruht. Das muss bei der Beurteilung der Höhe der Übersterblichkeit berücksichtigt werden.

Tabelle 1

Übersterblichkeit*) Zahl der
Coronatoten
(RKI)
Übersterblichkeit bezogen auf die Zahl der Coronatoten
Jahr Anzahl Prozent
2020 15.679 1,59% 43.826 36%
2021 40.833 4.00% 70.541 58%
2022
(bis zur 31. KW)
13.523 2,21% 29.592 46%
*) bezogen auf die vier vorhergehenden Jahre (mit Berücksichtigung des demographischen Wandels)

Auffällig ist, dass die absolute Übersterblichkeit durchweg niedriger ausfällt als die vom RKI ausgewiesene Zahl an Coronatoten. Im Jahr 2020 macht die Übersterblichkeit nur 36% der RKI-Coronatoten aus, im Jahr 2021 liegt der Anteil etwas höher und beträgt 58%. Als Erklärung für die Untererfassung der Zahl der Coronatoten wird allgemein auf die ausgebliebenen Grippewellen in den Coronajahren verwiesen. Und der Einwand ist berechtigt; doch stellt sich die Frage, ob er die Differenz vollständig erklären kann.

Modifizierte Übersterblichkeit

Grundsätzlich wäre es für die Aussagekraft von Übersterblichkeitswerten von Vorteil, wenn die Basislinie nicht so starken zufälligen Schwankungen unterliegen würde, wenn sie also nicht so sehr von auftretenden oder nicht auftretenden Infektionswellen abhinge. Dann könnte man die Ergebnisse direkter und aussagekräftiger miteinander vergleichen.

Im Laufe des zweiten Coronajahrs ist das Statistische Bundesamt auf die Problematik aufmerksam geworden und verwendet seit Juli 2021 nicht mehr das arithmetische Mittel der letzten vier Jahre zur Beurteilung der Höhe der Übersterblichkeit, sondern den Median. Bei der Berechnung des Wertes bleiben die niedrigste und die höchste Sterbefallzahl aus den vier Vorjahren unberücksichtigt. Mit der Änderung des Verfahrens ist letztlich nicht allzu viel gewonnen. Zwar ist der Algorithmus jetzt etwas weniger anfällig gegen Ausreißer, doch sind die Ergebnisse nicht wesentlich besser miteinander vergleichbar als es vorher der Fall war und sie sind auch nicht aussagekräftiger interpretierbar.

Das europäische Forschungsnetzwerk EuroMOMO hat eine andere, recht elegante Lösung für das Problem entwickelt, indem es die Basislinie ausschließlich aus Sterbedaten im Frühjahr (16. bis 25. KW) und Herbst (37. bis 44. KW) ableitet, aus Zeitabschnitten also in denen Grippe- und Hitzewellen keine entscheidende Rolle für das Sterbegeschehen spielen. Der Verlauf der Basislinien wird mittels trigonometrischer Regressionen berechnet und das Ergebnis anschließend auf das gesamte Kalenderjahr ausgeweitet. So wird der verzerrende Grippeeinfluss ausgeschaltet und man kann die Übersterblichkeitswerte verschiedener Länder direkt miteinander vergleichen. Durch Corona hat sich die Zeitstruktur des Krankheitsgeschehens nun allerdings erheblich verändert. Die Zeitintervalle, die bisher für die Ermittlung der Basislinie verwandt wurden, sind nicht mehr geeignet, neben dem Grippe- auch den Coronaeinfluss herauszufiltern. Sie müssten grundlegend überarbeitet und neu festgelegt werden, damit das Verfahren weiterhin sinnvoll angewendet werden kann.

In der vorliegenden Studie ist ein einfacherer und anschaulicherer Weg beschritten worden, um den verzerrenden Einfluss epidemischen Infektionsgeschehens einzuschränken. Für die Ermittlung der Basislinie wird ausschließlich auf Sterbedaten solcher Jahre zurückgegriffen, in denen es keine ausgeprägten Grippe- oder Coronawellen gab. Hitzeperioden werden zunächst nicht beachtet, spielen in der weiteren Datenanalyse allerdings durchaus eine Rolle.

In den vier Jahren vor Corona waren lediglich die Jahre 2016 und 2019 weitgehend grippefrei. Sie bilden folglich die Grundlage für die Ermittlung der Basislinie. Diese wird anschließend mittels Korrekturfaktoren, entsprechend den zwischenzeitlichen Veränderungen in der demographischen Altersstruktur, an das jeweilige Prognosejahr angepasst. Auf diese Weise erhält man die in Tabelle 2 angegebenen (modifizierten) Übersterblichkeitswerte.

Tabelle 2

modifiz. Übersterblichkeit*) Zahl der
Coronatoten
(RKI)
Übersterblichkeit bezogen auf die Zahl der Coronatoten
Jahr Anzahl Prozent
2020 28.506 2,88% 43.826 65%
2021 58.088 5,69% 70.541 82%
2022
(bis zur 31. KW)
26.914 4,40% 29.592 91%
*) bezogen auf die grippefreien Vorjahre 2016 und 2019 (mit Berücksichtigung des demographischer Wandels)

Dadurch, dass jetzt der verzerrende Einfluss von Grippe- und Coronawellen auf die Basislinie weitgehend ausgeschaltet ist, liefert das Verfahren tendenziell höhere Werte für die Übersterblichkeit. Die Jahreswerte steigen von 15.679 auf 28.506 Todesfälle (2020) und von 40.838 auf 58.088 Todesfälle (2021). Der relativ stärkste Anstieg ist im ersten Halbjahr 2022 zu verzeichnen.

Im Jahr 2020 macht die Übersterblichkeit jetzt 65% der vom RKI ausgewiesenen Coronatoten aus. In den darauf folgenden Jahren liegen die Prozentsätze höher und betragen 82% (2021) bzw. 91% (1. Hj. 2022). Wenn man davon ausgeht, dass die RKI-Angaben zur Zahl der Coronatoten korrekt sind, liegt es nahe, den Prozentwert als Kriterium zu verwenden, um die ermittelte Übersterblichkeit zu bewerten. Ein Übersterblichkeitswert wäre danach als umso verlässlicher anzusehen je besser er mit dem RKI-Wert übereinstimmt (und umgekehrt). Die für 2021 ermittelte Übersterblichkeit (mit einer Übereinstimmungsquote von 82%) wäre demnach als „besser“ zu einzuschätzen als die Übersterblichkeit für 2020, die lediglich mit einer Quote von 65% verbunden ist. Doch das wäre eine voreilige Schlussfolgerung, bei der zu viele Faktoren unberücksichtigt blieben. Tatsächlich ist es im vorliegenden Fall sogar genau umgekehrt.

Modifizierte Übersterblichkeit im Jahresverlauf

Aus Abbildung 1 wird ersichtlich, warum die ermittelten Jahreswerte das Coronageschehen nicht adäquat widerspiegeln. Es sind hier die Verläufe für die Übersterblichkeit und für die Zahl der Coronatoten gegeneinander aufgetragen.

Abbildung 1

Es zeigt sich, dass die Übersterblichkeit im Jahr 2020 – trotz der niedrigen Übereinstimmungsquote von lediglich 65% – recht gut mit der Coronakurve harmoniert. Das trifft besonders auf die beiden Coronawellen in 2020 zu. Lediglich in der auslaufenden Phase der ersten Welle sind die Coronasterbezahlen im Vergleich zur Übersterblichkeit etwas zu hoch. Ansonsten verlaufen die Kurven während beider Wellen weitgehend parallel und weisen etwa gleich hohe Maximalwerte auf. Größere Abweichungen gibt es in den ersten Wochen des Jahres (vor Beginn der Coronapandemie) und während der Hitzeperiode im Sommer (33. KW 2020). Zudem ist im Frühjahr/Sommer eine Phase tendenzieller Untersterblichkeit zu erkennen.

Die insgesamt recht gute Übereinstimmung der Verläufe im Jahr 2020 deutet darauf hin, dass die vom RKI veröffentlichten Daten zur Zahl der Coronatoten im Prinzip korrekt sind. Lediglich in der absteigenden Phase der ersten Welle fallen die Coronasterbezahlen im Vergleich zur Übersterblichkeit etwas zu hoch aus. Das entspricht einerseits natürlich den Erwartungen, ist tatsächlich jedoch alles andere als selbstverständlich. Es ist deshalb nicht selbstverständlich, weil die Toten vom RKI nicht danach unterschieden werden, ob sie AN oder MIT Corona gestorben sind. Die ausgewiesene Zahl an Coronatoten umfasst demnach nicht nur die Menschen, die ursächlich an Corona gestorben sind, sondern auch die, die lediglich mit Corona verstarben. Unabhängig von der wahren Todesursache werden alle Menschen als Coronatote gezählt, für die ein positiver PCR-Test vorliegt.

Angesichts dieser Sachlage ist die gute Übereinstimmung der Verläufe im Jahr 2020 eigentlich nur erklärbar, wenn man davon ausgeht, dass nicht nur die Menschen vorzeitig gestorben sind, bei denen die Coronainfektion die primäre Todesursache war, sondern auch die, die zwar positiv getestet waren, aber letztlich an anderen Krankheiten gestorben sind. Letztere sind vorzeitig verstorben, weil zu den bestehenden tödlichen Vorerkrankungen noch eine Coronainfektion hinzugekommen ist.

Für die statistische Auswertung der Sterbedaten ist die Frage nach der Todesursache damit zunächst einmal von untergeordneter Bedeutung. Das heißt nicht, dass die Frage grundsätzlich unwichtig wäre. Für Mediziner dürfte sie weiterhin zentral sein, da die Wahl der Therapie und damit das Leben des Patienten von der Antwort abhängen können. Auch aus politischer Sicht ist die Unterscheidung wichtig. Man wird andere Maßnahmen zum Schutz der Bevölkerung ergreifen, wenn alle Menschen gleichermaßen gefährdet sind, an einer Coronainfektion zu versterben, als wenn das lediglich auf bestimmte, gravierend vorerkrankte oder hochbetagte Bevölkerungsgruppen zutrifft.

Im Folgejahr 2021 stimmen die Verlaufskurven deutlich schlechter überein. Insbesondere in der Übergangsphase von der zweiten zur dritten Coronawelle verläuft die Übersterblichkeitskurve weit unterhalb der Zahl der Coronatoten. In der zweiten Jahreshälfte kehrt sich die Situation dann um. Ab der 35. KW liegen die Übersterblichkeitswerte durchweg über den Corona-Sterbezahlen. Die größte Abweichung nach oben ist auf dem Höhepunkt der vierten Coronawelle zu verzeichnen.

Deutlich unstrukturierter verläuft die Übersterblichkeitskurve im Jahr 2022. Sie liegt zunächst unterhalb der Zahl der Coronatoten, steigt dann an und oszilliert ab der 15. KW um die Coronakurve. In der 25. und 29. Woche des Jahres sind ausgeprägte Peaks zu erkennen, die vermutlich von den Hitzeperioden herrühren, die das Wettergeschehen in dieser Zeit prägten. Die erhöhten Sterbezahlen während der Hitzeperioden tragen wesentlich zur hohen Gesamtübersterblichkeit von 4,40% in 2022 bei.

Es stellt sich die Frage, ob und wenn ja welche Erklärung es für die systematischen Abweichungen des Übersterblichkeitsverlaufs von der Zahl der Coronatoten gibt. Lassen sich konkrete Einflüsse benennen und wie lassen sich diese quantifizieren? Um Licht in das Dunkel zu bringen, werden verschiedene lineare Regressionsanalysen mit der Übersterblichkeit als Zielgröße und der Zahl der Coronatoten als Einflussgröße durchgeführt. Dies geschieht getrennt für das Jahr 2020 (ab der 10. KW) und für die Zeit 2021/2022. Erhöhte Übersterblichkeitswerte, die von sommerlichen Hitzewellen herrühren, werden in die Analyse nicht einbezogen, da sie keinen direkten Zusammenhang zum Coronageschehen haben.

Mit Hilfe der Regressionsanalysen wird untersucht, wie eng der modifizierte Übersterblichkeitsverlauf mit den Corona-Sterbezahlen verbunden ist. Als Kriterium zur Beurteilung der Stärke des Zusammenhangs dient das Bestimmtheitsmaß (R2). Das Bestimmtheitsmaß ist eine statistische Kenngröße, die Werte zwischen 0% als Minimum und 100% als Maximum annehmen kann. Je höher der Prozentwert ausfällt, desto besser stimmen der tatsächliche und der regressionsanalytisch ermittelte Übersterblichkeitsverlauf überein. Ein Wert nahe 100% bedeutet, dass die Höhe der Übersterblichkeit praktisch nur von der Höhe der Corona-Sterbezahlen abhängt. Je niedriger das Bestimmtheitsmaß ist, desto wahrscheinlicher ist es, dass es weitere relevante Einflussgrößen gibt.

Den Abbildungen 2 und 3 können die Ergebnisse der Regressionsanalysen für 2020 und für 2021/2022 entnommen werden. Die eingefügten Textfelder geben Auskunft über das Regressionsmodell und die Güte der Anpassung (R2).

Für das Jahr 2020 liefert die Regressionsanalyse ein Bestimmtheitsmaß von 93,9%. Der hohe Wert ist Ausdruck der guten Übereinstimmung Kurvenverläufe. Neben der Zahl der Coronatoten bleibt kaum Spielraum für weitere Faktoren, die den Verlauf der Übersterblichkeit noch entscheidend beeinflusst haben könnten.

Ganz anders stellt sich die Situation in 2021/2022 dar. Zwar ist auch hier die Übersterblichkeit hochsignifikant mit der Zahl der Coronasterbefälle verknüpft, doch kann der Parameter den Übersterblichkeitsverlauf nur zu 43,9% erklären. Das bedeutet, wenn man von der Richtigkeit der RKI-Angaben ausgeht, dass es mindestens noch einen weiteren Faktor geben muss, der die Übersterblichkeit entscheidend beeinflusst.

Lesen Sie morgen den zweiten Teil der Analyse

Abbildung 2

Abbildung 3

Titelbild: gnepphoto8/shutterstock.com

Ähnliche Nachrichten