Statistikkritik

Ein wenig Statistik zum Coronavirus

Written by Jürgen Fischer. Posted in Statistikkritik

Wie groß ist das Risiko einer Ansteckung mit dem Coronavirus? Das hängt u.a. davon ab, wie viele Einwohner schon infiziert sind. Das RKI stellt entsprechende Statistiken zur Verfügung. Es gibt ein Dashboard des RKI (https://corona.rki.de) COVID-19 Fälle/100.000 Einwohner.
Darin sieht man für jedes Bundesland die Anzahl der Fälle auf 100.000 Einwohner. Die x-Achse geht von 0 bis 50 (Einwohner). Es ergeben sich lange Balken, wie man der nachfolgenden Grafik entnehmen kann, wobei der Stand vom 21.03.2020 zugrunde gelegt wurde.

Da die Bezugsgröße aber „100.000 Einwohner“ ist, sollte die x-Achse auch bis 100.000 Einwohner gehen. Denn dann wird das „wahre“ Ergebnis sichtbar.

Da man keine Balken mehr sehen kann, die sind nämlich so kurz, dass man sie nicht erkennt, habe ich die Zahlen aus dem Chart des RKI vom 21.03.2020 in der Grafik anzeigen lassen.

Man kann anstelle der 100.000 Einwohner auch prozentuale Anteile ausweisen, um das Risiko zu verdeutlichen. Ein Prozent bedeutet Hundertstel. Daher geht eine Prozentskala bis 100. Das sieht wie folgt aus.

Man sieht wieder nichts, weil die Balken wiederum viel zu kurz sind. Daher habe ich wiederum die Zahlen ergänzt, die zwischen 0,01 Prozent und maximal 0,05 Prozent liegen. Man muss also schon sehr stark heranzoomen, um etwas erkennen zu können.

Es ist deutlich zu erkennen, dass das Risiko extrem gering ist.

Hinzu kommt ein weiterer Effekt. Die Anzahl neuer COVID-19-Fälle geht bereits seit einigen Tagen signifikant zurück. Aktuell haben wir ca. 22.000 (RKI) bis 24.000 (https://coronavirus.jhu.edu/map.html) Infizierte in Deutschland, die Zahlen schwanken je nach Quelle etwas. Vor wenigen Tagen verdoppelte sich die Anzahl an Corona-Infizierten in Deutschland noch alle 2,2 bis 2,6 Tage. Aktuell liegen wir bei ca. 3,5 Tagen, wobei auch diese Zahl mit hoher Wahrscheinlichkeit falsch ist. Es ist sehr wahrscheinlich, dass es viel länger dauert, bis es zu einer Verdopplung kommt.

Tatsache ist: Wir haben keinen exponentiellen Anstieg, denn ansonsten dürfte die Anzahl der Tage bis zu einer Verdopplung nicht deutlich sinken. Trotzdem wird in der Presse weiterhin etwas anderes behauptet.

Um es noch einmal auf den Punkt zu bringen: Wir haben einen degressiven Verlauf. Die Zunahme der Neuinfizierungen nimmt also ab.

Die letzte Woche seitens der Politik ergriffenen Maßnahmen können aufgrund der Inkubationszeit noch nicht wirken. Daher muss es andere Ursachen für das Absinken der Anzahl neuer COVID-19-Fälle geben.

In der Pressekonferenz des RKI am heutigen Vormittag, 23.03.2020, wurde genau das bestätigt, wobei ich den Großteil dieses Textes schon am Samstag geschrieben habe, denn dieser Trend war bereits am Samstag zu erkennen – wer Statistik kann, ist klar im Vorteil. Der Präsident des RKI, Professor Dr. Lothar H. Wieler, hat in seiner Pressekonferenz gesagt, dass er einen Rückgang in der Zunahme erkennen kann. Er wäre „vorsichtig optimistisch, dass sich die Ausbreitung des Coronavirus leicht verlangsamt und sich damit der Anstieg der Coronavirus-Fälle in Deutschland leicht abschwächt“, wobei er darauf hinwies, dass es eigentlich etwas zu früh sei, weil die Maßnahmen ja erst vor Kurzem ergriffen wurden.

Natürlich fiel in seiner Pressekonferenz nicht die Aussage, dass das Abnehmen der Zunahme an Infizierten eventuell mit den seitens der Politik ergriffenen Maßnahmen in keinem oder nur geringen Zusammenhang steht. Das RKI hängt schließlich am Gesundheitsministerium und insofern macht es politische Aussagen. Ich kann den Einfluss der Maßnahmen nicht bewerten, allerdings können wir eine so schnelle Wirkung eher ausschließen.

Und noch ein paar Zahlen, die allerdings schon ein paar Tage alt sind: Laut der Coronavirus-Weltkarte (siehe bspw. morgenpost.de) gibt es in Deutschland (Stand, 21.03.2020, 6 Uhr) 19.848 Coronainfizierte und 68 Todesfälle. Laut Robert Koch-Instituts (Stand 20.03.2020) sind es 13.957 Infizierte und 31 Tote. Letalität weiterhin konstant bei 0,2 Prozent.

Im Wochenbericht des Robert Koch-Instituts zur „normalen“ Influenza in Deutschland in Kalenderwoche 10/2020 (29.02. bis 06.03.2020) steht Folgendes: „Seit der 40. KW 2019 wurden insgesamt 145.258 labordiagnostisch bestätigte Influenzafälle an das RKI übermittelt. Bei 23.276 (16 %) Fällen wurde angegeben, dass die Patienten hospitalisiert waren. […] Seit der 40. KW 2019 wurden insgesamt 247 Todesfälle mit Influenzavirusinfektion übermittelt.“

Der aktuelle Wochenbericht des Robert Koch-Instituts zur Influenza in Kalenderwoche 11/2020 (07. bis 13.03.2020) weist Folgendes aus: „Seit der 40. KW 2019 wurden insgesamt 165.036 labordiagnostisch bestätigte Influenzafälle an das RKI übermittelt. Bei 23.646 (14 %) Fällen wurde angegeben, dass die Patienten hospitalisiert waren. […] Seit der 40. KW 2019 wurden insgesamt 265 Todesfälle mit Influenzavirusinfektion übermittelt.“

Das entspricht einem Anstieg von 20.000 Influenza-Infizierten und 18 Toten in nur einer Woche. Die Letalität liegt bei 0,16 Prozent.

Der Anstieg der Influenza-Infizierten in nur einer Woche ist höher als die Gesamtzahl der mit dem Coronavirus infizierten Menschen nach mehreren Monaten. Die Letalität der Influenza liegt diesen Zahlen zu Folge nur leicht unter der des Coronavirus. Absolut sind deutlich mehr Menschen am Influenzavirus als am Coronavirus gestorben.

Was ist mit Italien? Es gibt Länder, in denen die Letalität weitaus höher zu sein scheint als in Deutschland. Es gibt unterschiedliche Begründungen für diese Unterschiede. Genannt werden u.a. andere Familienverhältnisse mit mehreren Generationen unter einem Dach, ein hoher Anteil alter und sehr alter Menschen und ein schlechtes Gesundheitssystem. Ich erachte die Wahrscheinlichkeit als sehr hoch, dass sich die extrem hohen Unterschiede in der Letalität nicht mit diesen Variablen begründen lassen bzw. die Variablen nur einen kleinen Anteil der Unterschiede erklären. Deutlich wahrscheinlicher ist ein Fehler beim Zählen, entweder wurden Menschen mit anderen Todesursachen den Corona-Toten hinzugezählt oder die Anzahl der Infizierten ist in Italien und weiteren Ländern weitaus höher als die statistisch erfassten oder, und das erachte ich aufgrund der sehr hohen Unterschiede als am wahrscheinlichsten, beide Effekte treten gemeinsam auf.

Noch ein wichtiger Aspekt muss erwähnt werden: Wie hoch ist die Wahrscheinlichkeit, dass wir den ersten Coronafall im Januar treffsicher identifiziert haben, also den einen unter 83 Millionen Einwohnern? Genau, die Wahrscheinlichkeit tendiert gegen Null. Es ist viel wahrscheinlicher, nämlich mit einer Wahrscheinlichkeit von fast 100 Prozent, dass es vorher schon Corona-Fälle gab. Und wenn es davon schon viele gab, dann verläuft die Kurve noch deutlich degressiver als man das aus den aktuellen Zahlen ablesen kann.

Es gibt zahlreiche Indizien dafür, dass Corona bereits früher in Europa war. Ich kann nicht beurteilen, ob mit absoluter Sicherheit ausgeschlossen werden kann, dass das Virus zuerst in Europa und nicht in China war. Wir haben in Europa erst spät mit dem Testen begonnen.

Weiterhin steigt die Anzahl der Fälle noch aus einem ganz anderen Effekt. Wir testen auf das Coronavirus, was wir vor Bekanntwerden des Coronavirus nicht gemacht haben. Und wir testen zunehmend mehr. Alleine diese Tatsache führt zu einem Anstieg der Infizierten. Wenn ich bei 100.000 Infizierten nicht teste, finde ich keinen Infizierten. Wenn ich zunehmend mehr teste, finde ich zunehmend mehr und wenn ich die Testintensität erhöhe, was wir gemacht haben, finde ich schneller immer mehr. Das gilt auch dann, wenn sich an der Anzahl der absolut Infizierten kaum etwas ändert. Und es gilt sogar dann, wenn sich die Anzahl der absolut Infizierten verringert. Würde die Anzahl der Infizierten im Beispiel von 100.000 auf 90.000 sinken, weil 10.000 wieder genesen sind, würden wir trotzdem mehr Fälle finden, weil wir mehr und schneller testen. Diesen Effekt kann derzeit keiner ausschließen, ich wüsste zumindest nicht wie.

Und wenn wir bei den Toten nicht gezielt nach einem Coronavirus schauen, was wir logischerweise erst konnten, nachdem wir von seiner Existenz wussten, sind die Menschen davor an anderen Ursachen verstorben und uns wäre das Coronavirus als Todesursache nicht aufgefallen.

Das Durchschnittsalter der bisher am Coronavirus gestorbenen Menschen in Deutschland lag nach Information des RKI (nachzuhören auf Instagram in der heutigen Pressekonferenz) bei 82 Jahren. Die durchschnittliche Lebenserwartung in Deutschland liegt aktuell zwischen 80 und 81 Jahren, also darunter. Es ist unklar, wie viele Menschen in Deutschland an und wie viele mit dem Coronavirus gestorben sind.

Damit kein falscher Eindruck entsteht: Obwohl ich hier sehr rational über Letalität und Verstorbene spreche, ist jeder vermeidbare Tote natürlich einer zu viel. Allerdings sollten wir bei der Vermeidung von Toten eher bei anderen Erkrankungen wie Krebs oder Hunger ansetzen, weil wir dadurch viel mehr Menschen retten würden.

Und ganz zum Schluss: Die Letalität liegt für Deutschland weiterhin und seit Wochen konstant bei 0,2 Prozent aller Fälle. Wenn man diese Zahl mit der Wahrscheinlichkeit, überhaupt am Virus zu erkranken, multipliziert, weiß man, wie hoch das Sterberisiko durch Corona insgesamt ist. Wir haben knapp 83 Millionen Einwohner und 25.000 statistisch erfasste Infizierte. Das ergibt 0,0003 oder 0,03 Prozent.

Die Wahrscheinlichkeit, dass wir alle sterben werden, liegt exakt bei 100 Prozent. Die Wahrscheinlichkeit, dass wir alle NICHT am Coronavirus sterben werden, ist fast genauso hoch.

Von: Jürgen Fischer -