Diese Seite befindet sich derzeit im Aufbau.


FAQ

Was ist das Ziel dieser Plattform?
Das Hauptziel dieses Projekts besteht darin, die Werte der 7-Tages-Hospitalisierungsinzidenz für Deutschland und die Bundesländer zuverlässig zu schätzen und aus vorläufigen Daten aktuelle Trends herauszuarbeiten. Die häufig angegebenen jeweils neuesten Werte der rohen Hospitalisierungsinzidenz unterschätzen die entsprechende wahre Zahl der Hospitalisierungen (siehe dazu die Antworten zu den weiteren Fragen). Nowcast-Korrekturen dieser Zahlen erlauben eine bessere Einschätzung der derzeitigen epidemischen Lage.
Gleichzeitig haben wir ein wissenschaftliches Interesse, verschiedene Nowcasting-Verfahren miteinander zu vergleichen und zu untersuchen, ob die Kombination verschiedener Nowcasts zu verlässlicheren Ergebnissen führt.
Was ist die 7-Tage-Hospitalisierungsinzidenz?
Wir richten uns hier nach der Definition des Robert-Koch-Instituts. Die heutige 7-Tage-Hospitalisierungsinzidenz ist die Anzahl an hospitalisierten COVID-19 Fällen (absolut oder pro 100.000 Einwohner) deren Meldedatum, also das Datum an dem das lokale Gesundheitsamt die zugehörige COVID-19 Infektion elektronisch erfasst hat, in den 7 vorangegangenen Tagen liegt. Es handelt sich also nicht um die Zahl der neuen Hospitalisierungen in den letzten 7 Tagen. Auch berücksichtigt die 7-Tage-Hospitalisierungsinzidenz nicht, ob der Hospitalisierungsgrund COVID-19 oder ein anderer ist.
Weitere Informationen sowie die aktuellen und vergangenen 7-Tage-Hospitalisierungsinzidenzen finden sich auf der GitHub Seite des Robert Koch-Instituts.
Wir weisen in diesem Zusammenhang darauf hin, dass manche Bundesländer auch eingene Hospitalisiserungsinzidenzen veröffentlichen, deren Definitionen von der des RKI abweichen (z.B. zeitliche Aggregierung nach Hospitalisierungsdatum statt Meldedatum der Infektion; siehe Nachrichtenartikel des NDR). Wir betrachten ausschließlich den Indikator des RKI.
Warum sind die berichteten Werte der letzten Tage unzuverlässig und warum ist das ein Problem?
Zwischen dem Meldedatum und dem Datum, an welchem ein hospitalisierter Fall vom Robert Koch-Institut in die 7-Tage-Hospitalisierungsinzidenz aufgenommen wird, können mehrere Tage oder sogar Wochen vergehen. Hier spielen mehrere Faktoren eine Rolle. Erstens kann es sein, dass eine Person am Meldedatum nicht in einem Zustand ist, der eine Hospitalisierung erfordert, jedoch später hospitalisiert werden muss. In diesem Fall wird rückwirkend die Zahl der Hospitalisierungen für das entsprechende Meldedatum um eins erhöht. Zweitens kann es Meldeverzüge zwischen dem tatsächlichen Hospitalisierungsdatum und der Erfassung der Hospitalisierungen in den Daten des RKI geben.
Deswegen werden die täglichen nach Meldedatum ausgewiesenen Hospitalisierungen in der Regel nachträglich nach oben korrigiert. Die meisten Nachtragungen erfolgen innerhalb von wenigen Tagen, sodass vor allem die Werte der jeweils letzten Tage betroffen sind. Diese unterschätzen die tatsächlichen Hospitalisierungen oft deutlich (siehe z.B. diesen Nachrichtenartikel des NDR oder CODAG-Bericht Nr. 21 der LMU München). Das macht es sehr schwierig, aktuelle Tendenzen aus der rohen 7-Tage-Hospitalisierungsinzidenz abzulesen. Insbesondere kann der Eindruck einer fallenden Hospitalisierungsinzidenz entstehen, selbst wenn diese in Wirklichkeit steigt.
Was bedeutet Nowcasting und wie sollten die Nowcasts interpretiert werden?
Nowcasting bezeichnet ein statistisches Korrekturverfahren, das ausgehend von vorläufigen Messungen schätzt, welchen Wert die selben Größen in einer späteren finalen Version eines Datensatzes annehmen werden. In unserem Anwendunsfall schätzen wir beruhend auf den Hospitalisierungen, die bis zum heutigen Tag für ein bestimmtes Meldedatum (siehe oben) bekannt geworden sind, wie hoch die Zahl der Hospitalisierungen für dieses Datum nach Vorliegen aller Meldungen insgesamt liegen wird. Dabei werden Daten aus der Vergangenheit mit vollständiger Information genutzt.

Klassischerweise bezieht sich Nowcasting auf Ereignisse, die bereits eingetreten sind, aber noch nicht vollständig gemessen oder erfasst sind. Bei COVID-19-Fallzahlen schätzt man mittels Nowcasting-Verfahren beispielsweise, wie viele Infektionen insgesamt an einem bestimmten Tag erfasst worden sind bevor diese Daten vollständig an zentraler Stelle zusammengetragen sind. Im Fall der Hospitalisierungen trifft dies nicht ganz zu, denn es ist möglich, dass Hospitalisierungen, die einem bestimmten (Fall-)Meldedatum zuzuordnen sind zum Zeitpunkt des Nowcasts noch gar nicht passiert sind. Wir verwenden dennoch den Begriff des Nowcasting, der sich auch für diese Art von Analyse eingebürgert hat.
Die hier präsentierten Nowcasts sollten als Wahrscheinlichkeitsaussagen interpretiert werden. Eine exakte Bestimmung der tatsächlichen Hospitalisierungszahl ist nicht möglich und Nowcasts geben lediglich einen Bereich wahrscheinlicher Werte an (siehe unten).
Wieso werden mehrere verschiedene Nowcasts gezeigt? Was ist ein Ensemble-Nowcast?
Bei der Erstellung von Nowcasts wird stets eine Reihe von Annahmen getroffen. Zudem können unterschiedliche Modelle unterschiedliche zusätzliche Datenquellen mit einbeziehen. Daher können sich die Ergebnisse verschiedener Verfahren unterscheiden, und es ist es sinnvoll, mehrere Nowcasts zu vergleichen und die Bandbreite der Vorhersagen zu berücksichtigen. Zudem kann es vorteilhaft sein, verschiedene Nowcasts in einem sogenannten Ensemble-Nowcast zusammenzuführen, um eine robustere Schätzung zu erhalten. Dies hat sich beispielsweise in der Wettervorhersage, aber auch in epidemiologischen Anwendungen bewährt.
Warum ist es wichtig, Unsicherheitsintervalle mit anzugeben?
Kein Modell ist perfekt und die genaue Zahl der Hospitalisierungen zu einem bestimmten Meldedatum kann nicht exakt vorhergesagt werden. Die Nowcasts, die hier dargestellt werden, quantifizieren deshalb explizit ihre Unsicherheit, d.h. geben mit an, als wie verlässlich sie ihre eigene Schätzung ansehen. Dies geschieht mittels Intervallen, die den wahren Wert mit einer bestimmten Wahrscheinlichkeit (50% oder 95%) enthalten sollen.
Was sind mögliche Probleme und Schwächen? Wann muss man bei der Interpretation besonders vorsichtig sein?
Die zentrale Annahme, auf der die meisten Nowcasts beruhen ist, dass die Verzögerungen zwischen Meldedatum und Erscheinen einer Hospitalisierung in den Daten des RKI auch in Zukunft ähnlichen Mustern folgen werden wie in der Vergangenheit. Ist dies nicht mehr der Fall, etwa aufgrund gewichtiger Änderungen der Teststrategie oder einer Überlastung der Gesundheitsämter, so kann die Qualität der Nowcasts beeinträchtigt werden.
Wie oft werden die Nowcasts aktualisiert?
Die Nowcasts werden werktäglich aktualisiert (Montag bis Freitag). Solange ein Team seinen Nowcast noch nicht aktualisiert hat wird der Nowcast des Vortages angezeigt (oder der neueste Nowcast aus den letzten sieben Tagen). Zum Beispiel wird der RKI-Nowcast derzeit nur donnerstags aktualisiert, wenn der neue Wochenbericht erscheint. Wir zeigen diesen Nowcast jeweils bis eine neuere Fassung erscheint.
Wieso werden Nowcasts für den heutigen und den gestrigen Tag standardmäßig nicht angezeigt?
Für den heutigen und gestrigen Tag werden besonders viele Fälle nachgemeldet. Dadurch sind auch die Nowcasts für diese Tage weniger zuverlässig als für Tage, die weiter in der Vergangenheit liegen. Wir zeigen die Nowcasts für den heutigen und gestrigen Tag aus diesem Grund standardmäßig nicht an und empfehlen, sie sehr vorsichtig zu interpretieren.
Was zeigt die “Zeitreihe nach Erscheinen in RKI-Daten”?
Eine Alternative zum Nowcast der Hospitalisierungsinzidenz nach Meldedatum (also dem Datum, an dem die Infektion im lokale Gesundheitsamt elektronisch erfasst wurde, siehe oben) ist es, Hospitalisierungszahlen nach dem Zeitpunkt ihres Auftauchens im Datensatz des RKI zu aggregieren. Diese Zahlen ändern sich in den darauffolgenden Tagen nicht mehr, sodass Trends einfacher zu interpretieren sind. Die resultierende Kurve ist gegenüber der 7-Tages-Inzidenz nach Meldedatum in der Regel nach rechts verschoben, da es oft eine Verzögerung zwischen dem Meldedatum und dem Auftauchen einer Hospitalisierung in den Daten gibt.
Was zeigt die “Zeitreihe eingefrorener Werte”?
Eine weitere Alternative zum Nowcasting besteht darin, für jedes Meldedatum die 7-Tage-Hospitalisierungsinzidenz gemäß des Datenstandes am jeweiligen Datum zu zeigen. Hierdurch sind alle gezeigten Werte ähnlich unvollständig und somit besser über die Zeit hinweg vergleichbar. Ein Nachteil dieser Herangehensweise ist, dass nur ein Teil der bereits verfügbaren Information genutzt wird.
Was ist mit “nachträglich erstellten Nowcasts” gemeint?
Das Hauptziel dieses Projekts ist es, Nowcasts in Echtzeit zur Verfügung zu stellen um eine verbesserte Lageeinschätzung zu ermöglichen. Um verschiedene Modellierungsansätze besser wissenschaftlich vergleichen zu können, sammeln wir aber auch Nowcasts, die rückwirkend erzeugt wurden. So können wir evaluieren, wie diese in der Vergangenheit abgeschnitten hätten. Wichtig für einen fairen Vergleich ist hierbei, dass auch bei den nachträglich erstellten Nowcasts nur Daten in das Modell einfließen, die zum jeweiligen Nowcast-Zeitpunkt bereits verfügbar waren.


Beteiligte Gruppen

Diese Plattform wird von Mitgliedern des Lehrstuhls für Ökonometrie und Statistik am Karlsruher Institut für Technologie sowie der Computational Statistics Gruppe am Heidelberger Institut für Theoretische Studien betrieben. Mehrere unabhängige weitere Gruppen aus Wissenschaft und Medien tragen Nowcasts bei (siehe auch Metadata-Files in unserem GitHub Repository):

Außerdem zeigen wir die jeweils aktuellsten Nowcasts aus den Wochenberichten des Robert Koch Instituts.


Methodenbeschreibungen

ILM-prop (TU Ilmenau)
Diese Nowcasts verwenden die in der Vergangenheit beobachteten an der 7-Tage-Inzidenz der COVID-19 Fällen anteiligen 7-Tage-Hospitalisierungsinzidenz nach einer, zwei usw. Wochen. Von der heute bekannten 7-Tage-Inzidenz werden dann diese Anteile berechnet und aufsummiert um die finale Anzahl an 7-Tage-Hospitalisierungen vorherzusagen. Die Unsicherheit wird durch Anwendung der Methode auf vergangene Zeitpunkte quantifiziert, wobei eine Log-Normalverteilung (Altersgruppen) beziehungsweise Normalverteilung (Summe über alle Altersgruppen) für die Vorhersagefehler angesetzt wird.
Die Hauptannahme dieses Verfahrens ist, dass sich der Anteil von Hospitalisierungen an der 7-Tage-Inzidenz und die Verzüge von Meldedatum des Falls bis dieser in den RKI-Daten erscheint nur langsam ändert.
KIT-simple_nowcast (Karlsruher Institut für Technologie)
Das Nowcasting beruht auf einer einfachen Schätzung der Verteilung der Verzögerungsdauern zwischen Meldedatum und Erscheinen einer Hospitalisierung in den RKI-Daten (basierend auf den letzten 60 Tagen). Aus diesen werden Multiplikationsfaktoren abgeleitet, mit denen die jeweils unvollständigen aktuellsten Beobachtungen nach oben korrigiert werden. Um die Nowcast-Unsicherheit zu beurteilen werden derartige korrigierte Werte auch für vergangene Zeitpunkte (basierend jeweils auf der damals verfügbaren Information) generiert und mit den entsprechenden später gemachten Beobachtungen verglichen. Hierfür wird eine negative Binomialverteilung angenommen, deren Streuungsparameter vom zeitlichen Abstand zwischen Meldedatum und Zeitpunkt des Nowcats abhängt. Die Schätzung der Streuungsparameter erfolgt mittels der Maximum Likelihood-Methode.
Dieses Verfahren ist bewusst einfach gehalten und hat die Funktion eines Referenz-/Baseline-Modells in unserer vergleichenden Evaluationsstudie (siehe unten). Die zentrale Annahme besteht darin, dass die Struktur der Meldeverzüge zeitlich stabil bleibt. Z.B. Wochentagseffekte oder Entwicklungen der Fallzahlen werden nicht berücksichtigt.
LMU_StaBLab-GAM_nowcast (LMU München)
Die Nowcasts beruhen auf einem generalisierten additiven Modell und der sequenziellen Multinomialstruktur der zeitlichen Verzögerungen. Das Modell ist eine geringfügig angepasste Version des Verfahrens von Schneble et al. (2020) zum Nowcasting von tödlich verlaufenden Infektionen.
RIVM-KEW (RIVM (Rijksinstituut voor Volksgezondheid en Milieu), Bilthoven, Niederlande)
Dieses Modell ist eine vereinfachte Version des Verfahrens von van de Kassteele, Eilers und Wallinga (Epidemiology, 2019). Für die berichteten Zählwerte pro Meldedatum und Verzögerung wird eine negative Binomialverteilung angenommen. Die erwarteten Werte werden mittels einer zweidimensionalen P-Spline-Oberfläche und weiteren Kovariablen modelliert. Diese Oberfläche wird für die noch nicht beobachteten Kombinationen von Datums- und Verzögerungswert extrapoliert. Der Nowcast für ein Meldedatum entspricht dann der Summe über die entsprechenden beobachteten und extrapolierten Zählwerte pro Verzögerungsdauer. Vorhersageintervalle werden per Monte-Carlo-Simulation aus der entsprechenden prädiktiven Verteilung generiert. Die vereinfachte Version des Modells enthält keine Interaktionsterme für Kalenderzeit und Verzögerung und keine Unimodalitäts- oder Boundary-Restriktionen. Das Modell wird mittels des R-Pakets mgcv angepasst.
RKI-weekly_report (Robert Koch Institut)
Hierbei handelt es sich um Schätzungen, die jeweils Donnerstags in den Wochenberichten des Robert Koch Instituts veröffentlicht werden. Diese basieren auf einer modifizierten Variante der Nowcastingberechnung zur 7-Tage-Inzidenz.
Da die Nowcast-Schätzung des RKI derzeit nur über den Wochenbericht kommuniziert wird wird sie für diese Plattform aus der jeweiligen Grafik ausgelesen, was zu kleineren Ungenauigkeiten führen kann.
SU-hier_bayes (Universität Stockholm)
tba
SZ-hosp_nowcast (Süddeutsche Zeitung)
Die SZ schätzt die Werte für das Nowcasting der Hospitalisierungsinzidenz auf Basis der Abweichungen zwischen täglich veröffentlichten und nachträglich korrigierten Werten, die durch Nachmeldungen entstehen. Dabei werden die archivierten Datensätze des Robert-Koch-Instituts (https://github.com/robert-koch-institut/COVID-19-Hospitalisierungen_in_Deutschland) der vergangenen 60 Tage analysiert. Jeweils für die 25 Tage vor dem letzten Datum im Datensatz wird berechnet, um wie viel Prozent der an späteren Tagen gemeldete korrigierte Wert von der ursprünglich gemeldeten Hospitalisierungsinzidenz abweicht. Für diese abgeleiteten Multiplikationsfaktoren werden Quantile berechnet. Die aktuell veröffentlichte Inzidenz wird mit den berechneten Quantilen multipliziert, um die Hospitalisierungsinzidenz zu schätzen. Abschließend wird die Hospitalisierungsinzidenz über ein Drei-Tage-Fenster geglättet, um unrealistische größere Schwankungen auszugleichen.
Epiforecasts-independent (London School of Hygiene and Tropical Medicine / epiforecasts)
Ein semiparametrisches Nowcasting-Verfahren für rechszensierte Hospitalisierungen nach Datum des positiven Tests. Hospitalisierungen werden mittels eines Random-Walk auf der log-Skala modelliert. Reporting-Verzögerungen werden anschließend parametrisch mit einer log-Normalverteilung modelliert, wobei der log-Erwartungswert und die log-Standardabweichung einem wöchentlichen Random-Walk mit gemeinsamer Standardabweichung folgen. Wochentagseffekte im Reporting werden mit zufälligen Effekten modelliert, wobei Feiertage wie Sonntage behandelt werden. Nowcasts für Altersgruppen und geographische Einheiten werden jeweils separat erstellt (daher der Name des Modells). Das Modell ist im R-Paket epinowcast implementiert. Der Analyse-Code ist hier verfügbar. Anmerkung: In einer zweiten Version des Modells (bisher nicht angezeigt) werden die verschiedenen Zeitreihen gemeinsam modelliert (Epiforecasts-hierarchical).


GitHub Repository und Nutzung von Ergebnissen

Alle Nowcasts sind unter offenen Lizenzen in einem öffentlichen GitHub Repository verfügbar. Sie können für eine Vielzahl von Zwecken weiterverwendet werden, sofern die Quelle angegeben wird (siehe die entsprechenden Lizenzfiles für Details). Wenn Sie Nowcasts aus dieser Plattform für öffentliche Darstellungen weiterverwenden freuen wir uns über eine kurze Nachricht an das Organisationsteam oder die Autoren des jeweiligen Nowcasts.


Evaluationsstudie

Wir planen, die verschiedenen Nowcasting-Verfahren in einer prospektiven Evaluationsstudie systematisch zu vergleichen. Hierfür haben wir ein öffentliches Studienprotokoll hinterlegt (ähnlich dem Protokoll zu einer früheren Studie über Kurzzeitvorhersagen).


Verwandte Projekte und Analysen