Methoden

Zur Schätzung des 7-Tage-R für Thüringen und die Bundesländer verwenden wir einen an die RKI-Methode angelehnten Ansatz mit vergleichbaren Eckdaten. Die Schätzung Hochrechnung für die Fälle mit Diagnose-, Melde- und Übermittlungsverzug (Nowcast) nehmen wir im Erwartungswert analytisch/deterministisch vor.

Daraus ergeben sich bislang im parallel für Deutschland laufenden Modell vergleichsweise stabile R-Werte mit geringeren zyklischen Schwankungen im Wochenverlauf. In der Nachbetrachtung (wenn Nachmeldungen bekannt sind) verzeichnen wir bislang weniger starke Ausreißer als im RKI-Ansatz zu beobachten. Das Modell verhält sich bei starken Schwankungen zwar geringfügig nachlaufend in seinen Korrekturbewegungen, wobei zyklische oder durch Meldeschwankungen bedingte Outlier deutlich reduziert werden.  

Das Modell ist bereits seit April 2020 konsistent auf wochenweise rollierende Werte, Parametrisierungen und Schätzungen von stabilen 7-Tage-Reproduktionszahlen ausgerichtet.

Die Eckdaten unseres Modells wie Generationsdauer und Imputation von Erkrankungsbeginn-Daten sind nahezu identisch gewählt, sodass die ausgewiesenen Werte in ihrer grundsätzlichen Ausprägung mit den RKI-Schätzungen für Deutschland vergleichbar sind.

Prädiktionsintervalle beziehen sich auf das 5%- und 95%-Quantil. Das Prädiktionsintervall wird für das Nowcasting aus einer Variation des Diagnose- und Meldeverzugs auf Basis historischer Beobachtungen in Verbindung mit einem Binomialansatz generiert. Letzterer verfolgt das Ziel, die bei geringeren Fallzahlen relativ gesehen höheren Ungewissheiten aus potenziellen Infektionsherden (“Spreader-Events”) zu berücksichtigen.

Auf eine Variation von Inkubationszeiten oder Diagnose-/Meldeverzug für bekannte Fälle mit nicht angegebenem Erkrankungsbeginn wird in Anbetracht der recht großen Stützzeiträume von je mindestens 7 tagen verzichtet. 

Falldaten mit nicht angegebenem Erkrankungsbeginn werden auf Basis ihres Meldedatums auf die Stichtage verteilt, an welchen ein Symptomeintritt als wahrscheinlich anzunehmen ist. Grundlage hierfür sind die Time Lags, welche bei Fällen mit bekanntem Erkrankungsbeginn jüngst verzeichnet wurden.

Die Validierung des Modells erfolgt einerseits gegen sich selbst (ex ante vs. ex post) und andererseits auf Ebene der R-Schätzungen für Deutschland gegen die Nowcast-Werte, welche das RKI tagesaktuell publiziert:

RKI – Coronavirus SARS-CoV-2 – Nowcasting und R-Schätzung: Schätzung der aktuellen Entwicklung der SARS-CoV-2-Epidemie in Deutschland

Auch finden Sie unter diesem Link weiterführende Erläuterungen zum Nowcast-Modell des RKI, an welchem wir uns (insbesondere mit den geschilderten Abweichungen) in zahlreichen Eckpunkten orientieren.

Aktualisierung & Rohdaten

Die Schätzungen erfolgen in den Morgenstunden auf Basis der tagesaktuell vom RKI bereitgestellten Falldaten. Üblicherweise erfolgt die Berechnung zu “irgendeiner” vollen Stunde, sofern unser Python-Algorithmus etwa 15 Minuten zuvor die neuen Tagesdaten einlesen konnte. 

Das Modell bedient sich hierbei 1:1, was bedeutet, dass im Falle einer fehlerhaften Datenbereitstellung auch in der R-Schätzung Folgefehler möglich sind. Hier bei hilft ein Blick auf das Dashboard des RKI unter http://corona.rki.de, wo das RKI im falle des Falles oft auch entsprechende Eingangsvermerke hinterlässt.

Es ist nicht ganz auszuschließen, dass wir an manchen Tagen schon Daten haben, bevor das RKI-Dashboard sichtlich befüllt ist. Der angegebene Update-Stand ist der Datenstand.

Da wir selbst im Laufe der zeit erkannt haben, dass die Falldaten des RKI mit inzwischen weit über 100 MB gelegentlich etwas unhandlich sind, stellen wir die von unserem Algorithmus nach den von uns benötigten Eckdaten aggregierten RKI-Rohdaten unter RKI Data bereit, übernehmen aber keine Gewähr für deren Richtigkeit und Vollständigkeit. Wenn wir damit einen kleinen Beitrag leisten können, etwas Traffic zu sparen oder das Handling zu erleichtern, hat es seinen Zweck erfüllt.

Ein Projekt im:


 

Entwickelt und realisiert von:


Andreas Wenzel Beratung & Coaching

Validierung: