GithubHelp home page GithubHelp logo

robert-koch-institut / sars-cov-2-infektionen_in_deutschland_archiv Goto Github PK

View Code? Open in Web Editor NEW
76.0 11.0 7.0 16.43 GB

Der vorliegende Datansatz enthält umfassende Informationen zu SARS-CoV-2-Infektionen in Deutschland, die gemäß dem Infektionsschutzgesetze (IfSG) von den Gesundheitsämtern an das Robert Koch-Institut (RKI) gemeldet wurden. Die Daten umfassen Informationen zur Anzahl der bestätigten Fälle, Todesfälle und Genesungen.

Home Page: https://doi.org/10.5281/zenodo.4681153

License: Creative Commons Attribution 4.0 International

sars-cov-2 germany deutschland covid-19 infections infektion rki

sars-cov-2-infektionen_in_deutschland_archiv's Introduction

Datensatzdokumentation

SARS-CoV-2 Infektionen in Deutschland

Robert Koch-Institut | RKI
Nordufer 20
13353 Berlin

FG 32 | Surveillance und elektronisches Melde- und Informationssystem (DEMIS) | ÖGD Kontaktstelle
Michaela Diercke (Leitung)

MFI | Methodenentwicklung, Forschungsinfrastruktur und Informationstechnologie
Linus Grabenhenrich (Leitung)

IT 4 | Softwarearchitektur und -entwicklung
Herrmann Claus (Leitung)

MF 4 | Informations- und Forschungsdatenmanagement
Hannes Wuensche (Datenkuration)


Zitieren
Robert Koch-Institut (2023): SARS-CoV-2 Infektionen in Deutschland, Berlin: Zenodo. DOI:10.5281/zenodo.4681153.

Informationen zum Datensatz und Entstehungskontext

Der vorliegende Datansatz enthält umfassende Informationen zu SARS-CoV-2-Infektionen in Deutschland, die gemäß dem Infektionsschutzgesetze (IfSG) von den Gesundheitsämtern an das Robert Koch-Institut (RKI) gemeldet wurden. Die Daten umfassen Informationen zur Anzahl der bestätigten Fälle, Todesfälle und Genesungen, aus denen sich weitere Kennzahlen im Zusammenhang mit der COVID-19-Pandemie ableiten lassen. Der Datensatz wird täglich aktualisiert und enthält detaillierte Informationen auf Landkreisebene, die nach verschiedenen Altersgruppen aufgeschlüsselt sind. Die Bereitstellung des Datensatzes soll dazu beitragen, das Verständnis der COVID-19-Pandemie in Deutschland zu verbessern und die Berichterstattung, Forschung und Analyse in diesem Bereich zu unterstützen.

Administrative und organisatorische Angaben

Im Datensatz "SARS-CoV-2 Infektionen in Deutschland" werden die tagesaktuellen Fallzahlen, der nach den Vorgaben des Infektionsschutzgesetzes - IfSG - von den Gesundheitsämtern in Deutschland gemeldeten positiven SARS-CoV-2 Infektionen, Todes- und Genesungsfälle bereitgestellt.

Die zugrundeliegenden Daten werden an das Robert Koch-Institut (RKI) über das Meldesystem gemäß IfSG übermittelt. Zuständig für den Betrieb des Meldesystems ist das Fachgebiet 32 | Surveillance und elektronisches Melde- und Informationssystem (DEMIS) | ÖGD Kontaktstelle des RKI.
Die Verarbeitung und Aufbereitung der im Meldesystem vorliegenden Rohdaten erfolgt durch das IT 4 | Softwarearchitektur und -entwicklung des RKI.
Die Veröffentlichung der Daten, die Datenkuration sowie das Qualitätsmanagement der (Meta-)Daten erfolgen durch das Fachgebiet MF 4 | Informations- und Forschungsdatenmanagement. Fragen zum Datenmanagement und zur Publikationsinfrastruktur können an das Open Data Team des Fachgebiets MF4 unter [email protected] gerichtet werden.

Inhalt und Aufbau des Datensatzes

Der Datensatz enthält epidemiologische Daten über den Verlauf der SARS-CoV-2 Infektionen in Deutschland. Im Datensatz enthalten sind:

  • Fallzahlendaten mit tagesaktuellen Meldungen von SARS-CoV-2 Infektionen
  • Archiv mit der Sammlung aller bisherigen Fallzahlentabellen
  • Lizenz Datei mit der Nutzungslizenz des Datensatzes
  • Datensatzdokumentation in deutscher Sprache
  • Metadaten Datei zum Import in Zenodo

Daten und Datenaufbereitung

Die Fallzahlendaten bilden einen tagesaktuellen Stand (00:00 Uhr) aller bisherig gemeldeten Infektionsfälle in Deutschland ab. Das bedeutet, dass alle, bis 00:00 Uhr des Tages JJJJ-MM-TT, von den Gesundheitsämtern, über die zuständigen Landesbehörden, an das Meldesystem des RKIs übermittelten SARS-CoV-2 Infektionen im Datenstand enthalten sind. Die Daten werden täglich vollständig neu erzeugt und dieser Datenstand ersetzt den Datenstand des Vortages.

Die Fallzahlendaten enthalten als einzige Geoinformation die Landkreis ID. Diese richtet sich nach dem Amtlichen Gemeindeschlüssel (AGS) des Quartal 2 2020, abgerufen im Portal des Statistischen Bundesamtes. Die Landkreis ID ergibt sich aus der Kennzahl des Bundeslandes (Land), des Regionalbezirks (RB) und des Landkreises (LK). Für eine genauere Darstellung Berlins, werden die 12 Stadtbezirke als eigene "Landkreise" aufgegliedert. Hier wird von den Vorgaben des AGS abgewichen. Folgende Zuordnung wird getroffen:

IdLandkreis Bezirk IdLandkreis Bezirk
11001 Berlin Mitte 11007 Berlin Tempelhof-Schöneberg
11002 Berlin Friedrichshain-Kreuzberg 11008 Berlin Neukölln
11003 Berlin Pankow 11009 Berlin Treptow-Köpenick
11004 Berlin Charlottenburg-Wilmersdorf 11010 Berlin Marzahn-Hellersdorf
11005 Berlin Spandau 11011 Berlin Lichtenberg
11006 Berlin Steglitz-Zehlendorf 11012 Berlin Reinickendorf

Fallzahlendaten

Archiv/JJJJ-MM-TT_Deutschland_SARSCoV2_Infektionen.csv

Zentrales Datum des Datensatzes sind die aktuellen Fallzahlendaten. Im Archivordner sind die Fallzahlendaten unter den Dateinamen "JJJJ-MM-TT_Deutschland_SARSCoV2_Infektionen.csv" enthalten. Im Dateinamen repräsentiert die Sequenz "JJJJ-MM-TT" das Erstellungsdatum der Datei und damit gleichzeitig das Datum des enthaltenen Datenstands. "JJJJ" steht dabei für das Jahr, "MM" für den Monat und "TT" für den Tag der Erstellung bzw. des enthaltenen Datenstands.

Merkmale der Fallzahlen Daten

In der .csv Fallzahlentabelle differenzieren die Spalten die verschiedenen Merkmale einer Fallgruppe. Pro Zeile ist eine eineindeutige Fallgruppe abgebildet. Eine Fallgruppe umfasst keine Einzelfälle. Jedoch ist es möglich, dass in der Fallgruppe nur ein Fall enthalten ist. Eine Fallgruppe wird grundlegend durch folgende Eigenschaften charakterisiert (in den Klammern finden sich die Merkmale dieser Eigenschaften):

  • Ort der Infektionen (IdLandkreis)
  • Personengruppe (Geschlecht, Altersgruppe)
  • Meldezeitpunkt der Infektion (Meldedatum)
  • Erkrankungsbeginn (Refdatum, IstErkrankungsbeginn)
  • Mächtigkeit der Gruppe (AnzahlFall, AnzahlTodesfall, AnzahlGenesen)
  • Meldestatus (NeuerFall, NeuerTodesfall, NeuGenesen)

Eine Fallgruppe nimmt eine eineindeutige Ausprägung hinsichtlich ihrer Anzahl von Fällen ("AnzahlFall"), "Altersgruppe", "Geschlecht", ihres Landkreises ("IdLandkreis"), "Meldedatum"s, Erkrankungsdatums ("Refdatum") und der Informationen ob das Erkrankungsdatum bekannt ist "IstErkrankungsbeginn", an.
Weiterhin wird die "AnzahlTodesfall" oder "AnzahlGenesen" jeder Fallgruppe angegeben, wobei nur eines der beiden Merkmale "AnzahlTodesfall" oder "AnzahlGenesen" angenommen werden kann. Das heißt, sofern es in einer Fallgruppe Todesfälle oder Genesene gibt, werden die Anzahl der Todesfälle oder die Anzahl der genesenen Fälle in einer neuen Gruppe angegeben. Treten z. B. beide Fälle in einer Fallgruppe auf, teilt sich die Fallgruppe in zwei weitere Gruppen auf, und zwar in eine Gruppe der Todesfälle und eine Gruppe der Genesenen.


Beispiel

Es wird eine neue Fallgruppe w registriert (IdLandkreis, Geschlecht, Altersgruppe, Meldedatum, Refdatum, IstErkrankungsbeginn sind konstant). Diese enthält eine Fallgruppe zu Beginn:

Fallgruppe w: 5 Infizierte, 0 Todesfälle und 0 genesene Fälle

Sterben 1 und genesen 2 der Fälle so spaltet sich die Fallgruppe w in 3 Gruppen:

Fallgruppe x: 2 Infizierte, 0 Todesfälle und 0 genesene Fälle
Fallgruppe y: 1 Infizierte, 1 Todesfälle und 0 genesene Fälle
Fallgruppe z: 2 Infizierte, 0 Todesfälle und 2 genesene Fälle


Die Merkmale des Meldestatus geben an, ob, bezogen auf den Vortag, in einer Fallgruppe Veränderungen bei den Infektionsfällen, Todesfällen und Genesenen entstanden sind. Das ermöglicht die Veränderungen zum Vortag nachzuvollziehen. Diese entstehen durch Neumeldungen von Infektionen (inklusive Nachmeldungen), Korrekturen (z. B. durch irrtümliche Meldungen, aber auch Korrekturen bzgl. Landkreis, Alter, Geschlecht oder Erkrankungsbeginn) und Veränderung des Gesundheitszustands (genesen, verstorben). Die Ausprägungen des Meldestatus spalten Fallgruppen temporär auf. Die Aufspaltung erfolgt temporär, da sie nur die Veränderungen vom Publikationstag zum Vortag abbilden. Neue Fälle bilden für den Tag der Neumeldung eine eigene Fallgruppe. Da ein Fall nur an einem Tag neu gemeldet, neu genesen oder neu verstorben oder korrigiert wird, folgt auf die temporäre Aufspaltung der Fallgruppe am Tag der Neumeldung des Meldestatus, eine Zusammenlegung der Gruppen am Folgetag. Eine genauere Erläuterung zu diesem Prozess wird im folgenden Abschnitt gegeben.

Merkmalsausprägungen

Die Fallzahlendaten enthalten die in der folgenden Tabelle abgebildeten Merkmale und deren Ausprägungen:

Merkmal Ausprägung Erläuterung
IdLandkreis 1001 bis 16077 Identifikationsnummer des Landkreises basierend auf dem Amtlichen Gemeindeschlüssel (AGS) zuzüglich der 12 Bezirke Berlins (11001 bis 11012); Gebietsstand: 30.06.2020 (2. Quartal)
Geschlecht W, M, unbekannt Geschlecht der Fallgruppe: weiblich (W), männlich (M) und (unbekannt)
Altersgruppe A00-A04, A05-A14, A15-A34, A35-A59, A60-A79, A80+, unbekannt Altersspanne der in der Gruppe enthaltenen Fälle, stratifiziert nach 0-4 Jahren, 5-14 Jahren, 15-34 Jahren, 35-59 Jahren, 60-79 Jahren, 80+ Jahren sowie unbekannt
Meldedatum JJJJ-MM-TT Datum, wann der Fall dem Gesundheitsamt bekannt geworden ist. JJJJ entspricht der Jahreszahl, MM dem Monat und TT dem Tag.
Refdatum JJJJ-MM-TT Datum des Erkrankungsbeginns. Wenn das nicht bekannt ist, das Meldedatum.
IstErkrankungsbeginn 0, 1 1: Refdatum ist der Erkrankungsbeginn 0: Refdatum ist das Meldedatum
AnzahlFall Ganze Zahl Anzahl der gemeldeten Fälle in der entsprechenden Fallgruppe
Für NeuerFall = -1, ist die Anzahl negativ: Es handelt sich um eine Korrektur der Fallgruppe, die angibt, wie viele Infektionen zu viel gemeldet worden sind
AnzahlTodesfall Ganze Zahl Anzahl der gemeldeten Todesfälle in der entsprechenden Fallgruppe
Für NeuerTodesfall = -1, ist die Anzahl negativ: Es handelt sich um eine Korrektur der Fallgruppe, die angibt, wie viele Todesfälle zu viel gemeldet worden sind
AnzahlGenesen Ganze Zahl Anzahl der genesenen Fälle in der entsprechenden Fallgruppe
Für NeuGenesen = -1, ist die Anzahl negativ: Es handelt sich um eine Korrektur der Fallgruppe, die angibt, wie viele genesene Fälle zu viel gemeldet worden sind
NeuerFall, NeuerTodesfall, NeuGenesen 0, 1, -1 0 : Fälle der Gruppe sind in der Publikation für den aktuellen Tag und in der für den Vortag enthalten. Das bedeutet diese Fälle sind seit mehr als einem Tag bekannt.
1 : Fälle der Gruppe sind erstmals in der aktuellen Publikation enthalten. Das heißt, es sind für den Publikationstag neu übermittelte oder entsprechend neu bewertete Fälle.
-1: Fälle der Gruppe sind in der Publikation des Vortags enthalten, werden jedoch nach dem aktuellen Tag aus den Fallzahlendaten entfernt. Das heißt, es sind Fälle die ab dem aktuellen Tag wegfallen. Eine solche Fallgruppe kann beispielsweise durch fälschliche Meldungen entstehen, die so als Korrektur angezeigt werden.
NeuerTodesfall, NeuGenesen -9 Fälle in der Gruppe sind weder in der Publikation für den aktuellen Tag, noch in der Publikation des Vortags, als genesen ("NeuGenesen") oder verstorben ("NeuerTodesfall") gemeldet. Das bedeutet, dass zu den Fällen in der Gruppe keine Information über den Gesundheitsverlauf der Infektion bekannt ist. Das ist zum Beispiel häufig der Fall, wenn eine Fallgruppe gerade erst als infiziert gemeldet worden ist.

Die temporäre Aufspaltung der Fallgruppen durch die Merkmale des Meldestatus wird im folgenden Beispiel verdeutlicht. Temporäre Gruppen sind durch ein ' gekennzeichnet. Neumeldungen wird bei Betrachtung der Ausprägungen der Merkmale deutlich:


Beispiel

Es wird eine neue Fallgruppe am Tag TT registriert (IdLandkreis, Geschlecht, Altersgruppe, Meldedatum, Refdatum, IstErkrankungsbeginn sind konstant), so nimmt sie den Meldestatus NeuerFall = [1] an. Sind noch keine Genesenen oder Todesfälle bekannt, sind in der Fallgruppe gemeldet, sind NeuerTodesfall und NeuGenesen = [-9]:

Die Fälle der Fallgruppe w' sind im Datensatz von Tag TT neu enthalten (NeuerFall [1]), die Fälle der Gruppe sind keine Todes- oder Genesungsfälle (NeuerTodesfall [-9], NeuGenesen [-9]).

Fallgruppe w':
Infizierte [4], Todesfälle [0] und genesene Fälle [0]
NeuerFall [1], NeuerTodesfall [-9], NeuGenesen [-9]

Am nächten Tag, TT+1 sind die Fälle aus Fallgruppe w' nicht mehr neu. Ihr Meldestatus ändert sich daher von [1] auf [0]. Die temporäre Fallgruppe w' (NeuerFall [1]) wird zur stetigen Fallgruppe w (NeuerFall [0]):

Fallgruppe w: Infizierte [4], Todesfälle [0] und genesene Fälle [0] NeuerFall [0], NeuerTodesfall [-9], NeuGenesen [-9]

An Tag TT+1 wird ein zusätzlicher, neuer Fall in der Fallgruppe w registriert. Da es sich um einen neuen Fall handelt, bildet er wieder eine temporäre, eigene Gruppe w':

Fallgruppe w':
Infizierte [1], Todesfälle [0] und genesene Fälle [0]
NeuerFall [1], NeuerTodesfall [-9], NeuGenesen [-9]

Am nächsten Tag, TT+2 sind auch die Fälle der Fallgruppe w'(TT+1) nicht mehr neu, ihr Meldestatus ändert sich wie am Tag zuvor bei Fallgruppe w'(TT). Durch die Änderung des Meldestatus in w'(TT+1), geht w' in w auf. Die Anzahl der Infizierten beider Fallgruppen wird addiert.

Fallgruppe w: Infizierte [5], Todesfälle [0] und genesene Fälle [0]
NeuerFall [0], NeuerTodesfall [-9], NeuGenesen [-9]

Ähnlich wie mit neuen Infektionsmeldungen verhält es sich mit Meldungen von Todes- oder Gesundungsfällen. Diese bilden temporäre Fallgruppen y' und z' welche später in stetige Fallgruppen y und z übergehen:

Tag TT+3

Fallgruppe w:
Infizierte [4], Todesfälle [0] und genesene Fälle [0]
NeuerFall [0], NeuerTodesfall [-9], NeuGenesen [-9]

Fallgruppe y':
Infizierte [1], Todesfälle [1] und genesene Fälle [0]
NeuerFall [0], NeuerTodesfall [1], NeuGenesen [-9]

Tag TT+4

Fallgruppe w:
Infizierte [2], Todesfälle [0] und genesene Fälle [0]
NeuerFall [0], NeuerTodesfall [-9], NeuGenesen [-9]

Fallgruppe y:
Infizierte [1], Todesfälle [1] und genesene Fälle [0]
NeuerFall [0], NeuerTodesfall [0], NeuGenesen [-9]

Fallgruppe z':
Infizierte [2], Todesfälle [0] und genesene Fälle [2]
NeuerFall [0], NeuerTodesfall [-9], NeuGenesen [1]


Hinweis zu Genesenen

Anhand der dem RKI von den Gesundheitsämtern übermittelten Detailinformationen zu einem Erkrankungsfall wird für jeden Fall eine Dauer der Erkrankung geschätzt. Für Fälle, bei denen nur Symptome angegeben sind, die auf einen leichten Erkrankungsverlauf schließen lassen, wird eine Dauer der Erkrankung von 14 Tagen angenommen. Bei hospitalisierten Fällen oder Fällen mit Symptomen, die auf einen schweren Verlauf hindeuten (z. B. Pneumonie) wird eine Dauer der Erkrankung von 28 Tagen angenommen. Ausgehend vom Beginn der Erkrankung, bzw. wenn dieser nicht bekannt ist, vom Meldedatum ergibt sich ein geschätztes Datum der Genesung für jeden Fall. Da im Einzelfall auch deutlich längere Erkrankungsverläufe möglich sind, bzw. die hier genutzten Informationen nicht bei allen Fällen dem RKI übermittelt werden, sind die so berechneten Daten nur grobe Schätzungen für die Anzahl der Genesenen und sollten daher auch nur unter Berücksichtigung dieser Limitationen verwendet werden.

Formatierung der Daten

Die Notaufnahmesurveillance-Daten sind im Datensatz als kommaseparierte .csv-Datei enthalten. Der verwendete Zeichensatz der .csv-Datei ist UTF-8. Trennzeichen der einzelnen Werte ist ein Komma ",". Datumsangaben sind im ISO-8601-Standard formatiert.

  • Zeichensatz: UTF-8
  • Datumsformat: ISO 8601
  • .csv-Trennzeichen: Komma ","
  • komprimiert im .xz Format

Metadaten

Zur Erhöhung der Auffindbarkeit sind die bereitgestellten Daten mit Metadaten beschrieben. Über GitHub Actions werden Metadaten an die entsprechenden Plattformen verteilt. Für jede Plattform existiert eine spezifische Metadatendatei, diese sind im Metadatenordner hinterlegt:

Metadaten/

Versionierung und DOI-Vergabe erfolgt über Zenodo.org. Die für den Import in Zenodo bereitgestellten Metadaten sind in der zenodo.json hinterlegt. Die Dokumentation der einzelnen Metadatenvariablen ist unter https://developers.zenodo.org/#representation nachlesbar.

Metadaten/zenodo.json

Hinweise zur Nachnutzung der Daten

Offene Forschungsdaten des RKI werden auf GitHub.com, Zenodo.org und Edoc.rki.de bereitgestellt:

Lizenz

Der Datensatz "SARS-CoV-2 Infektionen in Deutschland" ist lizenziert unter der Creative Commons Namensnennung 4.0 International Public License | CC-BY 4.0 International.

Die im Datensatz bereitgestellten Daten sind, unter Bedingung der Namensnennung der Quelle, frei verfügbar. Das bedeutet, jede Person hat das Recht die Daten zu verarbeiten und zu verändern, Derivate des Datensatzes zu erstellen und sie für kommerzielle und nicht kommerzielle Zwecke zu nutzen. Weitere Informationen zur Lizenz finden sich in der LICENSE bzw. LIZENZ Datei des Datensatzes.

sars-cov-2-infektionen_in_deutschland_archiv's People

Contributors

hanneswuensche avatar rkigithubbot avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

sars-cov-2-infektionen_in_deutschland_archiv's Issues

Repository wird unnötig riesig

Hallo,

statt in "Archiv" alle vorherigen Daten zu speichern, müsste nur das CSV im Hauptordner ge-updated werden, und dann würde nur das winzig kleine Diff gespeichert werden. So wächst das Repository jeden Tag um mind. 100MB. Wozu? Die Daten sind redundant, da sie bereits in den vorherigen Commits/Tags enthalten sind. Statt vielleicht 200MB ist das Repo bei mir auf der Platte 48GB groß:

$ du -sh SARS-CoV-2_Infektionen_in_Deutschland/
48G	SARS-CoV-2_Infektionen_in_Deutschland/

Grüße,
Christoph

Mögliche Auswirkungen der fehlenden Daten von Eisenach auf die Gesamtfallzahlen

Die Stadt Eisenach (IdLandkreis: 16056) wurde zur Jahresmitte in den Landkreis Wartburgkreis eingegliedert. So wie es ausschaut, sind im aktuellen Datensatz auch keine historischen Daten mehr enthalten.

Die Infektionen/Todesfälle/etc. gab es ja trotzdem und dürften sich auch nur unter Berücksichtigung derer, mit den Gesamtfallzahlen im RKI-Dashboard decken.

7-Tage Inzidenz als Spalte hinzufügen

Gibt es die Möglichkeit, dass die 7-Tage Inzidenz als weitere Spalte mit aufgenommen wird oder aber die Excel-Dateien mit den 7-Tage Inzidenzen (1) ein eigenes Repository bekommen?
Als CSV-Datei wären die Daten viel einfacher zu verarbeiten als die Excel-Dateien.

Infektions- Zeitreihen vor dem 2021-04-02

Hallo,

im Rahmen meiner Masterarbeit bräuchte ich Daten, die weiter zurück liegen und wäre sehr dankbar, wenn mir jemand diese zur Verfügung stellen könnte oder sagen kann, wo man diese findet.
Nötig wäre die Anzahl der gemeldeten Neuinfektionen pro Tag und die Anzahl an Genesenen, zu Beginn der Pandemie. Mit Beginn ist der erste gemeldete Fall gemeint und die 30/31 darauffolgenden Tage.

Vielen herzlichen Dank im Voraus.

Viele Grüße und Gesundheit,
Samrawit Gashaw

RKI gibt beim Landkreis Göttingen (NI) 12.314 Infizierte weniger an

Hallo Zusammen,

wie kommt eine so starke Differenz zustande? Sowohl in den Daten, als ebenso im RKI-Dashboard wird der Landkreis Göttingen (NI) mit 79.703 Infizierte (kumuliert) ausgegeben. Das Landratsamt veröffentlicht seit Beginn der Pandemie werktäglich die Fallzahlen. Heute wird dort 92.017 Infizierte (kumuliert) ausgegeben. Das sind 12.314 Infizierte weniger, die das RKI ausgibt.

Gibt es hierfür eine Erklärung? Die Daten eines Landratsamtes (Gesundheitsamt) sind ja ebenfalls zweifelsfrei verifiziert.
https://www.goettingen.de/portal/meldungen/uebersicht-900000614-25480.html

Beste Grüße

Keine neuen Dateien mehr abrufbar

Bei Aufruf der Seite mit dem Archiv-Inhalt unter https://github.com/robert-koch-institut/SARS-CoV-2-Infektionen_in_Deutschland_Archiv/tree/main/Archiv erscheint die Meldung:

Sorry, we had to truncate this directory to 1.000 files. 20 entries were omitted from the list. Latest commit info may be omitted.

Dadurch sind (auf einfache Weise) keine Dateien mehr seit dem 2024-01-02 abrufbar.

Es handelt sich aus Sicht von GitHub nicht um einen Fehler sondern um ein gewolltes Verhalten. So steht unter https://docs.github.com/en/rest/repos/contents?apiVersion=2022-11-28#get-repository-content im Abschnitt Get repository content folgender Hinweis (Note): This API has an upper limit of 1,000 files for a directory.

Vorschlag: Für jedes Jahr (zumindest für jedes vergangene) einen eigenen Ordner für die Archiv-Dateien anlegen.

Datenstand als Spalte in den Dateien

Gibt es einen Grund, weshalb der Datenstand nur im Dateinamen und nicht als eigene Spalte IN den Dateien vorliegt?
Die Weiterverarbeitung als Zeitreihe wäre so bedeutend einfacher.

Download über git clone funktioniert bei mir nicht

Hallo Herr Wünsche,

ich versuche die Daten wie folgt herunterzuladen:

git clone https://github.com/robert-koch-institut/SARS-CoV-2_Infektionen_in_Deutschland.git

mab@localhost:~/projects/rki$ git clone https://github.com/robert-koch-institut/SARS-CoV-2_Infektionen_in_Deutschland.git
Cloning into 'SARS-CoV-2_Infektionen_in_Deutschland'...
remote: Enumerating objects: 747, done.
remote: Counting objects: 100% (229/229), done.
remote: Compressing objects: 100% (218/218), done.
remote: Total 747 (delta 134), reused 106 (delta 11), pack-reused 518
Receiving objects: 100% (747/747), 341.71 MiB | 29.20 MiB/s, done.
Resolving deltas: 100% (407/407), done.

Allerdings erscheint dann nicht der Inhalt der Archivdateien bei mir lokal, sondern die Dateien sehen wie folgt aus:

mab@localhost:~/projects/rki/SARS-CoV-2_Infektionen_in_Deutschland/Archiv$ ls -al
total 616
drwxrwxr-x 2 mab mab 16384 Sep  2 13:51 .
drwxrwxr-x 5 mab mab  4096 Sep  2 13:51 ..
-rw-rw-r-- 1 mab mab   133 Sep  2 13:51 2021-04-02_Deutschland_SarsCov2_Infektionen.csv
-rw-rw-r-- 1 mab mab   133 Sep  2 13:51 2021-04-03_Deutschland_SarsCov2_Infektionen.csv
-rw-rw-r-- 1 mab mab   133 Sep  2 13:51 2021-04-04_Deutschland_SarsCov2_Infektionen.csv
-rw-rw-r-- 1 mab mab   133 Sep  2 13:51 2021-04-05_Deutschland_SarsCov2_Infektionen.csv
-rw-rw-r-- 1 mab mab   133 Sep  2 13:51 2021-04-06_Deutschland_SarsCov2_Infektionen.csv
-rw-rw-r-- 1 mab mab   133 Sep  2 13:51 2021-04-12_Deutschland_SarsCov2_Infektionen.csv
-rw-rw-r-- 1 mab mab   133 Sep  2 13:51 2021-04-13_Deutschland_SarsCov2_Infektionen.csv

Der Inhalt entspricht nicht dem Inhalt, den ich über die direkte Downloadfunktion sehe. Dort sind Referenzinformationen enthalten:

mab@localhost:~/projects/rki/SARS-CoV-2_Infektionen_in_Deutschland/Archiv$ cat 2021-09-02_Deutschland_SarsCov2_Infektionen.csv
version https://git-lfs.github.com/spec/v1
oid sha256:7fe3d9f859786d970a9be9421ffc5ca7025f2a2b823b6e6089da4192d35685e4
size 119533423

Können Sie Hilfestellung geben, wie die vollständigen Dateien herunterzuladen sind?

Danke

Maciej Bednarz / Hannover

Das Archivfile 2024-03-03_Deutschland_SarsCov2_Infektionen.csv.xz ist fehlerhaft, bzw enthält inkonsistente Daten

hier die Auswertung des Files vom 2.3.24

{
	"IdBundesland":"00",
	"Datenstand":"2024-03-02",
	"Meldedatum":"2024-03-01",
	"Bundesland":"Bundesgebiet",
	"Cases":38822474,
	"newCases":289,
	"Deaths":182649,
	"newDeaths":19,
}

und hier die Auswertung des Files vom 3.3.24

{
	"IdBundesland":"00",
	"Datenstand":"2024-03-03",
	"Meldedatum":"2024-03-01",
	"Bundesland":"Bundesgebiet",
	"Cases":38822474,
	"newCases":289,
	"Deaths":182649,
	"newDeaths":19,
}

Die Gesamtzahl der Fälle, NeueFälle, Gesamtzahl der Todesfälle und NeueTodesfälle sind identisch! NeueFälle und Neue Todesfälle sollten zumindest die Anzahl der Fälle bzw. Todesfälle erhöhen! Auffällig ist auch das es dieselben Zahlen vom Vortag sind. Was in den beiden Dateien unterschiedlich ist sind die gesamt Anzahl der Genesenden und NeuGenesenede!

Inkonsistenzen zwischen diesem Archiv Repo und dem "aktuellem" Repo

Hier ist am Wochenende was schief gelaufen.
Die Datei in diesem Repo "2024-02-25_Deutschland_SarsCov2_Infektionen.csv.xz" hinzugefügt mit commit "update 2024-02-26" stimmt vom Inhalt her mit der Datei "Aktuell_Deutschland_SarsCov2_Infektionen.csv" im "aktuellem" Repo mit commit "update 2024-02-26" überein, und müsste demnach "2024-02-26_Deutschland_SarsCov2_Infektionen.csv.xz" heissen!
ebenso die Datei "2024-02-24_Deutschland_SarsCov2_Infektionen.csv.xz" hinzugefügt mit commit "update 2024-02-25" stimmt vom Inhalt her mit der Datei "Aktuell_Deutschland_SarsCov2_Infektionen.csv" im "aktuellem" Repo mit commit "update 2024-02-25" überein, müsste also "2024-02-25_Deutschland_SarsCov2_Infektionen.csv.xz" heissen.

Demnach fehlt auch noch das Archiv vom 24.02.2024!
Meiner bescheidenen Meinung nach müsste also folgendes getan werden:

  1. umbennen der Datei 2024-02-25_Deutschland_SarsCov2_Infektionen.csv.xz -> 2024-02-26_Deutschland_SarsCov2_Infektionen.csv.xz
  2. umbenenn der Datei 2024-02-24_Deutschland_SarsCov2_Infektionen.csv.xz -> 2024-02-25_Deutschland_SarsCov2_Infektionen.csv.xz
  3. hinzufügen der Datei 2024-02-24_Deutschland_SarsCov2_Infektionen.csv.xz

@HannesWuensche können sie sich das mal ansehen?! Danke

Landkreis Informationen als CSV?

Gibt es die Landkreisnamen nach Landkreis ID als CSV (oder anderweitig einfach lesbares Format)?

Z.B. so wie im README angedeutet:

IdLandkreis Bezirk
11001 Berlin Mitte
11002 Berlin Friedrichshain-Kreuzberg
11003 Berlin Pankow
11004 Berlin Charlottenburg-Wilmersdorf
11005 Berlin Spandau
11006 Berlin Steglitz-Zehlendorf
...

Fehlerhafte Dokumentation bezüglich der Ausprägung der Altersgruppen

In der Dokumentation steht Folgendes zu der Ausprägung der Altersgruppen:
A00-04, A05-14, A15-A34, A35-A59, A60-A79, A80+, unbekannt
Die ersten beiden dieser Angaben sind allerdings inkorrekt, da diese auch dem Schema der anderen folgen und A00-A04 bzw. A05-A14 lauten müssten.

Todesfälle pro Monat sind inkonsistent mit anderen Daten

Die Todesfälle pro Monat stimmen nicht annähernd mit den Todesfällen pro Monat aus der Tabelle unter
https://www.rki.de/DE/Content/InfAZ/N/Neuartiges_Coronavirus/Projekte_RKI/COVID-19_Todesfaelle.html überein.

Stand: GitHub 2021-11-05

SterbeMonat Anzahl verstorbene COVID-19 Fälle GitHub Delta
2020m3 1120 2682 -1562
2020m4 6068 5727 341
2020m5 1575 697 878
2020m6 315 148 167
2020m7 134 144 -10
2020m8 152 119 33
2020m9 205 342 -137
2020m10 1488 3240 -1752
2020m11 8592 11897 -3305
2020m12 21951 25952 -4001
2021m1 21831 19358 2473
2021m2 9749 6585 3164
2021m3 5492 5742 -250
2021m4 6500 6586 -86
2021m5 4678 2599 2079
2021m6 1074 266 808
2021m7 260 163 97
2021m8 473 894 -421
2021m9 1521 1565 -44
2021m10 893 1579 -686
2021m11 0 56 -
Summe 94071 96285 -2214

Umstellung des Respositoriums / Restructuring of the repository

Liebe Alle,

im Issue #10 wurde bereits besprochen, dass die Größe des Repositoriums über die Zeit stark zugenommen hat. Eine der Ursachen dafür ist die doppelte Bereitstellung der Daten: Im Archiv, als auch in der Historie der Aktuell_Deutschland_SarsCov2_Infektionen.csv.

Da die Größe auch uns zu schaffen macht und wir über Git LFS nur ein begrenztes Volumen an Traffic anbieten können, habe wir uns dazu entschlossen eine Umstrukturierung vorzunehmen:

  • Das derzeitige Repositorium „SARS-CoV-2_Infektionen_in_Deutschland“ wird zu einem reinen Archiv Datensatz umgebaut, welcher die Aktuell_Deutschland_SarsCov2_Infektionen.csv nicht weiter enthalten wird. Der Name des Repositoriums wird sich zu „SARS-CoV-2-Infektionen_in_Deutschland_Archiv“ ändern.
  • Die Bereitstellung der Aktuell_Deutschland_SarsCov2_Infektionen.csv erflogt über das Repositorium „SARS-CoV-2-Infektionen_in_Deutschland“.

In beiden Repositorien sind damit täglich die neuen Dateien enthalten: Im Archiv-Repositorum als datierte Datei JJJJ-MM-DD_Deutschland_SarsCov2_Infektionen.csv. Im Repositorium „SARS-CoV-2-Infektionen_in_Deutschland“ als täglich überschriebene Aktuell_Deutschland_SarsCov2_Infektionen.csv.

Achtung, im Vergleich zum derzeitigen Repositorium ändert sich der Branch von master zu main und der Unterstrich im Titel wird zum Bindestrich.
Die Umstellung ist für den 30. August geplant, wenn bis dahin keine grundlegenden Probleme durch die Community geäußert werden. Wir bitten alle User:innen die Information weiterzugeben und laden zum Feedback ein.

----English Version----
Dear All,

In Issue #10 we already discussed that the size of the repository has increased significantly over time. One of the reasons for this is the redundant provision of data: In the archive, as well as in the history of Aktuell_Deutschland_SarsCov2_Infektionen.csv.

Since the size is also a problem for us and we can only offer a limited volume of traffic via Git LFS, we decided to restructure the repository:

  • The current repository "SARS-CoV-2_Infektionen_in_Deutschland" will be converted to an archive-only data set, which will no longer contain the Aktuell_Deutschland_SarsCov2_Infektionen.csv. The name of the repository will change to "SARS-CoV-2-Infektionen_in_Deutschland_Archiv".
  • The provision of the Aktuell_Deutschland_SarsCov2_Infektionen.csv will be done via the repository "SARS-CoV-2-Infektionen_in_Deutschland".

In both repositories the new files are provided on a daily basis: In the archive repository as dated file JJJJ-MM-DD_Deutschland_SarsCov2_Infektionen.csv. In the repository "SARS-CoV-2-Infektionen_in_Deutschland" as daily overwritten Aktuell_Deutschland_SarsCov2_Infektionen.csv.

Note, compared to the current repository, the branch changes from master to main and the underscore in the title becomes a hyphen.
The restructuring is planned for August 30, if no fundamental problems are expressed by the community until then. We ask all users to pass on the information and invite for feedback.

Mit besten Grüßen
@HannesWuensche
für das Team RKI | Open Data

Datensatz am Sonntag 05.06.2022

Gibt es heute irgendeinen Fehler im System? Sowohl das RKI-Dashobard gibt für die ganze Bundesrepublik 0 neue Fälle in allen Kategorien aus, als auch die der Datensatz hier aus GitHub. Hätte nicht künftig an den Wochenenden die Fallzahlenveröffentlichtung eingestellt sein sollen? Das würde sich mit dem oben genannten, das man dennoch täglich veröffentlicht, aber ohne Aktualisierung darin, widersprechen, bzw. keinen Sinn ergeben. Warum wird dann doch ein Datensatz für z. B. den heutigen Tag veröffentlicht?

Denn die 0 neuen Fälle (Tote, Infizierte, etc.) für die ganze Bundesrepublik, hat bereits Medien heute Meldungen veröffentlichen lassen, sowie bei Twitter spezielle Gruppierungen, die das natürlich riesig feiern/befeuern, das in keinem einzigen Kreis nun ein Fall ist. (Was schlichtweg unwahr ist).

Rund 2.000 neue Infizierte gibt es heute jedoch in ganz Deutschland. (Aus allen 400 Kreisen, die die heute gemeldet haben und die Ministerien, die heute ebenfalls gemeldet habe.). 2.000 ist immer noch ein unterschied als nichts.

Ausprägung der Daten bei Korrektur der Altersgruppe, Datumsangaben, des Landkreises oder Geschlechts

Vorab: Dieses Repository ist eine sehr nützliche Ressource und die aufgeräumten CSV-Dateien sind viel angenehmer zu verarbeiten als der arcgis download. Insofern also schonmal großes Lob & Dank für die Bereitstellung.

Beim Verarbeiten der Daten, insbesondere dem Erstellen einer Spalte "Publikationsdatum" bin ich auf folgende Inkonsistenz gestoßen:

Im Datensatz von 2021-11-21 ist eine Fallgruppe enthalten, der -1 in NeuGenesen enthält, wozu es in 2021-11-20 keinen entsprechenden Eintrag gibt:

8115,A80+,W,2021-11-14,2021-11-14,0,0,-9,-1,1,0,-1

Es gibt in 2021-11-20 folgende Einträge, die auf 8115,A80+,W matchen:

grep -P '8115,A80\+,W,' 2021-11-20.csv
8115,A80+,W,2020-04-01,2020-03-06,1,0,0,-9,1,1,0
8115,A80+,W,2020-03-18,2020-03-13,1,0,-9,0,1,0,1
8115,A80+,W,2020-03-17,2020-03-14,1,0,-9,0,1,0,1
8115,A80+,W,2020-03-18,2020-03-17,1,0,-9,0,1,0,1
8115,A80+,W,2020-03-19,2020-03-18,1,0,0,-9,1,1,0
8115,A80+,W,2020-03-19,2020-03-19,0,0,-9,0,1,0,1
8115,A80+,W,2020-03-23,2020-03-20,1,0,-9,0,1,0,1
8115,A80+,W,2020-03-23,2020-03-23,0,0,-9,0,2,0,2
8115,A80+,W,2020-03-23,2020-03-23,1,0,0,-9,1,1,0
8115,A80+,W,2020-03-26,2020-03-26,0,0,-9,0,2,0,2
8115,A80+,W,2020-03-28,2020-03-26,1,0,-9,0,1,0,1
8115,A80+,W,2020-03-27,2020-03-27,0,0,-9,0,1,0,1
8115,A80+,W,2020-03-28,2020-03-28,0,0,-9,0,2,0,2
8115,A80+,W,2020-03-30,2020-03-29,1,0,0,-9,1,1,0
8115,A80+,W,2020-03-30,2020-03-30,0,0,-9,0,2,0,2
8115,A80+,W,2020-04-01,2020-03-31,1,0,0,-9,1,1,0
8115,A80+,W,2020-04-02,2020-03-31,1,0,0,-9,1,1,0
8115,A80+,W,2020-04-01,2020-04-01,0,0,-9,0,20,0,20
8115,A80+,W,2020-04-01,2020-04-01,0,0,0,-9,1,1,0
8115,A80+,W,2020-04-03,2020-04-01,1,0,0,-9,1,1,0
8115,A80+,W,2020-04-05,2020-04-01,1,0,0,-9,1,1,0
8115,A80+,W,2020-04-02,2020-04-02,0,0,-9,0,9,0,9
8115,A80+,W,2020-04-02,2020-04-02,1,0,0,-9,1,1,0
8115,A80+,W,2020-04-03,2020-04-03,0,0,-9,0,2,0,2
8115,A80+,W,2020-04-04,2020-04-04,0,0,-9,0,5,0,5
8115,A80+,W,2020-04-05,2020-04-05,0,0,-9,0,20,0,20
8115,A80+,W,2020-04-06,2020-04-06,0,0,-9,0,1,0,1
8115,A80+,W,2020-04-06,2020-04-06,0,0,0,-9,1,1,0
8115,A80+,W,2020-04-07,2020-04-07,0,0,-9,0,1,0,1
8115,A80+,W,2020-04-08,2020-04-08,0,0,-9,0,1,0,1
8115,A80+,W,2020-04-09,2020-04-09,0,0,-9,0,9,0,9
8115,A80+,W,2020-04-14,2020-04-09,1,0,-9,0,1,0,1
8115,A80+,W,2020-04-10,2020-04-10,0,0,-9,0,3,0,3
8115,A80+,W,2020-04-11,2020-04-11,0,0,-9,0,5,0,5
8115,A80+,W,2020-04-15,2020-04-15,0,0,-9,0,1,0,1
8115,A80+,W,2020-04-17,2020-04-17,0,0,-9,0,1,0,1
8115,A80+,W,2020-04-18,2020-04-18,0,0,-9,0,3,0,3
8115,A80+,W,2020-04-18,2020-04-18,0,0,0,-9,1,1,0
8115,A80+,W,2020-04-19,2020-04-19,0,0,-9,0,4,0,4
8115,A80+,W,2020-04-21,2020-04-21,0,0,-9,0,5,0,5
8115,A80+,W,2020-04-22,2020-04-22,0,0,-9,0,1,0,1
8115,A80+,W,2020-04-26,2020-04-26,0,0,-9,0,1,0,1
8115,A80+,W,2020-05-06,2020-05-06,0,0,-9,0,2,0,2
8115,A80+,W,2020-05-14,2020-05-14,0,0,-9,0,1,0,1
8115,A80+,W,2020-06-04,2020-06-04,0,0,-9,0,1,0,1
8115,A80+,W,2020-07-29,2020-07-29,0,0,-9,0,1,0,1
8115,A80+,W,2020-08-28,2020-08-28,0,0,-9,0,1,0,1
8115,A80+,W,2020-08-29,2020-08-29,0,0,-9,0,1,0,1
8115,A80+,W,2020-08-31,2020-08-31,0,0,-9,0,1,0,1
8115,A80+,W,2020-09-01,2020-09-01,0,0,-9,0,1,0,1
8115,A80+,W,2020-09-08,2020-09-08,0,0,0,-9,1,1,0
8115,A80+,W,2020-09-28,2020-09-28,0,0,-9,0,1,0,1
8115,A80+,W,2020-10-01,2020-09-29,1,0,0,-9,1,1,0
8115,A80+,W,2020-10-02,2020-10-02,0,0,-9,0,1,0,1
8115,A80+,W,2020-10-10,2020-10-10,0,0,-9,0,1,0,1
8115,A80+,W,2020-10-20,2020-10-20,0,0,-9,0,2,0,2
8115,A80+,W,2020-10-21,2020-10-21,0,0,-9,0,3,0,3
8115,A80+,W,2020-10-22,2020-10-22,0,0,-9,0,4,0,4
8115,A80+,W,2020-10-23,2020-10-23,0,0,-9,0,7,0,7
8115,A80+,W,2020-10-24,2020-10-24,0,0,-9,0,1,0,1
8115,A80+,W,2020-10-26,2020-10-26,0,0,-9,0,2,0,2
8115,A80+,W,2020-10-26,2020-10-26,0,0,0,-9,2,2,0
8115,A80+,W,2020-10-27,2020-10-27,0,0,-9,0,5,0,5
8115,A80+,W,2020-10-28,2020-10-27,1,0,0,-9,1,1,0
8115,A80+,W,2020-10-28,2020-10-28,0,0,-9,0,2,0,2
8115,A80+,W,2020-11-02,2020-10-28,1,0,0,-9,1,1,0
8115,A80+,W,2020-10-29,2020-10-29,0,0,-9,0,10,0,10
8115,A80+,W,2020-10-30,2020-10-30,0,0,-9,0,9,0,9
8115,A80+,W,2020-10-30,2020-10-30,0,0,0,-9,1,1,0
8115,A80+,W,2020-10-31,2020-10-31,0,0,-9,0,1,0,1
8115,A80+,W,2020-10-31,2020-10-31,0,0,0,-9,1,1,0
8115,A80+,W,2020-10-29,2020-10-31,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-01,2020-10-31,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-03,2020-11-01,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-04,2020-11-01,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-02,2020-11-02,0,0,-9,0,2,0,2
8115,A80+,W,2020-11-07,2020-11-02,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-03,2020-11-03,0,0,-9,0,8,0,8
8115,A80+,W,2020-11-05,2020-11-03,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-04,2020-11-04,0,0,-9,0,3,0,3
8115,A80+,W,2020-11-16,2020-11-04,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-05,2020-11-05,0,0,-9,0,22,0,22
8115,A80+,W,2020-11-06,2020-11-05,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-06,2020-11-06,0,0,-9,0,1,0,1
8115,A80+,W,2020-11-09,2020-11-06,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-12,2020-11-06,1,0,-9,0,1,0,1
8115,A80+,W,2020-10-28,2020-11-06,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-07,2020-11-07,0,0,-9,0,6,0,6
8115,A80+,W,2020-11-08,2020-11-08,0,0,-9,0,2,0,2
8115,A80+,W,2020-11-11,2020-11-09,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-11,2020-11-09,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-10,2020-11-10,0,0,-9,0,1,0,1
8115,A80+,W,2020-11-11,2020-11-11,0,0,-9,0,10,0,10
8115,A80+,W,2020-11-12,2020-11-12,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-13,2020-11-12,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-13,2020-11-13,0,0,-9,0,4,0,4
8115,A80+,W,2020-11-14,2020-11-14,0,0,-9,0,2,0,2
8115,A80+,W,2020-11-19,2020-11-14,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-15,2020-11-15,0,0,-9,0,1,0,1
8115,A80+,W,2020-11-10,2020-11-16,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-18,2020-11-16,1,0,-9,0,2,0,2
8115,A80+,W,2020-11-20,2020-11-16,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-24,2020-11-16,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-19,2020-11-16,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-17,2020-11-17,0,0,-9,0,5,0,5
8115,A80+,W,2020-11-18,2020-11-17,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-19,2020-11-17,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-18,2020-11-18,0,0,-9,0,5,0,5
8115,A80+,W,2020-11-18,2020-11-18,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-20,2020-11-18,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-19,2020-11-19,0,0,-9,0,6,0,6
8115,A80+,W,2020-11-20,2020-11-20,0,0,-9,0,1,0,1
8115,A80+,W,2020-11-20,2020-11-20,0,0,0,-9,1,1,0
8115,A80+,W,2020-11-26,2020-11-20,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-21,2020-11-21,0,0,-9,0,6,0,6
8115,A80+,W,2020-11-24,2020-11-21,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-25,2020-11-21,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-22,2020-11-22,0,0,-9,0,1,0,1
8115,A80+,W,2020-11-25,2020-11-22,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-26,2020-11-22,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-10,2020-11-22,1,0,-9,0,1,0,1
8115,A80+,W,2020-04-06,2020-11-22,1,0,0,-9,1,1,0
8115,A80+,W,2020-11-24,2020-11-23,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-26,2020-11-23,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-28,2020-11-23,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-25,2020-11-25,0,0,-9,0,1,0,1
8115,A80+,W,2020-11-25,2020-11-25,0,0,0,-9,1,1,0
8115,A80+,W,2020-11-23,2020-11-25,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-09,2020-11-25,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-26,2020-11-26,0,0,-9,0,4,0,4
8115,A80+,W,2020-11-26,2020-11-26,0,0,0,-9,1,1,0
8115,A80+,W,2020-11-28,2020-11-26,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-29,2020-11-26,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-01,2020-11-26,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-27,2020-11-27,0,0,-9,0,2,0,2
8115,A80+,W,2020-11-30,2020-11-27,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-28,2020-11-28,0,0,-9,0,2,0,2
8115,A80+,W,2020-11-10,2020-11-28,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-29,2020-11-29,0,0,-9,0,1,0,1
8115,A80+,W,2020-12-04,2020-11-29,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-17,2020-11-29,1,0,-9,0,1,0,1
8115,A80+,W,2020-11-30,2020-11-30,0,0,-9,0,1,0,1
8115,A80+,W,2020-12-05,2020-11-30,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-01,2020-12-01,0,0,-9,0,4,0,4
8115,A80+,W,2020-12-04,2020-12-01,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-02,2020-12-02,0,0,-9,0,1,0,1
8115,A80+,W,2020-12-04,2020-12-02,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-03,2020-12-03,0,0,-9,0,3,0,3
8115,A80+,W,2020-12-03,2020-12-03,0,0,0,-9,1,1,0
8115,A80+,W,2020-12-10,2020-12-03,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-04,2020-12-04,0,0,-9,0,7,0,7
8115,A80+,W,2020-12-04,2020-12-04,0,0,0,-9,2,2,0
8115,A80+,W,2020-12-05,2020-12-05,0,0,-9,0,2,0,2
8115,A80+,W,2020-12-08,2020-12-05,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-07,2020-12-05,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-06,2020-12-06,0,0,-9,0,1,0,1
8115,A80+,W,2020-12-09,2020-12-06,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-07,2020-12-07,0,0,0,-9,1,1,0
8115,A80+,W,2020-12-08,2020-12-07,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-08,2020-12-08,0,0,-9,0,1,0,1
8115,A80+,W,2020-12-09,2020-12-08,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-11,2020-12-08,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-09,2020-12-09,0,0,-9,0,7,0,7
8115,A80+,W,2020-12-16,2020-12-09,1,0,-9,0,2,0,2
8115,A80+,W,2020-12-10,2020-12-10,0,0,-9,0,5,0,5
8115,A80+,W,2020-12-12,2020-12-10,1,0,-9,0,2,0,2
8115,A80+,W,2020-12-16,2020-12-10,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-11,2020-12-11,0,0,-9,0,3,0,3
8115,A80+,W,2020-12-16,2020-12-11,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-12,2020-12-12,0,0,-9,0,20,0,20
8115,A80+,W,2020-12-12,2020-12-12,0,0,0,-9,1,1,0
8115,A80+,W,2020-12-12,2020-12-12,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-14,2020-12-12,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-17,2020-12-12,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-13,2020-12-12,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-14,2020-12-14,0,0,-9,0,2,0,2
8115,A80+,W,2020-12-18,2020-12-14,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-04,2020-12-14,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-15,2020-12-15,0,0,-9,0,5,0,5
8115,A80+,W,2020-12-15,2020-12-15,0,0,0,-9,2,2,0
8115,A80+,W,2020-12-17,2020-12-15,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-18,2020-12-15,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-19,2020-12-15,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-22,2020-12-15,1,0,-9,0,2,0,2
8115,A80+,W,2020-12-16,2020-12-15,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-16,2020-12-16,0,0,-9,0,2,0,2
8115,A80+,W,2020-12-22,2020-12-16,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-17,2020-12-17,0,0,-9,0,12,0,12
8115,A80+,W,2020-12-22,2020-12-17,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-24,2020-12-17,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-18,2020-12-18,0,0,-9,0,9,0,9
8115,A80+,W,2020-12-17,2020-12-18,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-21,2020-12-18,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-19,2020-12-19,0,0,-9,0,3,0,3
8115,A80+,W,2020-12-21,2020-12-19,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-14,2020-12-19,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-20,2020-12-20,0,0,-9,0,2,0,2
8115,A80+,W,2020-12-21,2020-12-21,0,0,-9,0,3,0,3
8115,A80+,W,2020-12-22,2020-12-21,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-22,2020-12-22,0,0,-9,0,8,0,8
8115,A80+,W,2020-12-22,2020-12-22,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-23,2020-12-23,0,0,-9,0,4,0,4
8115,A80+,W,2020-12-12,2020-12-23,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-24,2020-12-23,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-28,2020-12-23,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-31,2020-12-23,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-24,2020-12-24,0,0,-9,0,2,0,2
8115,A80+,W,2020-12-25,2020-12-25,0,0,-9,0,1,0,1
8115,A80+,W,2021-01-02,2020-12-25,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-26,2020-12-26,0,0,-9,0,3,0,3
8115,A80+,W,2020-12-30,2020-12-26,1,0,0,-9,1,1,0
8115,A80+,W,2021-01-02,2020-12-27,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-28,2020-12-28,0,0,-9,0,1,0,1
8115,A80+,W,2020-12-30,2020-12-28,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-01,2020-12-28,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-08,2020-12-28,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-13,2020-12-28,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-07,2020-12-28,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-29,2020-12-29,0,0,-9,0,5,0,5
8115,A80+,W,2021-01-02,2020-12-29,1,0,0,-9,1,1,0
8115,A80+,W,2020-12-30,2020-12-30,0,0,-9,0,3,0,3
8115,A80+,W,2021-01-01,2020-12-30,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-02,2020-12-30,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-05,2020-12-30,1,0,-9,0,1,0,1
8115,A80+,W,2020-12-31,2020-12-31,0,0,-9,0,1,0,1
8115,A80+,W,2021-01-01,2021-01-01,0,0,-9,0,4,0,4
8115,A80+,W,2021-01-14,2021-01-01,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-02,2021-01-02,0,0,-9,0,5,0,5
8115,A80+,W,2021-01-02,2021-01-02,0,0,0,-9,1,1,0
8115,A80+,W,2021-01-07,2021-01-02,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-02,2021-01-02,1,0,0,-9,1,1,0
8115,A80+,W,2021-01-03,2021-01-03,0,0,-9,0,3,0,3
8115,A80+,W,2021-01-04,2021-01-04,0,0,-9,0,1,0,1
8115,A80+,W,2021-01-01,2021-01-04,1,0,0,-9,1,1,0
8115,A80+,W,2021-01-08,2021-01-04,1,0,0,-9,1,1,0
8115,A80+,W,2021-01-05,2021-01-05,0,0,-9,0,12,0,12
8115,A80+,W,2020-12-23,2021-01-05,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-08,2021-01-05,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-07,2021-01-07,0,0,-9,0,7,0,7
8115,A80+,W,2021-01-07,2021-01-07,0,0,0,-9,1,1,0
8115,A80+,W,2021-01-09,2021-01-07,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-08,2021-01-08,0,0,-9,0,1,0,1
8115,A80+,W,2021-01-09,2021-01-09,0,0,-9,0,5,0,5
8115,A80+,W,2021-01-10,2021-01-10,0,0,-9,0,1,0,1
8115,A80+,W,2021-01-12,2021-01-10,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-11,2021-01-11,0,0,-9,0,1,0,1
8115,A80+,W,2021-01-12,2021-01-12,0,0,-9,0,3,0,3
8115,A80+,W,2021-01-12,2021-01-12,0,0,0,-9,1,1,0
8115,A80+,W,2021-01-13,2021-01-13,0,0,-9,0,2,0,2
8115,A80+,W,2021-01-14,2021-01-13,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-14,2021-01-14,0,0,-9,0,4,0,4
8115,A80+,W,2021-01-15,2021-01-15,0,0,-9,0,7,0,7
8115,A80+,W,2021-01-15,2021-01-15,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-16,2021-01-16,0,0,-9,0,3,0,3
8115,A80+,W,2021-01-18,2021-01-16,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-15,2021-01-16,1,0,0,-9,1,1,0
8115,A80+,W,2021-01-18,2021-01-18,0,0,-9,0,3,0,3
8115,A80+,W,2021-01-20,2021-01-20,0,0,-9,0,1,0,1
8115,A80+,W,2021-01-21,2021-01-20,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-22,2021-01-22,0,0,-9,0,2,0,2
8115,A80+,W,2021-01-25,2021-01-25,0,0,-9,0,1,0,1
8115,A80+,W,2020-12-29,2021-01-25,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-27,2021-01-25,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-28,2021-01-27,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-28,2021-01-28,1,0,-9,0,1,0,1
8115,A80+,W,2021-01-27,2021-02-01,1,0,-9,0,1,0,1
8115,A80+,W,2021-02-02,2021-02-02,0,0,-9,0,2,0,2
8115,A80+,W,2021-02-04,2021-02-02,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-06,2021-02-06,0,0,-9,0,7,0,7
8115,A80+,W,2021-02-06,2021-02-06,0,0,0,-9,2,2,0
8115,A80+,W,2021-02-09,2021-02-07,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-09,2021-02-09,0,0,-9,0,2,0,2
8115,A80+,W,2021-02-10,2021-02-09,1,0,-9,0,1,0,1
8115,A80+,W,2021-02-10,2021-02-10,0,0,-9,0,4,0,4
8115,A80+,W,2021-02-10,2021-02-10,0,0,0,-9,1,1,0
8115,A80+,W,2021-02-10,2021-02-10,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-11,2021-02-11,0,0,0,-9,1,1,0
8115,A80+,W,2021-02-12,2021-02-12,0,0,-9,0,9,0,9
8115,A80+,W,2021-02-12,2021-02-12,0,0,0,-9,1,1,0
8115,A80+,W,2021-02-12,2021-02-12,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-12,2021-02-13,1,0,-9,0,1,0,1
8115,A80+,W,2021-02-14,2021-02-14,0,0,-9,0,1,0,1
8115,A80+,W,2021-02-17,2021-02-14,1,0,-9,0,1,0,1
8115,A80+,W,2021-02-15,2021-02-15,0,0,-9,0,2,0,2
8115,A80+,W,2021-02-19,2021-02-15,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-16,2021-02-16,0,0,-9,0,4,0,4
8115,A80+,W,2021-02-16,2021-02-16,0,0,0,-9,1,1,0
8115,A80+,W,2021-02-17,2021-02-17,0,0,-9,0,9,0,9
8115,A80+,W,2021-02-17,2021-02-17,0,0,0,-9,5,5,0
8115,A80+,W,2021-02-17,2021-02-17,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-18,2021-02-18,0,0,-9,0,1,0,1
8115,A80+,W,2021-02-12,2021-02-18,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-19,2021-02-19,0,0,-9,0,4,0,4
8115,A80+,W,2021-02-10,2021-02-19,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-12,2021-02-19,1,0,0,-9,1,1,0
8115,A80+,W,2021-02-24,2021-02-24,0,0,-9,0,1,0,1
8115,A80+,W,2021-02-17,2021-02-24,1,0,0,-9,1,1,0
8115,A80+,W,2021-03-11,2021-03-01,1,0,-9,0,1,0,1
8115,A80+,W,2021-03-06,2021-03-06,0,0,-9,0,1,0,1
8115,A80+,W,2021-03-24,2021-03-13,1,0,-9,0,1,0,1
8115,A80+,W,2021-03-31,2021-03-17,1,0,-9,0,1,0,1
8115,A80+,W,2021-03-23,2021-03-17,1,0,0,-9,1,1,0
8115,A80+,W,2021-03-19,2021-03-18,1,0,-9,0,1,0,1
8115,A80+,W,2021-03-19,2021-03-19,0,0,-9,0,1,0,1
8115,A80+,W,2021-03-20,2021-03-20,0,0,-9,0,3,0,3
8115,A80+,W,2021-03-26,2021-03-20,1,0,-9,0,1,0,1
8115,A80+,W,2021-03-22,2021-03-22,0,0,-9,0,3,0,3
8115,A80+,W,2021-03-23,2021-03-23,0,0,-9,0,2,0,2
8115,A80+,W,2021-03-24,2021-03-24,0,0,-9,0,2,0,2
8115,A80+,W,2021-03-24,2021-03-24,0,0,0,-9,1,1,0
8115,A80+,W,2021-03-26,2021-03-26,0,0,-9,0,1,0,1
8115,A80+,W,2021-03-31,2021-03-26,1,0,0,-9,1,1,0
8115,A80+,W,2021-04-01,2021-03-29,1,0,-9,0,1,0,1
8115,A80+,W,2021-03-30,2021-03-29,1,0,0,-9,1,1,0
8115,A80+,W,2021-04-01,2021-04-01,0,0,0,-9,1,1,0
8115,A80+,W,2021-04-06,2021-04-02,1,0,0,-9,1,1,0
8115,A80+,W,2021-04-28,2021-04-05,1,0,-9,0,1,0,1
8115,A80+,W,2021-04-06,2021-04-06,0,0,-9,0,1,0,1
8115,A80+,W,2021-04-07,2021-04-06,1,0,-9,0,1,0,1
8115,A80+,W,2021-04-09,2021-04-06,1,0,-9,0,1,0,1
8115,A80+,W,2021-04-07,2021-04-07,0,0,-9,0,1,0,1
8115,A80+,W,2021-04-13,2021-04-09,1,0,-9,0,1,0,1
8115,A80+,W,2021-03-29,2021-04-09,1,0,0,-9,1,1,0
8115,A80+,W,2021-04-10,2021-04-10,0,0,-9,0,1,0,1
8115,A80+,W,2021-04-23,2021-04-11,1,0,-9,0,1,0,1
8115,A80+,W,2021-04-14,2021-04-14,0,0,-9,0,2,0,2
8115,A80+,W,2021-04-16,2021-04-16,0,0,-9,0,1,0,1
8115,A80+,W,2021-04-16,2021-04-16,1,0,-9,0,1,0,1
8115,A80+,W,2021-04-21,2021-04-16,1,0,-9,0,1,0,1
8115,A80+,W,2021-04-30,2021-04-17,1,0,-9,0,1,0,1
8115,A80+,W,2021-04-23,2021-04-23,0,0,-9,0,1,0,1
8115,A80+,W,2021-05-06,2021-04-26,1,0,-9,0,1,0,1
8115,A80+,W,2021-04-27,2021-04-27,0,0,-9,0,1,0,1
8115,A80+,W,2021-04-27,2021-04-27,0,0,0,-9,1,1,0
8115,A80+,W,2021-05-06,2021-05-01,1,0,-9,0,1,0,1
8115,A80+,W,2021-05-04,2021-05-04,0,0,-9,0,1,0,1
8115,A80+,W,2021-05-06,2021-05-06,0,0,-9,0,3,0,3
8115,A80+,W,2021-05-08,2021-05-06,1,0,-9,0,1,0,1
8115,A80+,W,2021-05-10,2021-05-07,1,0,-9,0,1,0,1
8115,A80+,W,2021-05-08,2021-05-08,0,0,-9,0,1,0,1
8115,A80+,W,2021-05-10,2021-05-10,0,0,-9,0,1,0,1
8115,A80+,W,2021-05-11,2021-05-11,0,0,-9,0,1,0,1
8115,A80+,W,2021-05-17,2021-05-17,0,0,-9,0,1,0,1
8115,A80+,W,2021-05-27,2021-05-27,0,0,-9,0,1,0,1
8115,A80+,W,2021-06-03,2021-06-03,0,0,-9,0,1,0,1
8115,A80+,W,2021-07-21,2021-07-19,1,0,-9,0,1,0,1
8115,A80+,W,2021-07-29,2021-07-29,0,0,-9,0,1,0,1
8115,A80+,W,2021-08-02,2021-08-02,0,0,-9,0,1,0,1
8115,A80+,W,2021-08-09,2021-08-09,0,0,-9,0,1,0,1
8115,A80+,W,2021-08-17,2021-08-13,1,0,-9,0,1,0,1
8115,A80+,W,2021-08-23,2021-08-15,1,0,-9,0,1,0,1
8115,A80+,W,2021-08-25,2021-08-21,1,0,0,-9,1,1,0
8115,A80+,W,2021-08-31,2021-08-29,1,0,-9,0,1,0,1
8115,A80+,W,2021-09-03,2021-08-30,1,0,-9,0,1,0,1
8115,A80+,W,2021-08-31,2021-08-31,0,0,-9,0,1,0,1
8115,A80+,W,2021-08-31,2021-08-31,0,0,0,-9,1,1,0
8115,A80+,W,2021-09-09,2021-09-04,1,0,-9,0,1,0,1
8115,A80+,W,2021-09-09,2021-09-07,1,0,-9,0,1,0,1
8115,A80+,W,2021-09-06,2021-09-08,1,0,-9,0,1,0,1
8115,A80+,W,2021-09-13,2021-09-08,1,0,-9,0,1,0,1
8115,A80+,W,2021-09-14,2021-09-14,0,0,0,-9,1,1,0
8115,A80+,W,2021-09-21,2021-09-14,1,0,-9,0,1,0,1
8115,A80+,W,2021-09-15,2021-09-15,0,0,-9,0,1,0,1
8115,A80+,W,2021-09-20,2021-09-17,1,0,-9,0,1,0,1
8115,A80+,W,2021-09-24,2021-09-21,1,0,-9,0,1,0,1
8115,A80+,W,2021-09-27,2021-09-25,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-02,2021-10-02,0,0,-9,0,1,0,1
8115,A80+,W,2021-10-02,2021-10-02,0,0,0,-9,1,1,0
8115,A80+,W,2021-10-13,2021-10-10,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-30,2021-10-10,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-22,2021-10-12,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-16,2021-10-13,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-17,2021-10-15,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-16,2021-10-15,1,0,0,-9,1,1,0
8115,A80+,W,2021-10-17,2021-10-15,1,0,0,-9,1,1,0
8115,A80+,W,2021-10-21,2021-10-17,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-22,2021-10-17,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-29,2021-10-17,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-20,2021-10-19,1,0,-9,0,2,0,2
8115,A80+,W,2021-10-20,2021-10-20,0,0,0,-9,1,1,0
8115,A80+,W,2021-10-21,2021-10-21,0,0,-9,0,2,0,2
8115,A80+,W,2021-10-23,2021-10-23,0,0,-9,0,1,0,1
8115,A80+,W,2021-10-27,2021-10-23,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-24,2021-10-24,0,0,-9,0,1,0,1
8115,A80+,W,2021-10-29,2021-10-24,1,0,-9,0,1,0,1
8115,A80+,W,2021-10-25,2021-10-25,0,0,-9,0,1,0,1
8115,A80+,W,2021-10-26,2021-10-26,0,0,-9,-9,1,0,0
8115,A80+,W,2021-10-26,2021-10-26,0,0,-9,0,3,0,3
8115,A80+,W,2021-10-26,2021-10-26,0,0,0,-9,1,1,0
8115,A80+,W,2021-10-27,2021-10-27,0,0,-9,0,1,0,1
8115,A80+,W,2021-11-02,2021-10-29,1,0,-9,0,1,0,1
8115,A80+,W,2021-11-02,2021-10-31,1,0,-9,0,1,0,1
8115,A80+,W,2021-11-03,2021-11-03,0,0,-9,-9,2,0,0
8115,A80+,W,2021-11-03,2021-11-03,0,0,-9,0,1,0,1
8115,A80+,W,2021-11-04,2021-11-04,0,0,-9,-9,2,0,0
8115,A80+,W,2021-11-05,2021-11-04,1,0,-9,0,1,0,1
8115,A80+,W,2021-11-07,2021-11-07,0,0,-9,-9,1,0,0
8115,A80+,W,2021-11-09,2021-11-09,0,0,-9,-9,4,0,0
8115,A80+,W,2021-11-10,2021-11-10,0,0,-9,-9,5,0,0
8115,A80+,W,2021-11-11,2021-11-11,0,0,-9,-9,7,0,0
8115,A80+,W,2021-11-12,2021-11-12,0,0,-9,-9,2,0,0
8115,A80+,W,2021-11-12,2021-11-12,0,1,-9,-9,1,0,0
8115,A80+,W,2021-11-13,2021-11-13,0,0,-9,-9,3,0,0
8115,A80+,W,2021-11-14,2021-11-14,0,0,-9,-9,1,0,0
8115,A80+,W,2021-11-15,2021-11-15,0,0,-9,-9,8,0,0
8115,A80+,W,2021-11-16,2021-11-16,0,0,-9,-9,1,0,0
8115,A80+,W,2021-11-17,2021-11-17,0,0,-9,-9,2,0,0
8115,A80+,W,2021-11-17,2021-11-17,0,1,-9,-9,1,0,0
8115,A80+,W,2021-11-18,2021-11-18,0,1,-9,-9,5,0,0
8115,A80+,W,2021-11-19,2021-11-19,0,1,-9,-9,2,0,0

(Die CSV-Dateien sind direkt aus dem Repository geladen.)

Dort gibt es zwar eine Fallgruppe, die ein Meldedatum von 2021-11-14 aufweist ist, aber dort ist keine Genesung gemeldet worden (-9). Meinem Verständnis nach sollte es für jede Fallgruppe, die -1 in (NeuerFall|NeuerTodesfall|NeuGenesen) hat, im Datensatz des Vortages eine Fallgruppe geben, die den gleichen Schlüssel (Landkreis+Altersgruppe+Geschlecht+Datumsangaben) hat, aber eine 0 oder eine 1 in der entsprechenden Spalte vorweist (und mindestens so viele Fälle wie die Fallgruppe mit -1 zurückzieht).

Übersehe ich etwas oder ist da ein Fehler in den Daten?

Wann wurde Eintrag in Datenbank hinzugefügt?

Gibt es die Möglichkeit in den Daten aufzunehmen wann ein Eintrag im CSV hinzugefügt wurde? (Und falls es vorkommt, dass Einträge nachträglich angepasst werden, wann der Eintrag zuletzt geändert wurde.)

In diesem Fall könnte man einfach feststellen, wie viele neue Einträge an einem Tag hinzugekommen sind.

Fehler in Readme.md bzgl. Ausprägung/Erläuterung für AnzahlFall, AnzahlTodesfall, AnzahlGenesen

In der Datei Readme.md sind im Abschnitt Merkmalsausprägung in der Zeile AnzahlFall folgende Angaben falsch bzw. irreführend:

  • Spalte Ausprägung: Da in den Datensätzen auch negative Werte auftreten, sollte hier Ganzzahlig statt Natürliche Zahl stehen.
  • Spalte Erläuterung: In den vorhandenen Daten ist AnzahlFall < 0 genau dann, wenn NeuerFall = -1 ist. Die Zahlen sind also nicht als negativ zu interpretieren, denn sie sind negativ.
    Wenn man diese Zahlen als Korrekturen interpretiert, d.h. mit ihrem (negativen) Vorzeichen auf die positiven Werte von AnzahlFall addiert, weicht das Ergebnis stark von dem Wert ab, der im Dashboard (https://corona.rki.de/) angezeigt wird.
    Wenn man dagegen die negativen Fallzahlen ignoriert, d.h. für die Summe der Fälle nur die Werte berücksichtigt, die größer als Null sind, erhält man den Wert, der mit der Angabe im Dashboard übereinstimmt.

Das gleiche gilt für die Zeilen AnzahlTodesfall und AnzahlGenesen.

Eine Auswertung der Daten ist unter https://github.com/runbikeswim/RKI-COVID-15-Data-Sources-Analysis zu finden.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.