Der Impfstoff von Astra Zeneca wird derzeit in 173 Staaten eingesetzt, Biontech/Pfizer wird in 102 Staaten verimpft, Moderna in 52 und der Impfstoff Sinopharm in 36 Staaten. Diese und weitere Echtzeit-Zahlen zum COVID-19-Impffortschritt stellt Starschema über Snowflake zur freien Verwendung bereit – sie lassen sich über das Dashboard abrufen sowie vom Snowflake Data Marketplace beziehen.
Starschema und Snowflake wollen mit dem Datensatz für mehr Transparenz während der Pandemie sorgen und allen Akteuren Informationen zur Verfügung stellen, mit denen diese ihre Krisenmaßnahmen besser planen können.
Zur Erstellung der Live-Daten nutzt Starschema Daten aus verschiedensten verlässlichen Quellen, zum Beispiel vom Robert Koch-Institut, dem European Centre for Disease Prevention and Control, der Weltgesundheitsorganisation (WHO) sowie der Weltbank.
Der Starschema-Datensatz zeigt zudem das Potenzial des Snowflake Data Marketplace, auf dem sich Daten einfach, sicher und kontrolliert mit weiteren Parteien teilen lassen. Der COVID-19-Datensatz kombiniert Informationen aus einer Vielzahl von Quellen.
Die Datensätze liegen typischerweise in einer Vielzahl von Formaten vor, jedes mit seiner eigenen Struktur und seinen eigenen Feldern, was ihre Integration und Normalisierung erschwert. Durch die Partnerschaft mit Snowflake konnte Starschema diese Datensätze zusammenführen und zur Nutzung bereitstellen.
Eine frühere Version der Starschema-Dashboards zur Pandemieentwicklung erwies sich als wertvolle Informationsquelle für eine Vielzahl von Unternehmen beispielsweise aus dem Gesundheitswesen, dem Einzelhandel und auch für Finanzdienstleister.
So bezog Capital One die Startschema-Datenanalysen über den Snowflake Data Marketplace, um die Pandemieentwicklung besser verstehen und Strategien für den eigenen Personaleinsatz planen zu können.
Das Starschema-Team pflegt den Datensatz kontinuierlich, d.h. es überwacht ihn auf Probleme, behebt Fehler und ersetzt Datenquellen, falls eine aufhören sollte, Daten zu veröffentlichen oder eine bessere Quelle verfügbar wird – wobei die Benutzer immer darüber informiert werden, was sich geändert hat.
Das Starschema-Team nutzt ein öffentliches GitHub-Repository, um alle Datentransformationen zu speichern und zu dokumentieren. Das Team gibt transparent an, woher die Daten stammen und wann sie zuletzt aktualisiert wurden.