Blog Looker : les données comptent

Les données au temps du COVID-19

Daniel Mintz, Évangéliste technologique en chef chez Looker

21 avril 2020

Comment Looker appréhende les données au temps du COVID-19 ?

Depuis le début de la propagation du COVID-19 dans le monde entier, les données jouent un rôle capital. Face à un virus qui évolue rapidement, il est devenu très difficile d'obtenir des informations fiables. Les personnels soignants en première ligne se consacrent à juste titre à sauver des vies et n'ont pas le temps de s'arrêter pour recueillir des données.

Toutefois, de nombreuses personnes se sont mobilisées pour essayer de comprendre, autant que faire se peut, ce qui se passe exactement. Des professionnels du secteur de la santé publique, des journalistes, des universitaires et même des groupes de bénévoles sur le terrain ont fourni des efforts considérables pour trouver, recueillir, nettoyer, comprendre et maintenir des ensembles de données cruciales.

Durant cette période, nos clients, partenaires et les communautés qui n’ont d’autres choix que de s’adapter à cette nouvelle réalité, n’ont cessé de s’appuyer sur les données disponibles sur la situation actuelle et nous, de les accompagner au mieux dans cette démarche. Par ailleurs, les entreprises de e-commerce utilisent ces informations COVID pour s'adapter à une demande en forte augmentation, les chaînes de restaurants pour se réorganiser et privilégier la livraison, les établissements publics pour établir des prévisions afin d'atténuer l'impact du COVID sur leurs concitoyens. Et bien sûr, les acteurs du secteur de la santé, les hôpitaux, les laboratoires et les assureurs qui les utilisent pour comprendre comment mieux s’organiser.

Cependant, compte tenu du grand nombre d'entités qui collectent des données et du fait que chacune d'entre elles les présente de manière légèrement différente, la quantité de travail nécessaire pour les consolider et leur donner un sens est non négligeable. Par ailleurs, dès que les choses fonctionnent bien, la construction d'une pipeline pour garder les données actualisées tout en surveillant les changements de schéma ou de méthodologie est un véritable atout.

Nos collègues du programme Google Cloud Public Datasets ont utilisé leurs outils existants pour centraliser les données et y ajouter continuellement de nouveaux ensembles. Ces requêtes ont été effectuées gratuitement sur Google BigQuery.

La solution de Looker pour une intégration facile: les blocs de données

Au moment d'évaluer les domaines dans lesquels Looker pouvait apporter son aide, nous nous sommes concentrés non seulement sur la nécessité de rendre les données accessibles, mais également sur la facilité d’usage. Nous nous sommes déjà au préalable heurtés au problème qui consiste à rendre les ensembles de données publiques faciles à intégrer dans les workflows existants, et notre solution a été d’utiliser les blocs de données.

Ainsi, afin d'aider nos clients, les autorités sanitaires et toute autre partie intéressée à comprendre les informations relatives au COVID-19, nous publions aujourd'hui un bloc de données sur le sujet. Celui-ci se compose de modèles LookML, de tableaux de bord pré-construits et d'explorations, ainsi que de liens vers les données du Johns Hopkins Center for Systems Science and Engineering (JHU CSSE), du New York Times, du COVID Tracking Project, de Definitive Healthcare, de la Kaiser Family Foundation, et du Dipartimento della Protezione Civile (Département italien de la Protection civile).

Le bloc est gratuit et peut être chargé sur n'importe quelle instance Looker directement depuis le Marketplace.  Les données qui alimentent le bloc ne sont actuellement disponibles que dans BigQuery et elles fonctionneront sur toutes les instances de Looker ayant une connexion BigQuery existante. Si vous n'avez pas de connexion BigQuery, vous pouvez explorer gratuitement les résultats sur cette instance hébergée par Looker ou créer votre propre compte Google Cloud Platform. Nous prévoyons également de proposer les données sur Amazon Redshift, Snowflake, ainsi que sur d'autres bases prochainement.

Au fur et à mesure que de nouvelles sources pertinentes deviendront disponibles et que la compréhension de cette maladie dans le monde se renforcera, nous mettrons à jour le bloc afin d'y intégrer ces nouvelles connaissances. Cependant, comme nous savons que les gens prennent actuellement des décisions sur la façon de réagir à cette nouvelle réalité, nous avons voulu rendre ces informations accessibles dès maintenant, dans la mesure du possible.

Soyez prudent et indiquez-nous s'il existe d'autres sources de données que vous aimeriez voir figurer sur le site looker-covid-data-block@google.com.

P.S.: nous avons décidé de présenter ces résultats de la manière la plus claire possible. Étant donné que nous mettons à disposition les données provenant d'autres entreprises, mais que nous ne sommes pas en mesure d’en vérifier l'exactitude, ce bloc et les données sous-jacentes sont fournis tels quels.

Les questions légitimes et importantes sur la fiabilité des différentes sources sont nombreuses mais nous pensons qu'il est préférable de laisser ces questions aux experts en épidémiologie et autres domaines connexes. Comme les opinions divergent sur la manière d'interpréter de façon responsable les résultats relatifs à cette pandémie qui évolue rapidement, nous ne tenions pas à laisser entendre que les données sont plus fiables qu'elles ne le sont.

Nous faisons confiance à nos clients pour déterminer ce dont ils ont besoin dans ces informations et de les traiter avec le discernement nécessaire, le cas échéant. Nous vous encourageons également à lire les remarques importantes relatives à chaque source de données.

Suivant Précédent

S'inscrire pour lire les dernières publications

Publications récentes