L’épidémiologie à l’ère du Big Data

Classé dans : Big Data, Réflexion IS | 0

31 août 1854, le quartier de Soho à Londres est frappé par le choléra. En trois jours, 127 personnes décèdent, et en tout, l’épidémie fait 616 morts. Le docteur John Snow est sceptique quant au fait que le choléra se propage par l’air, et pose l’hypothèse que la maladie se propage à la suite de l’ingestion d’une sorte de poison. Il interroge les habitants du quartier et établit une carte de la répartition des cas de choléra. Grâce à cette carte, il identifie la source de cette épidémie : une pompe à eau qui aliment plusieurs pâtés de maison. En effet, le nombre de cas de choléra augmente au fur et à mesure que l’on se rapproche de cette pompe(https://fr.wikipedia.org/wiki/Epidémie_de_choléra_de_Broad_Street).

 

Chaque trait correspond à un mort, la pompe à eau se trouve au milieu de la carte (source: https://www1.udel.edu/johnmack/frec682/cholera)

Ses travaux sur la propagation du choléra lui ont donné une place importante dans l’histoire de l’épidémiologie . Qu’est-ce que l’épidémiologie? C’est l’étude des problèmes de santé dans les populations humaines, leur fréquence, leur distribution dans le temps et dans l’espace, ainsi que les facteurs influant sur la santé et les maladies de populations.

Une nouvelle approche de l’épidémiologie

Avec l’apparition du Big Data, caractérisé entre autre par la variété, le volume et la vitesse des données (Mooney et al. 2015), une nouvelle approche de l’épidémiologie est apparue: l’épidémiologie numérique (ou épidémiologie digitale) (Dratva, Meier 2018).

L’épidémiologie numérique a les mêmes objectifs que l’épidémiologie classique, mais elle se base sur les données digitales que nous laissons sur Internet (tweet, réseaux sociaux, requête Google) pour récolter des informations sur la santé. Grâce à ses données digitales, on peut déduire la propagation d’une épidémie de grippe, par exemple (Goubet 2016).

Une des différences entre l’épidémiologie classique et l’épidémiologie numérique est l’absence du biais “blouse blanche”. En effet, lorsque les données sont récoltées dans un environnement médical, comme c’est le cas en épidémiologie classique, les réponses des participants sont fortement orientées, alors qu’un tel biais n’existe pas sur Twitter (Goubet 2016).

Pourquoi l’épidémiologie numérique est-elle intéressante ?

L’utilisation du Big Data peut parfois permettre de détecter plus rapidement une épidémie, en particulier dans les régions où la surveillance de la santé publique est limitée (Wilson, Brownstein 2009).

Le cas du virus Ebola en 2014 en est un exemple (Anema et al. 2014) : la première annonce publique d’Ebola a été rapportée le 14 mars 2014 par Health Map (système d’alerte automatisé collectant des données spécifique aux maladies). L’OMS et le Ministère de la Santé de Sierra Leone ont quant à eux publié l’avis concernant la possible propagation du virus Ebola en Sierra Leone le 22 mars 2014.

En 2010, Lors du tremblement de terre à Haïti, l’identification des personnes infectées et le déploiement d’un vaccin contre le choléra auraient pu être facilité par l’utilisation de données digitales. Malheureusement, dans l’incapacité à identifier la population à vacciner, aucun vaccin n’a été utilisé durant les premiers stades de l’épidémie (Mooney et al. 2015) (Date et al. 2011).

Epidémiologie numérique versus épidémiologie classique

D’après Marcel Salathé (Goubet 2016), l’utilisation des données numériques permettrait de corriger trois principaux défauts de l’épidémiologie classique:

  1. Dans les pays moins développés, très peu de gens peuvent consulter un médecin, alors qu’ils ont en général plus facilement accès à Internet
  2. Les données épidémiologiques sont biaisées : elles reposent plus sur les maladies (puisque nous n’allons consulter que lorsque nous sommes malades) que sur la santé
  3. La majorité des données épidémiologiques ne sont pas accessibles, et leur utilisation est donc limitée

Ce tableau liste quelques avantages et désavantage de l’épidémiologie numérique (Wilson, Brownstein 2009) :

Avantage

Inconvénient

  • Le déclenchement d’une épidémie est détecté plus rapidement qu’avec les outils de l’épidémiologie classique
  • Le système est relativement peu couteux et peut être automatisé
  • La propagation de l’information peut se faire en temps réel
  • L’accessibilité à l’information est plus grande et gratuite

 

 

  • L’information est souvent non-structurée et difficile à interpréter
  • La sensibilité et la spécificité ne sont pas claires et nécessitent des vérifications supplémentaires
  • La problématique de la protection des données

 

Le Big Data a un potentiel énorme, mais il doit également être utilisé avec précaution. Extraire des données qui soient significatives de cette énorme masse d’information n’est pas aisé et l’information doit absolument être vérifiée. S’assurer que la protection des données soit conservée est également une priorité, surtout lorsque ses données concernent la santé (Khoury, Ioannidis 2014) (Salathé et al. 2012).

“Big data’s strength is in finding associations, not in showing whether these associations have meaning” (Khoury, Ioannidis 2014)

L’épidémiologie numérique ne remplace pas l’épidémiologie classique, maie elle lui est complémentaire. Et si John Snow avait pu avoir accès au Big Data, il aurait certainement pu réaliser sa carte en quelques heures.

Bibliographie

ANEMA, Aranka, KLUBERG, Sheryl, WILSON, Kumanan, et al. 2014. Digital surveillance for enhanced detection and response to outbreaks. The Lancet Infectious Diseases [en ligne]. 2014. 14(11), 1035-1037. [Consulté le 16 décembre 2018]. Disponible à l’adresse : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4474182/

DATE, Kashmira A., VICARI, Andrea, HYDE, Terri B., et al. 2011. Considerations for oral cholera vaccine use during outbreak after earthquake in Haiti, 2010− 2011. Emerging infectious diseases [en ligne]. Nov 2011. 17(11), 2105-2112. [Consulté le 16 décembre 2018]. Disponible à l’adresse : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3310586/

DRATVA, Julia, MEIER, Christiane, 2018. Epidémiologie numérique : l’aube d’une ère nouvelle ! Forum Médical Suisse [en ligne]. 2018. 18(1–2):31–33. [Consulté le 16 décembre 2018]. Disponible à l’adresse : https://medicalforum.ch/fr/resource/jf/journal/file/download/article/smf/fr/fms.2018.03128/fms_03128.pdf/

KHOURY, Muin J. et IOANNIDIS, John PA. 2014. Big data meets public health. Science [en ligne]. 2014. 346(6213), 1054-1055. [Consulté le 16 décembre 2018]. Disponible à l’adresse : https://doi.org/10.1126/science.aaa2709

MOONEY, Stephen J., WESTREICH, Daniel J., EL-SAYED, Abdulrahman M., 2015. Epidemiology in the Era of Big Data. Epidemiology [en ligne]. May 2015. 26(3), 390–394. [Consulté le 16 décembre 2018]. Disponible à l’adresse : https://doi.org/10.1097/EDE.0000000000000274

GOUBET, Fabien, 2016. Traquer les maladies, un tweet à la fois. Le Temps [en ligne]. 22 septembre 2016. [Consulté le 16 décembre 2018]. Disponible à l’adresse : https://www.letemps.ch/sciences/traquer-maladies-un-tweet

SALATHE, Marcel, BENGTSSON, Linus, BODNAR, Todd J., et al. 2012. Digital epidemiology. PLoS computational biology, Jul 2012. 8(7), e1002616. [Consulté le 16 décembre 2018]. Disponible à l’adresse : https://doi.org/10.1371/journal.pcbi.1002616

WILSON, Kumanan, BROWNSTEIN, John S., 2009. Early detection of disease outbreaks using the Internet. Canadian Medical Association Journal (CMAJ) [en ligne]. 14 April 2009. 180(8), 829–831. [Consulté le 16 décembre 2018]. Disponible à l’adresse : https://doi.org/10.1503/cmaj.090215

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *