Analyse prédictive et applications Big Data au service de l’e-santé

Analyse prédictive et applications Big Data dans la santé

Notre précédent billet traitait des besoins technologiques afin de traiter les données massives dans le secteur de la santé. Nous allons le voir, de nombreuses initiatives s’articulent à présent autour de l’analyse prédictive et des technologies Big Data dans le secteur de la santé.

Analyse prédictive de données

Deux chercheurs de l’école de médecine de Harvard, David McIver et John Brownstein, ont récemment démontré que l’on pouvait « se servir des requêtes menées sur les pages Wikipédia pour prédire avec précision, en temps réel, l’apparition des épidémies de grippe aux Etats-Unis ».

En effet, au-delà de la fiabilité des pages de Wikipédia souvent remises en cause, il est intéressant de considérer le trafic génèré par la plateforme (500 millions de visiteurs / mois !) comme un indicateur de tendances des centres d’intérêts de ses utilisateurs.
Wikipedia pourrait donc être considéré comme un vaste de terrain propice à l’analyse prédictive de données. Processus de d’analyse de l’information mis en avant dans la courbe de Gartner comme une innovation émergente, au même titre que peut l’être l’interprétation de données massives en temps réel.

wikipedia et l'analyse prédictive

WikiTrends pourrait d’ailleurs faire figure d’illustration technologique en matière d’analyse prédictive. En exploitant les quantités de données mises à disposition gratuitement par Wikipédia, cette application Big Data permet de quantifier et d’analyser les termes de recherches des utilisateurs. Son principe rejoint en ce sens les travaux de recherches menés par David McIver et John Brownstein, et laisse entrevoir la possibilité d’analyse prédictive issue des requêtes menées sur Wikipédia.

Quelques chiffres sur Wikipédia :

  • 30 millions d’articles en ligne
  • disponible en 287 langues
  • 500 millions de visiteurs/mois
  • 5.000 contributeurs actifs

Des applications Big Data appliquées à la santé

Chez Microsoft, le couplage de la Kinect avec l’analyse Big Data offre déjà de nouvelles perspectives pour les salles d’opération. Grâce à la Kinect, « le chirurgien est capable d’interagir avec les données du patient sans même avoir à toucher un ordinateur, un clavier ou une souris », selon Jamie Shotton, chercheur au laboratoire Microsoft research Cambridge (MRC).

PathoQuest, une startup du secteur biomédical participant au programme HANA initié par SAP, se positionne comme un acteur majeur du diagnostic médical par l’exploitation des dernières techniques de séquençage à très haut débit, en mode SaaS. Le recours à des technologies Big Data comme Hadoop doit leur permettre de raccourcir les délais de traitements (plusieurs To de données générés sur plusieurs semaines) liés à la vérification de présence d’un virus ou d’une bactérie.

Enfin, Watson le supercalculateur développé par IBM, a déjà trouvé aux Etats-Unis plusieurs utilisateurs et de nombreux débouchés grâce à son système cognitif hyper performant. A ce jour, 1500 médecins aux Etats-Unis l’utilisent pour affiner leurs prescriptions. Chez WellPoint, c’est l’installation d’un cloud privé Watson qui a été choisi pour servir le développement de la branche médecine de cette mutuelle américaine rassemblant 39 millions d’adhérents. A ce jour, 750 entreprises s’intéresseraient de près aux capacités d’analyse de Watson.

 

Même si le déploiement de projets portés par des architectures Big Data ou des processus d’analyse prédictive reste affecté à certains secteurs d’activités, on observe tout de même l’émergence de plusieurs initiatives dans le secteur de la santé. Ailleurs, des acteurs du Big Data comme Ingensi constitués de data scientists œuvrent à la conception et au développement de solutions Big Data pour des secteurs d’activités tout autre comme l’assurance, la finance ou le marketing.

L’expertise portée aujourd’hui par ces nouveaux architectes de la donnée est une clé incontournable pour déceler une opportunité liée à un projet Big Data. Garantir la fiabilité et le ROI d’une solution Big Data, quelque soit son domaine d’application, relève définitivement de connaissances pointues et d’une maîtrise totale des nouveaux outils d’analyse.