Comment surmonter les barrières de sécurité pour déverrouiller les données médicales-IA-php.cn

Le secteur de la santé est l'un des secteurs les plus riches en données, mais en raison de lois strictes en matière de confidentialité et de sécurité, les data scientists ne peuvent pas faire grand-chose avec ces données. Mais désormais, grâce à l'utilisation de paramètres de sécurité solides et d'analyses préservant la confidentialité dans le cloud computing, Providence Health commence à débloquer les « menottes » des data scientists et à innover dans le domaine des mégadonnées médicales.

Comment surmonter les barrières de sécurité pour déverrouiller les données médicales

Avec 52 hôpitaux, plus de 1 000 cliniques et environ 120 000 employés, Providence Health and Services est l'un des plus grands groupes de santé aux États-Unis. Comme la plupart des entreprises de soins de santé, Providence Health prend des mesures pour maintenir l'intégrité des données des patients. Après tout, personne ne veut enfreindre la loi HIPAA (Health Insurance Portability and Accountability Act/Healthcare Electronic Exchange Act), qui entraîne une amende de 50 000 $ pour chaque infraction.

La sécurité était une préoccupation majeure alors que la société basée à Renton, dans l'État de Washington, s'est lancée dans la mise à jour de son architecture d'analyse de données, en commençant par la migration de son ancien entrepôt de données SQL Server vers le cloud Microsoft Azure. Lindsey Miko, directrice de la science des données à Providence, a déclaré que la société avait pris des précautions supplémentaires pour garantir le maintien de contrôles stricts sur les données alors qu'elle travaillait avec Databricks et d'autres pour mettre en place un nouvel environnement de données fin 2019.

« Providence établit une norme particulièrement élevée en matière de cloud sécurisé », a déclaré Miko. "Chaque entreprise technologique avec laquelle je travaille... pense que c'est à cela que ressemble un cloud sécurisé. Et puis ils commencent à travailler avec nous, et ils ont rapidement des doutes sur la capacité à établir la norme. Nous travaillons main dans la main avec Microsoft et Databricks à construire Avec la nouvelle architecture de déploiement, nous avions besoin de quelque chose qui soit isolé de l'Internet public et qui puisse protéger correctement les données des patients.

Snowflake est également impliqué dans la nouvelle architecture de données basée sur le cloud de Providence. Le projet initial consistait à migrer un entrepôt SQL Server vieillissant vers un entrepôt de données Snowflake, ce qui fournirait un système plus évolutif pour analyser les données commerciales et cliniques. Providence est suffisamment grand pour accueillir des utilisateurs dans plusieurs entrepôts de données, de sorte que les environnements Databricks et Snowflake existent indépendamment.

Le contrôle des coûts est un objectif important du nouvel entrepôt cloud de Providence pour l'analyse traditionnelle ainsi que pour la création et l'exécution de modèles d'apprentissage automatique. En tant qu'hôpital catholique à but non lucratif ayant pour mission d'aider les pauvres et les nécessiteux, Providence a la responsabilité de fournir des soins abordables, et l'analyse peut aider à cet égard.

"Nous savons également qu'il existe une bulle de coûts dans le domaine des soins de santé. Les coûts pour les patients augmentent constamment. Les marges du système de santé sont minces. C'est un perdant-perdant", a-t-il déclaré. "Donc, trouver des moyens d'exploiter les données et les analyses pour contrôler les coûts, c'est le pain quotidien de l'ensemble du système de santé.

Certains des premiers cas d'utilisation impliquent l'utilisation de modèles d'apprentissage automatique pour prédire les besoins des patients, y compris des éléments tels que la morbidité et la durée. " de séjour. Ces prévisions sont intégrées à un modèle de dotation en personnel qui indique à Providence à quoi ressembleront probablement les besoins en personnel de service au cours des deux prochains mois.

L'élasticité infinie du cloud constitue une amélioration majeure par rapport à ce que l'entreprise utilisait auparavant. Bien que la migration de l’entrepôt de données ait commencé avant la pandémie de COVID-19, Miko et son équipe ont réalisé une grande partie du travail pendant la pandémie. L'entreprise de soins de santé a tiré parti de plusieurs modèles d'apprentissage automatique fournis avec le logiciel de dossier médical électronique (DME) d'Epic Systems, et ils ont bien fonctionné. En tant que plus grand utilisateur d’Epic, le succès du modèle d’apprentissage automatique est de bon augure pour l’équipe R&D d’Epic.

Dans le même temps, cela accélère le déploiement de systèmes de nouvelle génération, dont la télémédecine. "Nous sommes prêts. Nous disposons d'une infrastructure très robuste pour gérer la télémédecine. Être capable de déplacer de nombreuses données vers la télémédecine. Cela stimule également le développement de l'analyse prédictive. Concernant le risque de mortalité, la durée du séjour en soins intensifs et le début de la pandémie. Il existe un certain nombre d'autres modèles déployés. Ce sont des applications intégrées à Epic. Ce n'est que la première étape d'un long voyage où l'intelligence artificielle offre de nombreuses autres opportunités pour améliorer les soins cliniques", a déclaré Miko.

Par exemple, la société effectue une analyse en temps réel des dossiers médicaux de niveau de santé 7 (HL7) provenant d'Epic. Ces données sont traitées à l'aide de Spark Streaming puis chargées dans un formulaire dans l'entrepôt Databricks en temps réel.

Il a déclaré : "Ce travail a commencé par la mise en place de ce que nous appelons un centre de contrôle de mission qui aurait une vue en temps réel de ce qui se passe à l'hôpital

L’un des premiers cas d’utilisation de Mission Control Center consiste à obtenir une visibilité sur les ressources d’un hôpital individuel afin de déterminer s’il est capable de gérer les patients entrants. Il s’agit d’un outil utile pour contribuer à prévenir la surpopulation des hôpitaux, qui constituait une menace très réelle au plus fort de la pandémie de COVID-19.

Tirant parti de l’analyse et de l’intelligence artificielle pour améliorer les opérations commerciales et cliniques, il a déclaré : « C’est un excellent point de départ, une fois que vous avez une vue en temps réel de ce qui se passe dans le système de santé – qui est là, de quoi vous avez besoin, Et grâce à leurs graphiques, vous pouvez commencer à prédire ce qui va se passer ensuite. Je suis donc très intéressé par le contrôle de mission. pour optimiser davantage ses opérations et améliorer les services médicaux. Plus précisément, il travaille avec John Snow Labs et son modèle Spark NLP pour pouvoir extraire des données significatives des dossiers médicaux des médecins.

La sécurité et la confidentialité sont primordiales lorsqu'il s'agit de traiter ce niveau de données sensibles, la première priorité de Spark NLP est donc d'identifier les dossiers médicaux des patients. L'entreprise de soins de santé utilise des modèles pré-entraînés de John Snow Labs capables de reconnaître des identifiants tels que des dates, des noms, des adresses et des codes postaux.

"Cela fonctionne étonnamment bien", a déclaré Nadaa Taiyab, scientifique principale des données chez Tegria, une société de technologie et de services appartenant à Providence.

Après avoir étiqueté les identifiants, Providence utilise des données factices pour remplacer les données, éliminant ainsi le risque d'informations privées sur la santé. (PHI). Ce processus permet à Providence d'utiliser des données médicales agrégées pour effectuer des analyses avancées et former des modèles d'apprentissage automatique.

Bien que l'étape d'obscurcissement réduise le risque que les PHI tombent entre de mauvaises mains, il arrive parfois que des données réelles sur les patients soient nécessaires, en particulier lors de l'utilisation de modèles d'apprentissage automatique, a déclaré Taiyab. "Si vous l'agrégez, vous ne pouvez pas l'utiliser pour l'apprentissage automatique, si vous essayez de prédire quelque chose au niveau du patient." "Si vous voulez le prédire au niveau de la population, c'est une chose. Mais vous avez besoin de l'avoir. données au niveau du patient » pour faire des prédictions au niveau du patient.

Providence peut également utiliser les données de ses patients pour d'autres recherches médicales via l'Institut de biologie des systèmes (ISB). ISB est une société d'analyse médicale basée à Seattle, Washington, fondée par le Dr Leroy Hood, l'un des chercheurs du projet Génome humain. Le travail de sécurité des données effectué par Providence lui a permis de partager des données avec ISB, qu'elle a acquises en 2016.

Miko a déclaré que la capacité de l’ISB à exploiter le vaste entrepôt de données médicales de Providence sera importante pour la recherche de l’ISB sur les problèmes de santé, tels que le COVID-19 à long terme. "Ce n'est qu'un exemple de ce que cela signifie lorsque vous pouvez déployer et intégrer des données dans un environnement cloud sécurisé", a-t-il déclaré.

Les investissements dans la création d'une architecture de données cloud sécurisée devraient porter leurs fruits à mesure que Providence explore d'autres moyens d'utiliser l'analyse avancée et l'intelligence artificielle pour améliorer sa mission de soins de santé.

« Providence a conçu un modèle pour un cloud sécurisé pour les soins de santé », a déclaré Miko. "Cela demande beaucoup de pratique, beaucoup d'apprentissage, beaucoup de collaboration avec nos partenaires. Il faut l'améliorer à chaque étape. Le modèle de déploiement change à mesure que nous apprenons de nouvelles choses. Mais nous pensons qu'il y en a un très solide. "Un plan pour cela. » L’accès aux données reste l’un des principaux obstacles au progrès dans ce domaine. Le travail accompli par Providence pour réduire les risques en matière de sécurité et de confidentialité constitue un premier pas dans la bonne direction, mais il reste encore beaucoup à faire.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!