Entrepôt de données de santé : un projet collaboratif

Le docteur Alexandre Quillet, médecin de santé publique du service d'information médicale est le coordonnateur du projet, dont il nous explique les grandes lignes.

Quel est le contexte ?

Le groupement de coopération sanitaire de Nouvelle-Aquitaine (GCS NOVA) qui rassemble les CHU de Poitiers, Bordeaux et Limoges, a été le lauréat 2023 d’un appel à projet national pour la constitution des entrepôts de données de santé. Il s’agit d’un projet collaboratif d’ampleur avec un coût global de 9,5 millions d’euros sur 3 ans, dont 2,6 millions pour le CHU de Poitiers (financement à hauteur de 50% par BPI France). Ce projet a largement été soutenu par la direction générale du CHU de Poitiers avec un accompagnement financier majeur du CHU de Poitiers pour la moitié restante.

La mise en place de cet entrepôt de données de santé est une réelle opportunité pour notre CHU pour favoriser l’émergence de projets sur la réutilisation des données de santé dans le but d’améliorer les prises en charge de nos patients.

Qu’est-ce que l’entrepôt de données de santé ?

Notre système d’information hospitalier est composé de différents logiciels contenant de nombreuses informations qui sont collectées au cours des soins (biologie, diagnostics, actes, comptes rendus, venues, etc.). Cependant, ces logiciels n’ont pas été conçus pour faciliter l’utilisation secondaire de ces données pour des finalités telles que la recherche ou la surveillance épidémiologique. Pour ces situations, nous sommes actuellement contraints de réaliser de multiples extractions issues de différents logiciels avec un traitement manuel long qui ne garantit ni la qualité des données transmises, ni les exigences de sécurité.

Un entrepôt de données de santé est une infrastructure qui permet de centraliser et de normaliser les données contenues dans un système d’information dans un unique espace sécurisé pour faciliter leur réutilisation. Les finalités des entrepôts de données de santé sont multiples. Il y a tout d’abord la réutilisation des données à des fins de recherche, d’étude ou d’évaluation dans le cadre de la santé. Cela concerne la recherche médicale et paramédicale mais aussi, de manière plus large, de nombreuses autres disciplines (mathématiques, bio-informatique, économie, sciences humaines et sociales, etc.). Ainsi, l’entrepôt de données de santé permettra aux chercheurs d’identifier facilement des patients éligibles à une étude (pré-screening), de proposer des projets de recherche tout en étant accompagnés sur les aspects réglementaires et techniques ainsi que de pouvoir accéder aux données de leurs études dans un espace sécurisé pour les analyser.

D’autres finalités peuvent être menées à partir d’un entrepôt de données de santé comme la production d’indicateurs de santé, le pilotage stratégique de l’activité, la mise en place d’outils d’aide à la prise en charge médicale ou encore l’amélioration de la qualité de l’information médicale. La stratégie privilégiée au CHU de Poitiers est de construire un entrepôt de données de santé avec une vision très transversale de santé publique pour répondre à l’ensemble des besoins des futurs utilisateurs.

L’approche collaborative du projet au niveau régional permettra de mutualiser des moyens (procédures, code source, etc.), mais également, d’avoir une stratégie de convergence sur les outils techniques, la structuration des données et les organisations. Un espace de travail régional est prévu afin de pouvoir réaliser des projets multicentriques de plus grande ampleur. Cependant, chacun des entrepôts de données de santé des trois CHU de la région Nouvelle-Aquitaine gardera son autonomie pour la réalisation de projets monocentriques.

Quelles sont les exigences ?

La constitution d’un entrepôt de données de santé et l’exploitation des données qu’il contient sont soumises à de nombreuses exigences réglementaires et techniques. Ces éléments sont spécifiés dans un référentiel national dédié aux entrepôts de données de santé qui a été rédigé par la CNIL. Un entrepôt de données de santé doit être conforme à ce référentiel en tout point. Ce document se base sur les trois axes fondamentaux décrits ci-dessous.

Information des personnes | Une information individualisée doit être fournie aux patients pour lesquels les données sont intégrées dans l’entrepôt de données de santé. Cette information doit être réalisée lors de la constitution de l’entrepôt de données de santé mais également lors de chaque projet réutilisant des données de santé (à travers un portail de transparence, par exemple). L’objectif étant de permettre aux personnes concernées de faire valoir leur droit d’opposition si elles le souhaitent.

Gouvernance | Le CHU de Poitiers a mis en place un comité stratégique afin de vérifier le respect des finalités poursuivies et de définir les orientations stratégiques de l’entrepôt de données de santé. Par ailleurs, un comité scientifique et éthique sera constitué afin d’évaluer et de rendre un avis sur les projets basés sur la réutilisation des données de santé.

Aspects de sécurité | Toutes les données de l’entrepôt de données de santé seront stockées dans un datacenter du CHU de Poitiers. Comme le précise le référentiel de la CNIL, les futurs utilisateurs de l’entrepôt de données de santé auront accès à des espaces de travail restreints à leurs projets et l’ensemble des accès seront nominatifs, tracés et conservés. Il est important de préciser que les données collectées dans l’entrepôt de données de santé seront pseudonymisées pour respecter le secret médical. Cela signifie qu’aucune donnée identifiante (nom, prénom, adresse, numéro de séjour, numéro d’identifiant patient, etc.) ne sera présente dans l’entrepôt de données de santé.

Afin de donner une visibilité aux futurs utilisateurs sur le fonctionnement de l’entrepôt de données de santé, une charte sera mise à disposition en libre accès. Elle sera validée par le comité stratégique de l’entrepôt de données de santé et contiendra le contexte réglementaire, la description de la gouvernance, les modalités pour accéder aux données ainsi que les règles de bonne utilisation de cet outil.

Quel est le planning ?

L’objectif prioritaire pour le projet entrepôt de données de santé est la mise en conformité avec le référentiel de la CNIL d’ici fin 2024. Cela suppose notamment de définir et mettre en œuvre la stratégie d’information auprès des patients, de constituer un comité scientifique et éthique, de déployer l’infrastructure et d’intégrer les premières données. Ces dernières concerneront les mouvements des patients (consultations et hospitalisations), les données démographiques (sexe, âge), les données PMSI (actes médicaux et diagnostics), les résultats biologiques, le statut vital et les prescriptions médicamenteuses. A partir de janvier 2025, nous souhaitons débuter l’intégration des données textuelles (comptes rendus médicaux, observations médicales et paramédicales, etc.). L’objectif étant de pouvoir requêter plus finement sur le profil des patients (comorbidités, expositions, etc.).

Dès le début du projet, l’équipe entrepôt de données de santé a souhaité enclencher une dynamique importante sur la réutilisation des données. Ainsi, avec la collaboration de différentes équipes de recherche, neuf projets sur appel à projet financés ont pu être déposés en six mois. A ce jour, un projet régional porté par le Dr Thomas Kerforne sur la caractérisation de la marginalité des greffons rénaux issus de donneurs en mort encéphalique a été retenu pour financement en fin 2023. Un autre projet porté par Santé Publique France sur un outil de surveillance épidémiologique à partir des entrepôts de données de santé devrait être financé d’ici fin 2024.

Afin de présenter l’entrepôt de données de santé aux différents acteurs du CHU de Poitiers et d’identifier de futurs projets structurants pour l’établissement sur la réutilisation de données de santé, l’équipe entrepôt de données de santé va organiser des échanges avec l’ensemble des pôles de juin à octobre 2024. Notre souhait est d’identifier des projets de cohortes observationnelles à constituer en priorité pour lesquels plusieurs projets et publications pourront s’adosser. Dans un souci de pérennité de l’entrepôt de données de santé, nous prioriserons dans un premier temps les projets financés. Cependant, dès 2025, l’objectif est d’ouvrir plus largement le périmètre aux projets ambitieux suffisamment matures et, d’ici fin 2026, que tous les projets basés sur la réutilisation de données puissent pouvoir bénéficier de l’entrepôt de données de santé.