De l’accès aux financements européens à la sécurité de l’IA : la nouvelle dimension d’Orphanet

Né à l’Inserm en 1997, le site web Orphanet a d’abord été conçu comme un simple outil d’information pour donner une visibilité médicale aux maladies rares. Mais cette encyclopédie de référence a radicalement changé de dimension, s'imposant comme la clé des fonds européens et le garant d’une IA fiable. Décryptage d'un modèle de science ouverte devenu un label de qualité international.

Publié le 24.06.26

National

Vie de l'Institut

Imprimer la page

À l’heure où l’Europe de la santé se déploie autour du numérique, Orphanet s’impose comme la clé de voûte de la structuration des données pour les maladies rares. Ce changement de paradigme s’inscrit au cœur du déploiement de l’Espace européen des données de santé (EHDS) et du lancement de l’European Rare Disease Research Alliance (ERDERA) en 2024. Pour être retenus par ces nouvelles instances ou pour décrocher la labellisation de centres d’expertise nationaux, les projets de recherche doivent désormais répondre aux critères d’interopérabilité les plus stricts.

D’un dictionnaire médical à une infrastructure de recherche mondiale

Orphanet est historiquement la première base de connaissances au monde dédiée aux maladies rares et aux médicaments orphelins. Sa mission d’origine est double : faciliter l’accès à l’information pour les patients et guider les professionnels de santé face à des pathologies souvent méconnues.

Au quotidien, ce rôle se traduit par un site web grand public unique. Traduit en 9 langues, il réunit une encyclopédie médicale, un répertoire des centres d’expertise et des associations, la cartographie des laboratoires de diagnostic, ainsi que le suivi des essais cliniques et des médicaments orphelins.

Mais derrière ce site d’information se cache une immense base de connaissances hautement structurée. C’est cette rigueur sémantique qui permet aujourd’hui à Orphanet de changer de dimension : d’un outil de consultation, il devient une infrastructure indispensable à la recherche moderne.

Financements et données : le standard Orphanet devient la règle

Orphanet produit une nomenclature unique, les ORPHAcodes, qui attribue un identifiant propre à chacune des 6 528 maladies rares existantes. Ce standard est aujourd’hui solidement ancré dans le paysage européen de la recherche : il est notamment intégré aux spécifications officielles de l’Espace européen des données de santé (EHDS).

« Ce n’est plus seulement une recommandation de bonne pratique, c’est une exigence opérationnelle », explique le Dr Ana Rath, directrice Inserm de l’unité de service Orphanet. « Pour toute candidature à un projet financé par Erdera, l’inclusion de l’ORPHAcode de la pathologie concernée est désormais obligatoire. »

Pour aller plus loin dans la recherche translationnelle, Orphanet travaille à intégrer sa nomenclature dans un format de données partagé à l’échelle internationale (OMOP). L’objectif ? Garantir une interopérabilité totale avec les dossiers de santé électroniques et la base de données DARWIN EU de l’Agence européenne des médicaments (EMA).

Un standard de classe mondiale

Au-delà du site grand public, la plateforme Orphadata permet aux scientifiques d’exploiter directement ces données agrégées. Sa déclinaison en accès libre, Orphadata Science, bénéficie d’une double certification internationale : le label européen ELIXIR Core Data Resource et le label mondial Global Core Biodata Resource. Cette reconnaissance positionne Orphanet parmi les ressources de référence mondiales pour les sciences de la vie, aux côtés de géants comme le National Center for Biotechnology Information américain.

Maintenir ce niveau de reconnaissance exige un travail de l’ombre colossal de nos experts pour modéliser la littérature scientifique mondiale. Ces labels prouvent que l’Inserm ne se contente pas de faire de la recherche de pointe : il produit les infrastructures technologiques dont la science mondiale a besoin pour avancer.

Ana Rath

Directrice de l’unité de service Orphanet

Du codage générique aux ORPHAcodes : ce qui change concrètement pour la recherche et les patients

Pour mesurer l’impact d’Orphanet, il faut comprendre une faille du système hospitalier actuel. Pour enregistrer les diagnostics, les hôpitaux utilisent majoritairement une terminologie standard mondiale : la CIM-10 (Classification internationale des maladies de l’OMS). D’autres terminologies sont en cours d’adoption dans certains pays (SNOMED CT, CIM-11). Problème : ces terminologies offrent une vue très incomplète des maladies rares. Faute de termes spécifiques, elles regroupent des milliers de pathologies différentes sous des étiquettes floues comme “autres anomalies congénitales” ou “autres maladies du sang”.

Les ORPHAcodes changent la donne en attribuant un numéro unique et précis à chacune des 6 528 maladies rares répertoriées. En France, ce standard est déployé sur le terrain via l’application BaMaRa, utilisée par les cliniciens des centres de référence pour coder les dossiers des patients. De plus, les ORPHAcodes s’articulent parfaitement avec les classifications génériques (CIM, SNOMED), garantissant la visibilité des maladies rares dans tous les systèmes de santé existants.

Trouver l’aiguille dans la botte de foin

Avec la CIM-10, un chercheur voulant étudier une maladie précise ne peut pas retrouver ses patients, noyés dans une catégorie globale. Avec l’ORPHAcode, il peut cibler et rassembler une cohorte de patients spécifiques à l’échelle nationale. C’est la condition sine qua non pour lancer un essai clinique, et faire avancer la science et la recherche en santé.

La donnée au service du parcours de soins

Un patient mal codé est un patient invisible pour le système de santé. En reliant les dossiers hospitaliers aux données du système national des données de santé (SNDS) de l’Assurance maladie grâce à l’ORPHAcode, il devient possible de cartographier le parcours de santé réel et complet des malades.

Cela permet de calculer précisément le temps mis pour obtenir le bon diagnostic pour une pathologie rare. Mesurer ce délai permet de repérer là où le système coince, d’y remédier, et d’accélérer la prise en charge afin d’éviter aux familles des années d’errance médicale.

Un levier stratégique pour l’économie et les politiques de santé

Dans ce contexte, la donnée peut devenir un outil de transformation concrète du système de santé. Par exemple, les décideurs publics s’en servent comme boussole pour le Plan National Maladies Rares afin d’ouvrir des centres d’expertise là où les délais de diagnostic sont les plus critiques.

De son côté, l’Assurance Maladie l’utilise pour concevoir des parcours ciblés, repérer plus tôt les profils atypiques et ainsi réduire le coût financier colossal de l’errance médicale (examens redondants, urgences). Enfin, les hôpitaux et filières de santé s’en emparent pour adapter les formations et apprendre aux médecins généralistes à repérer immédiatement les premiers « signaux d’alerte ».

Ce gain de précision par rapport au codage classique (CIM-10) est si crucial pour la santé publique que l’Allemagne a voté une loi fédérale pour rendre l’usage des ORPHAcodes obligatoire dans tous ses hôpitaux. Une trajectoire également suivie par l’Autriche, les Pays-Bas et l’Italie.

IA en santé : Orphanet comme garde-fou contre les hallucinations

L’autre plus-value d’Orphanet réside dans sa dimension computationnelle. Le réseau a développé un vocabulaire structuré : ORDO (Orphanet Rare Disease Ontology) et le module ontologique HOOM (HPO-ORDO Ontological Module), qui permettent aux machines de comprendre les relations complexes entre maladies, gènes et phénotypes.

À l’ère de l’intelligence artificielle, cette structuration sémantique devient un précieux carburant pour les technologies de rupture. En effet, ORDO est directement intégrable dans des chaînes de traitement de machine learning ou des modèles de langage appliqués à la santé.

En fournissant une base de connaissances spécialisée, structurée et validée, Orphanet permet de guider l’apprentissage des IA, de sécuriser leurs résultats et de contrôler les éventuelles hallucinations factuelles. Des collaborations sont en cours de discussion avec le pôle IA & numérique de l’Inserm pour explorer ces approches.