Pourriez-vous nous présenter votre parcours ?
Hugues Berry : J’ai commencé ma carrière en tant que maître de conférences à l’université, affilié à un laboratoire de biologie cellulaire, dans lequel j’étais responsable de la modélisation. Après quelques années, j’ai été recruté en tant que chercheur à l’Institut national de recherche en sciences et technologies du numérique (Inria) pour faire de la modélisation. J’ai commencé par un projet fondé sur l’idée de développer des microprocesseurs dont le fonctionnement serait inspiré par la biologie humaine, notamment pour ce qui touchait aux mécanismes d’apprentissage. D’une certaine manière, c’était assez prémonitoire, car le deep learning, une méthode qui permet à une machine d’apprendre à réaliser des tâches complexes, est arrivé peu après.
Après une mobilité vers Lyon, je me suis davantage spécialisé dans le domaine de la modélisation en neurosciences. De 2018 à 2023, j’ai été adjoint du directeur scientifique national de l’Inria pour la biologie et la santé numérique. À cette période, j’ai beaucoup travaillé au rapprochement de l’Inria avec l’Inserm. Nous avons créé de nouvelles équipes et plusieurs projets communs. Après cela, je suis revenu vers la recherche, et en particulier vers les applications de l’IA et du numérique pour la recherche de médicaments. Début 2025, l’Inserm m’a proposé de prendre la direction du pôle IA & numérique. Actuellement, mon temps se partage entre la recherche et le montage du pôle.
Quelles sont les missions du pôle IA & numérique de l’Inserm ?
H. B. : Le pôle a trois missions principales. La première consiste à être le point de contact central pour toutes les questions liées à l’IA et au numérique. L’objectif est de bien comprendre les dynamiques en cours au sein de l’Institut afin de définir nos priorités et construire une stratégie. Les instituts thématiques et les référents scientifiques joueront un rôle clé, grâce à leur connaissance approfondie des unités. Cela nous permettra de repérer les équipes déjà avancées sur ces sujets, mais aussi celles qui souhaitent progresser. Dans les deux cas, l’objectif est d’identifier leurs besoins d’accompagnement. Je me rendrai également sur le terrain pour rencontrer les unités et échanger directement avec elles.
La seconde mission est d’assurer un travail de pédagogie, notamment en ce qui concerne les bonnes pratiques d’utilisation de l’IA. Nous devrons répondre aux questions des laboratoires et les aider à s’approprier ces outils dans le respect de l’éthique, de la déontologie et de la législation en vigueur. Cela couvre tous les niveaux, des questions simples, comme l’utilisation de ChatGPT pour rédiger une thèse, à des interrogations plus subtiles. Par exemple, un étudiant de thèse peut-il utiliser ChatGPT ou MistralAI pour améliorer l’anglais d’un article ? Ou bien, si un réseau de deep learning a été entraîné sur des données pseudonymisées, puis-je partager le modèle entraîné sans risquer de dévoiler l’identité des patients ?
Enfin, la dernière mission est dédiée à l’accompagnement au déploiement de solutions pratiques. La formation seule ne suffit pas. Si certains collègues sont experts en informatique, on ne peut pas dire à ceux qui n’ont pas cette expertise : « voilà les outils, le mode d’emploi, débrouillez-vous ». Il est essentiel de prendre le temps de transmettre les bonnes pratiques et de les accompagner sur le terrain. Cela implique aussi de faire venir des experts dans nos laboratoires.
Certains chantiers sont-ils déjà engagés ?
H. B. : Oui, nous souhaitons par exemple créer des passerelles avec nos laboratoires pour intégrer des étudiants d’écoles d’ingénieurs spécialisées en IA et santé. Actuellement, je suis en train de négocier de nouveaux partenariats, notamment avec des écoles canadiennes.
Vous pourriez me demander : « Pourquoi ne pas mettre un doctorant sur les données de recherche du laboratoire ? » Nous essaierons bien entendu de le faire quand cela est possible mais le problème, c’est que souvent, nos scientifiques ne savent pas si leurs données sont suffisamment volumineuses ou propres pour que l’AI ou le machine learning puisse les exploiter. Miser un diplôme de thèse dans ce cas semble risqué. En revanche, un élève ingénieur qui fait un stage de découverte du monde professionnel, sans être fondamentalement lié au projet de recherche, cela fonctionne mieux.
D’autre part, la direction des systèmes d’information (DSI) a déjà commencé à rendre les données et les infrastructures de calcul plus accessibles. Par exemple, pour les données de santé, il est nécessaire de disposer d’une infrastructure habilitée à les héberger. Le Cloud de l’Inria a réussi à décrocher cette habilitation. Nous travaillons donc à faciliter l’accès à cette infrastructure pour les équipes de l’Inserm.
Les données et leur stockage : pourquoi est-ce un enjeu majeur ?
H. B. : La question du stockage est particulièrement cruciale dans la recherche préclinique. Par exemple, lorsqu’on travaille sur des données cellulaires, les technologies actuelles génèrent facilement des téraoctets de données. Pour vous donner une idée, un film en qualité Blu-Ray pèse environ 7,5 gigaoctets. Mais pour étudier une molécule, par exemple avec de la microscopie de super-résolution, chaque journée d’analyse peut produire plusieurs téraoctets de données. C’est également le cas pour les analyses « omiques » en cellules uniques : Si l’on étudie 20 000 cellules par expérience, avec pour chaque cellule des données d’expression correspondant à 60 000 gènes, on se retrouve avec un volume de données colossal. Pour une grande unité de recherche, le coût de stockage peut atteindre plusieurs dizaines de milliers d’euros par an. Or même ça, cela ne suffit pas : il faut également prévoir l’infrastructure nécessaire pour le partage des données. Comment transmettre dix téraoctets d’informations ? Si partager trois expériences prend plus de cent jours, cela devient clairement inefficace. Avec la DSI, nous travaillons au développement de solutions d’échange adaptées aux besoins de nos collègues.

Selon vous, les données sont-elles la clé de tout ?
H. B. : On entend beaucoup dire que « ce qui compte, ce sont les données ». Alors on se met à accumuler des données, en espérant que quelque chose d’exceptionnel en ressorte. Mais ce qui compte vraiment, ce sont d’abord les questions scientifiques. Si l’on n’a pas de vraies questions de recherche, les données seules ne servent à rien, quel que soit le volume disponible. Donc mon message serait : mettons avant tout l’accent sur les questions de recherche, et utilisons les données comme un levier pour y répondre – pas l’inverse.
Quelle est la place des unités de service dans cette montée en puissance autour de la data ?
H. B. : L’unité de service est pour moi le modèle qui fonctionne le mieux pour intégrer davantage le numérique et l’IA dans nos recherches. Il permet notamment à l’ingénieur dédié de partager son temps entre laboratoire et unité de service. Je crois qu’il est important que ce type de personnel soit présent au sein du laboratoire, mais puisse également passer du temps avec ses pairs pour avoir ses discussions « geeks ». Pouvoir discuter de code ou de deep learning avec des collègues, c’est parfois aussi essentiel qu’un bon café pour démarrer la journée !
Comment l’IA modifie-t-elle la façon de faire de la recherche ?
H. B. : L’intégration de l’IA dans la recherche va devenir de plus en plus courante. Par exemple, l’IA est beaucoup explorée actuellement pour identifier de nouvelles molécules, ou effectuer des sélections et tester un grand nombre de composés. En recherche clinique, elle permettra aussi probablement d’accélérer considérablement certaines étapes. Nous savons par exemple que les données générées dans le cadre des soins hospitaliers ou des cohortes de patients sont souvent complexes à analyser car hétérogènes : il y a des comptes rendus, des images, des résultats d’analyse quantitatifs, et toutes sortes de textes. L’IA peut automatiser certaines des tâches d’analyse et permettre d’approfondir le travail en aidant le chercheur à donner du sens aux données.
En matière d’éthique et de protection des données, quelles sont les spécificités liées à l’IA ?
H. B. : L’intelligence artificielle soulève des questions éthiques et de protection des données particulièrement délicates. L’enjeu majeur concerne la préservation de la vie privée des patients, ce qui restreint forcément l’échange de ces données. Et même si les données des patients ne sont pas exposées directement, le simple fait d’entraîner un modèle d’IA sur ces données peut poser problème. Une fois le modèle entraîné, comment être certain qu’il ne retient pas d’informations permettant d’identifier un individu ? C’est une question qui reste encore ouverte.
Un autre problème éthique majeur concerne les biais dans les données. C’est l’une des grandes faiblesses de l’IA : si les données utilisées pour entraîner un modèle sont biaisées, même de manière subtile, l’algorithme aura tendance à reproduire, voire à amplifier, ces biais. Par exemple, dans le domaine de la dermatologie, il existe des outils d’IA capables de détecter des anomalies cutanées à partir de simples photos. Ces outils ont généralement été entraînés sur des images de patients à la peau claire. Résultat : lorsqu’ils sont utilisés pour analyser des peaux plus foncées, leur performance peut considérablement diminuer, ce qui peut provoquer des erreurs de diagnostic. Contrairement à un dermatologue, qui sait adapter son regard à la diversité des types de peau, l’IA ne sait pas improviser. Si elle n’a jamais « vu » certains types de données, elle ne peut pas les interpréter correctement.
Un troisième enjeu, particulièrement sensible en santé, est l’explicabilité de l’IA, c’est-à-dire la capacité à comprendre comment un algorithme parvient à ses conclusions. Dans d’autres contextes, par exemple lorsque l’on utilise une application de cartographie, cette question ne se pose pas vraiment : on accepte que l’algorithme nous indique le chemin le plus rapide entre deux positions, sans forcément comprendre pourquoi il choisit tel ou tel itinéraire. Mais en médecine, la situation est différente. Si un algorithme annonce un diagnostic, le patient veut savoir sur quelles bases il repose. Et le médecin a encore plus besoin de cette information pour valider le diagnostic. Ce besoin d’explication est crucial, même pour les autorités de santé, car elles doivent pouvoir s’appuyer sur des arguments scientifiques solides pour évaluer l’efficacité des outils médicaux ou décider de leur remboursement. C’est là l’une des limites actuelles des IA.
Enfin, l’IA soulève aussi des préoccupations écologiques. Par exemple, une requête dans ChatGPT coûte dix fois plus d’électricité et d’énergie qu’une simple requête sur un moteur de recherche. Il est donc important de l’utiliser avec discernement : si l’on cherche simplement les épiceries ouvertes dans le quartier, il existe d’autres outils bien plus économes en ressources.
Dans la vie quotidienne, utilisez-vous des applications intégrant de l’IA ?
H. B. : Alors, je respecte profondément le travail de nos collègues administratifs, mais il faut reconnaître que la recherche est de plus en plus alourdie par des tâches administratives. Par exemple, chaque année, je dois rédiger plusieurs lettres pour mes doctorants, pour attester que tout va bien. Ces lettres sont souvent peu lues. Je dois avouer qu’il m’arrive d’utiliser des outils de génération automatique de texte pour gagner du temps. Et pour les demandes de financement, qui comportent souvent des paragraphes obligatoires mais répétitifs, ces outils font également un excellent travail pour les rédiger rapidement et efficacement.
Au quotidien aussi, je dois faire beaucoup de synthèses de documents. C’est un peu mon rôle de « manager de la recherche ». J’ai toujours plusieurs dizaines d’articles ou documents d’appels à projets à synthétiser, et ce travail de synthèse n’est pas le plus passionnant. Alors, si les informations contenues ne sont pas confidentielles, je mets tout dans un outil de synthèse automatique de texte, et je réécris si besoin. C’est vraiment un gain de temps. Mais si les informations contenues sont confidentielles, il faut être très prudent, car la plupart des outils commerciaux de génération de texte réutilisent les données qu’on leur fournit, rien n’indique donc qu’un autre utilisateur ne pourra pas récupérer des textes divulguant mes informations sensibles. C’est aussi des sujets sur lesquels nous travaillons.
En dehors du travail, quels sont vos plaisirs coupables ?
Il m’arrive de prendre des vacances spécialement pour jouer à des jeux vidéo ! Par exemple, je compte poser une semaine très bientôt afin de me plonger dans le dernier Assassin’s Creed. C’est un peu ma petite tradition. L’univers est tellement incroyable, surtout pour l’épisode situé en Égypte. Entre les pyramides et les temples pharaoniques, il y a vraiment un côté magique. Les couleurs, les détails, c’est comme voyager dans le temps ! Le jeu vidéo peut être une belle source d’évasion, même si je n’ai plus autant de temps qu’avant. Après, je me censure pour certains jeux, car je suis moins rapide qu’avant et pour certains jeux très exigeants, il est difficile de rivaliser avec la rapidité des jeunes joueurs !

Je suis également passionné de musique rock et métal, et je sais jouer de la guitare et de la basse ! La basse me convient très bien car je ne suis pas très technique. Je joue dans des groupes depuis l’âge de quinze ans. À une époque, j’avais monté un groupe avec un collègue de bureau, à l’Inria (il se reconnaîtra !). Nous répétions une fois par semaine, lui en tant que guitariste principal et moi, guitariste rythmique – c’était déjà un beau défi pour moi vu le niveau de difficulté de nos morceaux !