Data scientist H/F
Role details
Job location
Tech stack
Job description
Aide au diagnostic en imagerie médicale (radiologie, médecine nucléaire) ; Transcription automatique des comptes rendus médicaux ; Optimisation des plannings et de l'organisation des soins ; Enrichissement des cohortes d'essais cliniques par données augmentées ; Projets multicentriques de recherche (LUCC en oncologie, CUB en pneumologie) ; Organisation de Data Challenges internationaux (DigiLut sur la greffe pulmonaire)., L'équipe Data Science L'équipe Data Science a pour mission de faciliter l'analyse de l'Entrepôt de Données de Santé, qui contient les données médicales de plusieurs millions de patients. Elle développe des bibliothèques scientifiques et des algorithmes permettant de transformer les données brutes en informations exploitables par les chercheurs et les cliniciens. L'équipe travaille en étroite collaboration avec les services cliniques et de nombreux partenaires académiques et industriels sur des cas d'usage divers. Vos missions Au sein de l'équipe Data Science, vous aurez pour mission de développer, valider et maintenir des algorithmes et bibliothèques logicielles facilitant l'exploitation des données issues du système d'information clinique à des fins de recherche et de pilotage. Vous vous concentrerez en particulier sur le traitement automatique du langage permettant de transformer les données textuelles de l'EDS en données structurées directement exploitables. Vous serez également impliqué dans le développement et l'adaptation de modèles de langage (LLM) pour des cas d'usage cliniques concrets. Les développements que vous réaliserez seront diffusés au sein de la communauté de recherche et vous serez amené(e) à contribuer à des articles scientifiques valorisant ces travaux d'un point de vue académique. Missions principales Consolidation de l'expression de besoin « traitement automatique du langage » avec les équipes de recherche et de pilotage de l'EDS Développement, validation et maintenance de bibliothèques logicielles scientifiques écrites en Python Développement et déploiement de modèles de machine learning et deep learning pour le pré-traitement des données Implication dans le développement de LLM médicaux et leur adaptation à des cas d'usage cliniques Rédaction de la documentation technique et utilisateur Développement de partenariats académiques Contribution à l'écriture d'articles scientifiques Missions ponctuelles Support utilisateur et formation au traitement automatique du langage Conseil interne et accompagnement des projets de recherche Promotion des outils et des pratiques de l'équipe Data Science aux équipes cliniques Participation aux Data Challenges et initiatives d'innovation
Requirements
Formation et expérience Diplôme d'ingénieur ou équivalent (Bac+5, Master 2) en data science Minimum 3 ans d'expérience démontrant une maîtrise de Python et des bonnes pratiques de revue de code et d'intégration continue Compétences techniques Vous avez un savoir-faire dans plusieurs de ces domaines : Expertise en traitement automatique des langues (NLP), utilisation et entraînement de modèles de langue (LLM) Expertise en statistiques Expertise en analyse de bases de données (SQL) Expertise en développement de modèles de machine learning (Huggingface, PyTorch, etc.) Expertise en calcul distribué et data management Expertise en développement Python Expertise en déploiement de modèles statistiques/machine learning Maîtrise de Linux et Git Anglais courant (interactions avec des partenaires internationaux) Qualités humaines Autonomie, flexibilité et sens des responsabilités Curiosité, dynamisme et créativité, avec une réelle envie d'innover Esprit d'équipe et volonté de prendre part à une aventure collective Capacité de vulgarisation des enjeux techniques à un public non-spécialiste Sens de l'écoute, du résultat et de la qualité