Stage en IA générative et RAG pour le développement
instrumental en astrophysique
Contexte et Enjeux
L’UNIDIA, unité du CNRS, développe des instruments scientifiques de pointe pour des projets
s’étalant sur 15 à 20 ans. Ces projets génèrent une documentation technique massive et
hautement spécialisée (PDF, code, tickets JIRA, etc.), dont la gestion est cruciale pour la pérennité
des connaissances.
Pour répondre à ces défis, l’UNIDIA conçoit des outils d’IA générative basés sur des architectures
open source et autohébergées, garantissant confidentialité et souveraineté des données. Une
preuve de concept (PoC) a été développée en interne. Nous recherchons un·e stagiaire qui pourra
travailler sur deux axe :
Industrialiser la PoC et optimiser l’ingestion de données documentaires.
Mettre au point un methode d’ingestion de ticket JIRA dans une base de donnée documentaire.
Le·a stagiaire travaillera sur la machine de calcul dédiée à l’IA de l’UNIDIA, dans un environnement
sécurisé et performant.
Profil recherché
Étudiant en Master 2 Informatique ou école d’ingénieur (spécialisation IA, NLP, data science ou
développement logiciel avec volonté de développer ses compétence en IA).
Solides compétences en Python
Connaissance du traitement du langage naturel (PyTorch, Hugging Face, LangChain, etc.).
Intérêt pour les applications de l’IA générative.
Autonomie, rigueur scientifique et goût pour l’expérimentation.
Environnement de travail
Le stagiaire intégrera le Pôle d’Ingénierie Scientifique et Informatique (PISI) de l’UNIDIA.
Il y travaillera en collaboration avec les différents ingénieurs d’étude et de recherche en informatique,
et côtoiera également des experts métier issus de toutes les spécialités nécessaires au
développement et à l’intégration des instruments astronomiques de pointe.
Le stage offrira une opportunité unique de travailler sur des données réelles issues de projets
scientifiques de long terme, avec un fort potentiel d’application.
Encadrement et perspectives
Le stage sera encadré par un ingénieur de recherche et assisté de tous les expert métier du pôle.
Les résultats du stage pourront donner lieu à une publication et à un prototype intégré dans nos outils
RAG existants.
Candidature :
clement.hottier@obspm.fr
Envoyer CV + lettre de motivation à