Projet de recherche en résidence au BnF DataLab

L‘objectif du présent appel à projets est de permettre aux chercheurs, à titre individuel ou collectif, de bénéficier d’un accueil en résidence au BnF DataLab, sur le site François-Mitterrand à Paris, afin de profiter des services proposés par la BnF et l’IR* Huma-Num (services informatiques, accompagnement, communautés scientifiques nationales et internationales) ainsi que, le cas échéant, d’un soutien financier, sous forme :
- d’un financement maximal de 10 000 € destiné à couvrir des dépenses en ressources humaines (stages, recrutements) ;
- d’une prise en charge par le BnF DataLab à hauteur de 1 500 € par projet pour les missions ou événements directement liés aux activités menées dans le cadre de la résidence.
Le BnF DataLab est un service d’assistance et d’accompagnement à la recherche mis en place par la BnF, en partenariat avec l’Infrastructure de Recherche (IR*) Huma-Num, pour accueillir dans des espaces spécialement aménagés à cet effet des chercheurs souhaitant exploiter à grande échelle les collections numériques de la BnF à l’aide d’outils de traitement et d’analyse automatisés. Ces collections représentent une masse importante de documents et de données d’une grande diversité, tant par leur forme que par leur contenu : collections numérisées dans Gallica et Gallica intra muros, archives du web, documents nés-numériques, métadonnées bibliographiques, jeux vidéo, documents sonores ou vidéos, documents multimédias, etc.
Certaines de ces collections sont encore protégées par le droit d’auteur (archives de l’internet, documents de Gallica intra muros, autres documents numériques « récents1 »…) : en application du code du Patrimoine, ces collections sous droit issues du dépôt légal ne sont consultables que dans les emprises de la BnF. La fouille des collections non libres de droit implique des traitements informatiques sur place, réalisés et conservés dans un environnement sécurisé non accessible à distance.
Les enjeux de l’appel sont doubles :
- encourager des projets innovants de recherche de fouille de textes et de données sur les collections numériques de la BnF ;
- permettre à la BnF de mieux cerner les pratiques numériques de recherche autour de ces collections et approfondir son expertise pour développer ou parfaire les outils qu’elle met à disposition. À ce titre, il est attendu des chercheurs qu’ils prennent part aux activités du DataLab, en privilégiant la présence sur site.
Les projets proposés devront impérativement porter sur les collections numériques de la BnF et faire appel à des méthodes et outils de traitement comportant une problématique de recherche originale ainsi qu’un enjeu de traitement quantitatif et / ou un défi technologique dans l’exploitation de textes et données.
En complément des recherches qu’ils mèneront au BnF DataLab, les chercheurs accueillis participeront au programme d’activités scientifiques et pédagogiques du BnF DataLab sous forme d’échanges et de rencontres : atelier de retour d’expérience, séminaire, journée d’étude….
Description des services du BnF DataLab dont pourront bénéficier les projets retenus
Le recours aux services sera précisément défini entre l’équipe du BnF DataLab et le responsable de chaque projet, une fois celui-ci sélectionné par le jury.
Les espaces aménagés dans la bibliothèque de recherche du site François-Mitterrand permettent aux chercheurs de travailler in situ sur des documents numériques de la BnF.
L’occupation des espaces du BnF DataLab permet :
- de réserver des salles de groupe de 4 à 8 places
- d’accéder à des box individuels de travail équipés d’un poste informatique et de deux écrans
- d’accéder aux services numériques dédiés au stockage, traitements, calcul et valorisation des infrastructures de la BnF ou d’Huma-Num, en fonction de l’analyse des besoins du projet
- de bénéficier d’une salle de formation et d’un espace de valorisation.
NB : en fonction des besoins, l’environnement de travail informatique pourra être enrichi des outils utilisés par les chercheurs, après validation de la faisabilité par la BnF.
L’accompagnement et le suivi de projet de la BnF et d’Huma-Num consistent en :
- une aide à la constitution de corpus : assistance bibliographique, aide pour l’extraction de corpus web et/ou pour l’extraction de données, métadonnées et/ou de documents
- une assistance des experts BnF et des ingénieurs d’Huma-Num : conseils sur les traitements à opérer et les outils à utiliser, aide à l’installation d’outils
- des formations : utilisation des outils de recherche bibliographiques, utilisation des API BnF, présentation des formats bibliographiques
- en accord avec son équipe technique, un accès aux services spécifiques d’Huma-Num, notamment : dépôt accompagné dans l’entrepôt Nakala, accès à un serveur GPU pour traitement de corpus, accompagnement technique et opérationnel pour la diffusion et l’exposition des données (Nakala Press, site web), référencement dans Isidore.science…
Types de projets visés par le présent appel
- Le projet doit comporter un clair enjeu scientifique de traitement et d’analyse des collections numériques de la BnF. Dans sa réponse, l’équipe de recherche devra démontrer son aptitude à mettre en œuvre les méthodes et outils de traitement envisagés.
- Les projets proposés peuvent permettre d’amorcer une recherche nouvelle ou de compléter un programme déjà existant.
- Un lien fort et démontré des projets avec les missions du BnF DataLab et la confirmation d’une présence régulière des chercheurs dans les espaces du DataLab pour mener leurs travaux de recherche.
- Une durée minimale de 12 mois et maximale de 18 mois.
Préconisations méthodologiques
Tout en précisant les enjeux scientifiques, les projets soumis à l’appel devront respecter les obligations suivantes :
- porter obligatoirement sur les collections numériques de la BnF (Archives de l’internet, Gallica, métadonnées, documents audiovisuels, ressources électroniques…) ou sur celles de partenaires intégrées dans Gallica ; prendre en compte les questions de protection des données personnelles et les droits de propriété intellectuelle qu’imposent certains types de données ou de corpus BnF ;
- porter attention aux problématiques de recherche des Consortiums de l’Infrastructure de Recherche Huma-Num ;
- proposer des corpus, des méthodes ou des outils d’analyse originaux présentant un intérêt pour une communauté bien identifiée et livrer des résultats ou des outils d’aide à la recherche utiles et librement accessibles à cette communauté ;
- présenter les étapes de traitement des collections en détaillant les scénarios d’accès aux sources, corpus et données, leurs modes de constitution, de traitement et de conservation (pendant voire après la durée du projet si souhait de conservation des données utilisées lors de la recherche) ;
- s’engager sur un résultat final sur la base d’une description précise du ou des livrable(s) prévu(s) et d’un planning détaillé permettant de le(s) réaliser ;
- s’engager sur une présence effective et régulière des chercheurs sur toute la durée de la recherche dans les locaux du BnF DataLab(à chiffrer dans la proposition) pour mener leurs travaux de recherche et participer à la vie et à l’animation scientifiques du BnF DataLab à travers, par exemple, des ateliers, des formations ou tout autre dispositif innovant (à décrire dans la proposition) ;
- s’engager à animer un atelier de retour d’expérience sur la recherche conduite au BnF DataLab et participer aux actions collectives de restitution organisées par l’équipe du DataLab ;
- prévoir des formes de valorisation de la recherche (carnets de recherche, publications scientifiques dont des data papers qui peuvent être produits en collaboration avec le DataLab, communications lors de colloques, journées d’études, séminaires…) ;
Collections et ensembles de données
Les candidats peuvent proposer tout sujet de recherche qui rentre dans le cadre des objectifs de l’appel, des missions du BnF DataLab et des préconisations méthodologiques. Une description de différents ensembles numériques de la BnF qui peuvent faire l’objet des analyses est donnée sur le site de la BnF :
- Gallica ou Gallica intra muros
- Archives de l’internet
- Collections numériques du département Son, Vidéo, Multimédia
- Les métadonnées de la BnF
Les équipes de recherche sont encouragées à contacter la BnF en amont du dépôt pour poser toute question sur leur projet. Merci de contacter datalab@bnf.fr
Résultats et reversement des outils produits dans le cadre de la recherche
Dans le cadre de la politique pour la science ouverte formalisée dans le Plan national pour la Science Ouverte, les réalisations produites dans le cadre de cet appel à projet pourront être valorisées et mises à disposition des communautés de chercheurs souhaitant réutiliser les applications, les scripts et les corpus utilisés. Ces réalisations pourront rejoindre, sous réserve de validation, la boîte à outils du BnF DataLab et les services de l’IR* Huma-Num.
Modalités de soumission
Le responsable du projet doit remplir le formulaire joint à l’appel qui contient les éléments suivants :
- Description du projet : sujet, objectifs, livrables
- Détails de la mise en œuvre et des services du BnF DataLab sollicités
- Présentation du lien avec les missions du BnF DataLab
- Pistes de valorisation
- Profils de postes à financer et budget demandé
- CV du responsable du projet
- Lettre d’engagement de l’établissement porteur du projet
Le dossier complet doit être envoyé sous forme d’un fichier PDF unique par courriel à l’adresse datalab@bnf.fr
Les dossiers doivent être reçus par voie électronique au plus tard le 15 octobre 2025 (17h), délai et heure de rigueur. Un accusé de réception sera adressé au responsable du projet pour chaque dossier déposé. La BnF décline toute responsabilité pour des dossiers non reçus pour cause de problèmes techniques.
Règlement
En déposant un dossier, le candidat reconnaît avoir pris connaissance du présent règlement et déclare l’accepter sans réserve.
Recevabilité
- Le dossier de soumission, sous forme électronique, doit être transmis dans les délais, au format demandé et être complet.
- Le dossier, dans le format fourni, ne doit pas dépasser 12 pages (y compris le CV du responsable et la lettre d’engagement).
- La durée maximum du projet présenté est de 18 mois : le projet doit démarrer à partir du 1er janvier 2026 et au plus tard le 31 janvier 2026 et doit se terminer au plus tard le 30 juin 2027.
- Au-delà des services (espace, accompagnement, expertise, prise en charge des frais de missions-et d’événements dans la limite de 1 500 € TTC par projet) fournis par le BnF DataLab, le montant de financement demandé ne peut pas excéder les 10 000 € TTC pour des dépenses en ressources humaines.
Éligibilité
- Le projet doit être porté ou soutenu par au moins un laboratoire ou une unité de recherche relevant d’un établissement public de recherche.
- Le responsable du projet doit être de niveau doctorant (inscrit en thèse) ou au-delà (docteur, enseignant-chercheur, chercheur, ingénieur de recherche).
- Un projet retenu à un appel à projets précédent du BnF DataLab peut faire l’objet d’une nouvelle soumission au présent appel à condition de présenter des traitements nouveaux ou de nouvelles hypothèses découlant des premiers résultats.
Calendrier
- Lancement de l’appel à projet : septembre 2025
- Date limite de dépôt des dossiers : 15 octobre 2025
- Jury de sélection : semaine du 17 novembre 2025
- Notification des résultats : semaine du 24 novembre 2025
- Démarrage des projets : entre le 1er et le 31 janvier 2026
- Fin des projets : au plus tard le 30 juin 2027
Critères et processus de sélection
Les projets retenus seront choisis par un jury composé de membres de la BnF et de l’Infrastructure de Recherche Huma-Num.
Les projets seront évalués par le jury à partir des principaux critères suivants :
- Recevabilité : dépôt avant la date limite du dossier complet et respect du budget maximum.
- Adéquation : Le projet proposé est conforme aux missions du BnF DataLab. Il doit présenter une problématique de recherche qui porte obligatoirement sur les collections numériques de la BnF, ou des partenaires de la BnF disponibles sur Gallica.
- Les projets portant sur des corpus déjà disponibles (déjà numérisés / déjà collectés) seront privilégiés pour permettre une mise en œuvre rapide du projet.
- Les problématiques de recherche en rapport avec des Consortiums d’Huma-Num feront l’objet d’une attention particulière.
- Pertinence: le projet doit obligatoirement décrire les étapes prévues de traitement numérique des collections (modalités d’accès aux sources, aux corpus et données, modes de constitution, de traitement et de conservation, prise en compte des problématiques de gestion et de pérennisation des données…).
- La présence d’un plan de gestion des données, le cas échéant, sera un atout.
- Engagement : Les projets doivent détailler leur implication dans le BnF DataLab sous forme d’utilisation des espaces et des services proposés et de participation aux activités du BnF DataLab (formations, ateliers ou toute autre forme).
- Une présence effective dans les espaces pour mener les travaux du projet (traitements informatiques, analyses, réunions d’équipe…) est requise (à chiffrer dans la proposition).
- L’objectif d’un fort ancrage dans les espaces et dans la vie du BnF DataLab est un critère prioritaire dans l’évaluation des propositions.
- Qualité du dossier : originalité scientifique du projet, rigueur de la gestion du projet, compétences mobilisées, faisabilité scientifique et budgétaire, engagement en faveur de la science ouverte, qualité du ou des livrable(s) (s’il s’agit d’un logiciel, une préférence sera donnée aux réalisations sous licence libre).
Tout projet déposé fera l’objet d’une évaluation préalable par le BnF DataLab et les départements de la BnF concernés. Le choix des projets retenus se fera sous réserve de disponibilité des ressources nécessaires au sein de la BnF. De même, l’utilisation des services par les équipes retenues se fera dans les limites de la capacité du BnF DataLab et des départements de la BnF concernés.
La non-sélection de projets ne peut faire l’objet d’une contestation.
Dépenses
- Le financement accordé par projet est limité à un maximum de 10 000 € TTC et doit concerner exclusivement des dépenses en ressources humaines :
- stages
- recrutements
- En complément, le BnF DataLab prend en charge, dans la limite de 1 500 € par projet, les dépenses liées aux missions (ex. déplacements à Paris pour la résidence) et à l’organisation d’événements (ateliers, séminaires, retours d’expérience).
- Dépenses non éligibles :
- salaires ou primes de personnel permanent ;
- frais techniques autres que RH (prestations, licences, développement ou hébergement de site web, stockage) ;
- frais de publication ;
- frais de gestion (si applicables, ils doivent être pris en charge par l’établissement porteur, qui s’engage à les neutraliser ou les absorber).
- Un tableau prévisionnel du budget RH (stages ou contrats) devra être fourni.
- Les dépenses devront être certifiées par l’établissement, avec pièces justificatives à fournir.
Livrables / utilisation des résultats
- Le responsable doit décrire dans sa proposition les livrables du projet.
- Il est attendu que le livrable prenne la forme soit d’un outil, soit d’un guide méthodologique, soit d’une démonstration d’une technique d’analyse, susceptibles d’être valorisés dans le BnF DataLab.
- Le responsable d’un projet retenu s’engage à produire un rapport d’étape à mi-parcours et un rapport final.
- Le responsable d’un projet retenu s’engage à participer au programme de manifestations scientifiques, et en particulier à un atelier de partage d’expériences sur sa recherche, organisé par le BnF DataLab.
- Pour les logiciels développés dans le cadre du projet, l’utilisation d’une licence libre est fortement préconisée afin de faciliter leur utilisation par la communauté scientifique. En particulier, les logiciels, scripts etc. auraient vocation à rejoindre la boîte à outils du BnF DataLab (cf. supra) et/ou être proposés sur la grille de service d’Huma-Num.
- La BnF pourra communiquer sur les projets retenus et leurs résultats : les chercheurs s’engagent à respecter les mentions obligatoires dans toute communication.
Convention
- Une convention sera signée entre la BnF et l’établissement porteur du projet pour encadrer le versement de la subvention, son utilisation, le calendrier du projet, l’utilisation des résultats et les conditions d’accueil.
- L’équipe de recherche d’un projet retenu s’engage à respecter le règlement des salles de lecture de la BnF et, de manière générale, toute charte ou réglementation applicable relatives notamment à la propriété juridique des documents, la sécurité des collections, la circulation dans les espaces de la BnF et la reproduction des documents issus des collections de la BnF.
Modalités de versement
- Le financement accordé à tout projet retenu sera versé au début des travaux.
- Les modalités administratives de versement seront précisées dans la convention.
- La certification des dépenses sera à transmettre en fin de projet.
Présentation du DataLab, 2021, Elie Ludwig /BnF
Formulaire de dépôt
*En règle générale et sauf exceptions, une œuvre est protégée au titre du droit d’auteur pour une durée d’au moins 70 ans après le décès de son auteur. Avant cette date, elle peut faire l’objet d’une reproduction sous réserve de l’accord des auteurs ou de ses ayants droit ou de l’éditeur d’un site web. [