la-bnf-rejoint-les-editeurs-et-arkhenum

BnF-Partenariats s’associe à 13 éditeurs de presse et Arkhênum pour numériser et valoriser leurs archives

Explorer
Client BnF-Partenariats
Expertises en oeuvre
Audit et étude technique numérisation Offres de numérisation patrimoniale Numérisation sur site client

Contexte

Par l’intermédiaire de sa filiale BnF-Partenariats, la BnF lançait en 2016 RetroNews  qui réunit aujourd’hui sur une plateforme en ligne plus de 2 000 titres de presse publiés entre 1631 et 1952. Accessible sur abonnement, RetroNews est à la fois un espace digital de recherche et de consultation d’archives et un média pour tous donnant à découvrir l’histoire par les archives de presse.
 
En s’associant à des éditeurs contemporains tels que Libération, La Dépêche du Midi, La Voix du Nord,  Les Inrockuptibles ou encore Historia, BnF-Partenariats entend enrichir son offre multi-titres sur la seconde moitié du XXe siècle,  destinée au marché académique  tout en mettant à disposition des éditeurs une nouvelle plateforme de valorisation et de monétisation de leurs propres archives.

Enjeux

L’un des enjeux majeurs du projet de numérisation, étape indispensable de tout type de site internet, a été de pouvoir mener en parallèle la numérisation de collections pour partie sur le site  des quotidiens et pour d’autres titres dans les locaux d’Arkhênum.
 
La volumétrie à considérer (7,4 millions de pages) a nécessité la mise en place d’un processus de production industriel mais évolutif en fonction de la nature des collections.
 
Cette flexibilité dans la production est dictée par l’hétérogénéité des documents :

     

  • Différentes typologies de presse (PQR, hebdomadaire, …)
  • Différents formats de documents (tabloïds, broadsheet, …)
  • Niveau de conservation variable des documents
Un audit nécessaire
collections-de-la-bnf-ont-ete-auditees

Définir le contour du projet

Avant de se lancer, un audit des collections s’est avéré nécessaire pour comprendre le périmètre du projet et les enjeux à adresser.
 
Laurent Bidet, expert en numérisation chez Arkhênum, a durant un mois réalisé un tour de France des collections pour en dresser un état des lieux précis :
 

  • Constat d’état des documents et validation des métriques (ml, …)
  • Validation des bornes chronologiques concernées
  • Analyse de la structure des collections (évolution de la maquette, nombre de colonnes, …)
  • Faisabilité d’une numérisation in situ pour les titres concernés

 
Le rapport d’audit a pu mettre en lumière des alertes et surtout servir de base de travail pour anticiper et mettre en place le projet de numérisation. Durant cette phase, certaines collections ont été identifiées comme non numérisables (texte coupé et courbure, reliures et fascicules encartés, …) rendant la numérisation impossible. Le recours à d’autres dépositaires des collections (Archives départementales, …) a été organisé.

17 titres numérisés

7,4 millions de pages à numériser et traiter

Pas moins de 17 titres sont concernés par ce projet de numérisation depuis les quotidiens régionaux (Le Télégramme, La Provence, la Dépêche du Midi, la Manche Libre, Midi Olympique, …) jusqu’aux hebdomadaires et revues spécialisées nationales (Paris Match, l’Express, Charlie Hebdo, l’Histoire, Historia ou encore les Inrockuptibles).

 
Durant les 3 années du projet, 1 directeur de projet, 2 chefs de projet et 12 opérateurs vont assurer au sein d’Arkhênum le pilotage, la production et le contrôle des images numériques.

7-4-millions-de-pages-numerisees
Un projet de numérisation inédit
le-projet-de-numerisation-commence

De par l’organisation souhaitée par les diverses parties au projet, 4 sites de production autonomes ont été installés au sein des entités dépositaires des titres : Morlaix (Le Télégramme), Toulouse (La Dépêche du Midi), Saint Lô (La Manche Libre) et Marseille (La Provence). Arkhênum a déployé sur chaque site son savoir-faire technique (installation d’ateliers de numérisation autonomes) et humain (recrutement en local et formation des opérateurs sur site).
 
La numérisation des autres titres s’effectue dans les locaux permanents d’Arkhênum. Pour garantir une homogénéité parfaite des images numériques générées, un protocole très strict de numérisation a été établi avec la BnF : calibration, cadrage, colorimétrie, …
 
La Direction de production chez Arkhênum dédiée à ce projet, en la personne de Sigrid Haro, est en charge de garantir cette homogénéité ainsi que le bon déroulé de l’activité sur l’ensemble des ateliers.

Témoignage « Nous avons trouvé chez Arkhênum un partenaire qui a su prendre la mesure de l’ampleur de ce projet industriel. »
Yoann Gantch
Directeur adjoint & business development
BnF-Partenariats

L’outil de suivi de production interne Numesis a été adapté pour pouvoir suivre spécifiquement ce projet notamment sur la phase de contrôle qualité.
 
Suite à la validation des lots, un traitement poussé des images au travers de la segmentation d’articles, de la reconnaissance de caractères (OCR) et d’enrichissement sémantique seront réalisés pour permettre ensuite lors de la consultation en ligne de proposer une recherche optimale.

le-projet-fait-l-objet-d-un-suivi-attentif
Contrôle qualité et métadonnées

De la numérisation à la préservation et à la valorisation commerciale des archives de presse

Les archives des éditeurs de presse seront versées au fur et à mesure à la BnF qui en assurera la conservation dans son service de préservation pérenne (SPAR) et la valorisation auprès de son public de chercheurs dans ses salles de lecture via Gallica intra-muros.
 
Dans le même temps, une plateforme de service développée par BnF-Partenariats, permettra la consultation de ces millions de pages de presse, constituant ainsi une nouvelle source extrêmement riche d’information et de documentation pour de nombreux publics. Les éditeurs associés à BnF-Partenariats pourront ainsi enrichir leurs offres d’abonnement et élaborer des produits documentaires basés sur leurs archives inexploitées à ce jour. Pour BnF-Partenariats, cela ouvre la possibilité de proposer des licences de consultation sur tout ou partie du fonds à des tiers, comme des écoles, des universités, des centres de recherches, …
 
Mise en production fin 2023, la plateforme sera accessible pour ses premiers clients dès 2024 selon des offres et modalités adaptées à toutes les typologies d’éditeurs. Les éditeurs de presse associés au projet font partie des premiers clients de la plateforme.
 
Contact commercial BnF-P : Yoann Gantch