Skip to content
PMoirez edited this page Nov 18, 2016 · 40 revisions

Bienvenue au hackathon BnF 2016

La Bibliothèque nationale de France organise son premier hackathon les 19 et 20 novembre 2016 dans le cadre de la semaine de l’innovation publique. Les ressources de la bibliothèque numérique Gallica mais aussi de toutes les autres bases de données de la BnF offriront la matière de ce marathon participatif. Durant 24 heures sans interruption, les participants investiront le site François-Mitterrand pour développer des projets autour de la réutilisation des données publiques et imaginer ensemble la bibliothèque du futur.

La diffusion et la réutilisation des données publiques sont au cœur des enjeux de la BnF. Autour de ces principes, le hackathon permettra à une centaine de participants d’explorer durant 24 heures de nouveaux usages des collections et de faire émerger les contours de services innovants à destination des lecteurs de la Bibliothèque. Le thème du sosie est proposé comme point de départ à la créativité des participants qui pourront s’en inspirer comme s’en affranchir. Le public est également invité à venir sur place assister aux présentations des projets, à des démonstrations des outils numériques de la BnF et des « trouvailles » de Gallicanautes, à qui il sera largement rendu hommage à cette occasion. Et parce que hackathon ne rime pas forcément avec numérique, des réutilisations plus originales de Gallica, comme un concert à partir de partitions disponibles sur le site, seront également proposées. A distance, le public pourra suivre en direct via les réseaux sociaux l’évolution des réalisations des participants. Les résultats de cette grande émulation collective resteront par ailleurs consultables en ligne après la clôture de l’opération.

Jeux de données, API et formats

Conditions d'utilisation

L'ensemble des métadonnées descriptives est disponible sous [Licence Ouverte] (https://www.etalab.gouv.fr/licence-ouverte-open-licence). Les images de Gallica sont utilisables pour un usage non commercial (voir les [conditions complètes d'utilisation] (http://gallica.bnf.fr/html/und/conditions-dutilisation-des-contenus-de-gallica) de Gallica).

La bibliothèque numérique Gallica

[Gallica] (http://gallica.bnf.fr/), bibliothèque numérique de la BnF, donne accès à près de 3 millions de documents de toutes natures (livres, presse, manuscrits, images, objets, partitions, documents sonores, etc.). Tous sont accessibles en mode image et certains le sont également en mode texte, avec une qualité d'OCR variable. Un ensemble d'API exploitant le protocole IIIF permet de récupérer les images en haute définition. Les métadonnées descriptives de l'ensemble de ces documents sont disponibles au format Dublin Core via les protocoles OAI-PMH et SRU.

Documentation des API

Documentation des formats de données

data.bnf.fr

[data.bnf.fr] (http://data.bnf.fr/) est une plate-forme rassemblant l'ensemble des données issues de différentes bases et catalogues de la BnF pour y donner un accès fédéré par auteur et par œuvre. Un module de recherche permet de faire des requêtes manuelles et un SPARQL Endpoint permet de construire des requêtes complexes. L'ensemble des données est récupérables au format RDF (XML, NT, N3) et JSON ou JSON-LD. Un DUMP complet des données est récupérable par FTP ou HTTP.

Documentation des API

Documentation des formats de données

Le catalogue général

Plus important catalogue de la BnF, le [catalogue général] (http://catalogue.bnf.fr/) regroupe 14 millions de notices bibliographiques (livres et périodiques imprimés, images fixes et animées, collections sonores, cartes et plans, manuscrits musicaux, etc.) et près de 5 millions de notices d'auteurs (noms de personnes, collectivités), de titres d’œuvres, de sujets, de lieux géographiques, au format MARC. Les notices sont récupérables selon divers formats et protocoles :

  • en Dublin Core via un entrepôt OAI (notices descriptives seulement, à l'exclusion des notices d'entités).
  • au format MARC via un serveur Z 39.50.
  • les images de couverture des ouvrages peuvent être récupérées via un protocole spécifique

Documentation des API

Documentation des formats de données

Identifiants

Pour identifier les objets de manière pérenne (documents numériques, notices descriptives et notices d'entités), la BnF utilise le système d'identifiants ARK. Par ailleurs, des identifiants normalisés internationaux permettent d'identifier de manière univoque certains documents ou entités : l’ISSN pour les publication en série (notamment presse, revues), l’ISNI pour les personnes et les organismes.