SERVICE VISU OAIRECORD

Service de données bibliographiques d'un document numérique

Contexte

J'ai un document numérique et je souhaite pouvoir récupérer certaines informations pour ensuite en déduire des actions possible (notamment l'utilisation d'autre services de l'API document)

Verbe OAIRecord : http://gallica.bnf.fr/services/OAIRecord

Ce service renvoie la notice OAI du document ainsi que d’autres informations techniques, telles que le type de document, ou si la recherche plein texte est disponible ou pas.

Un seul paramètre est obligatoire, il s’agit de l’ark de l’identifiant numérique du document.

Le service retourne donc :

400 s’il manque le paramètre ark
404 si la notice n’est pas trouvée (document non indexé).
Le flux XML contenant la notice au format dublin core, accompagnée de certains paramètres récupérés de l’index.

Exemple :

http://gallica.bnf.fr/services/OAIRecord?ark=ark:/12148/bpt6k5738219s

<?xml version="1.0" encoding="UTF-8" ?> 
<results countResults="1" resultType="LuceneOAIRecordSearch" searchTime="0:00:00.001">
  <notice>
    <record xmlns="http://www.openarchives.org/OAI/2.0/">
      <header>
        <identifier>oai:bnf.fr:gallica/ark:/12148/bpt6k5738219s</identifier> 
        <datestamp>2012-01-27</datestamp> 
        <setSpec>gallica:theme:8:84</setSpec> 
        <setSpec>gallica:typedoc:monographies</setSpec> 
      </header>
      <metadata>
        <oai_dc:dc xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/"  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
          <dc:identifier>http://gallica.bnf.fr/ark:/12148/bpt6k5738219s</dc:identifier> 
          <dc:title>La plage d'Etretat par l'auteur de "Monsieur X et Mme ***"</dc:title> 
          <dc:publisher>Michel Levy (Paris)</dc:publisher> 
          <dc:date>1868</dc:date> 
          <dc:format>In-18</dc:format> 
          <dc:language>fre</dc:language> 
          <dc:relation>Notice du catalogue : http://catalogue.bnf.fr/ark:/12148/cb33539190h</dc:relation> 
          <dc:type xml:lang="eng">text</dc:type> 
          <dc:type xml:lang="fre">monographie imprimée</dc:type> 
          <dc:type xml:lang="eng">printed monograph</dc:type> 
          <dc:format>application/pdf</dc:format> 
          <dc:source>Bibliothèque nationale de France, département Littérature et art, Y2-59413</dc:source> 
          <dc:rights xml:lang="fre">domaine public</dc:rights> 
          <dc:rights xml:lang="eng">public domain</dc:rights> 
        </oai_dc:dc>
      </metadata>
    </record>
  </notice>
  <mode_indexation>text</mode_indexation> 
  <nqamoyen>092.57</nqamoyen> 
  <provenance>bnf.fr</provenance> 
  <source>Bibliothèque nationale de France, département Littérature et art, Y2-59413</source> 
  <typedoc>monographies</typedoc> 
  <date>1868</date> 
  <title>La plage d'Etretat par l'auteur de "Monsieur X et Mme ***"</title> 
  <sdewey>84</sdewey> 
</results>

Ici par exemple dans le balise nqamoyen, on voit la valeur de 092.57, ce qui nous permet de pouvoir utiliser le service d' occurrence de recherche. En effet, si cette valeur est égale ou supérieure à 060.00, nous indexons le contenu des pages.

Difficulté

Parsing classique d'un flux xml, pas de difficulté, si ce n'est la connaissance du format dublin core

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

SERVICE VISU OAIRECORD

Service de données bibliographiques d'un document numérique

Contexte

Difficulté

Clone this wiki locally