Skip to content

datactivist/rdg-data-analyse

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Analyse des métadonnées présentes dans l'entrpôt de données RDG

Prérequis

  • Python 3.8 ou supérieur

Installation

Créer un environnement virtuel :

python -m venv venv

Activer l'environnement virtuel :

source venv/bin/activate # Linux
venv\Scripts\activate # Windows

Installer les dépendances avec pip :

pip install -r requirements.txt

Utilisation

Extract data

Extract the data from the RDG API.

python src/extract_rdg_corpus.py

Separate types

This script will separate the data into 3 files : one for each type (files, datasets, dataverse).

python src/filter_types.py

Analyse metadata

Le notebook notebooks/analyse_rdg_metadata.ipynb permet d'analyser les métadonnées des fichiers, jeux de données et dataverses.

Vous pouvez le lancez via VSCode (avec l'extension Jupyter) ou via Juptyer Notebook.

Données

Les données dans ce dépôt ont été extraite à date du 2024-10-02.

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •