Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Structure des fichiers - Règles de base #112

Open
TuThoThai opened this issue Oct 31, 2024 · 8 comments
Open

Structure des fichiers - Règles de base #112

TuThoThai opened this issue Oct 31, 2024 · 8 comments
Assignees
Labels
documentation Improvements or additions to documentation résolu résolu, en attente de clôture et/ou PR Structure fichiers Pour toute discussion sur la structuration des jeux de données validé en GT7 validé en plénière du GT7
Milestone

Comments

@TuThoThai
Copy link
Collaborator

Règles de base

Organisation par ligne

Entre un fichier unique et une organisation en plusieurs fichiers, l'axe qui semble fournir le découpage le plus utile pour l'utilisateur des fichiers est celui par ligne.

Pas de duplication de ressources NeTEx

L'objectif est définir une organisation qui interdit la duplication des données entre les fichiers XML contenu dans le même fichier ZIP.

Une ressource est identifiée par sa classe et son id(entifiant).

Éviter les sur-informations

De nombreuses informations pourraient être mises en oeuvre, notamment dans le nommage des fichiers. Les discussions au sein du GT7 ont privilégié l'utilisation uniquement des informations strictement nécessaires à la bonne organisation interne du fichier ZIP.

@TuThoThai TuThoThai added the NeTEx Pour toute discussion sur le profil France dans son intégralité label Oct 31, 2024
@TuThoThai TuThoThai added Structure fichiers Pour toute discussion sur la structuration des jeux de données and removed NeTEx Pour toute discussion sur le profil France dans son intégralité labels Oct 31, 2024
@prhod
Copy link
Collaborator

prhod commented Oct 31, 2024

Je vote pour

1 similar comment
@albanpeignier
Copy link
Collaborator

Je vote pour

@ptitfred
Copy link
Contributor

Pardonnez mon ignorance, mais j'ai une question :

Comment éviter de la duplication en découpant par ligne pour les arrêts en correspondance ?

@prhod
Copy link
Collaborator

prhod commented Oct 31, 2024

L'idée est de séparer la liste des arrêts dans un fichier à part (fichier ARRET.xml par exemple), et de référencer les arrêts dans les objets qui en ont besoin, par exemple dans une course on référence un ScheduledStopPointRef.

@prhod
Copy link
Collaborator

prhod commented Oct 31, 2024

Précision évoquée en atelier GT7 :

  • Le découpage par ligne s'entend au sens de l'export des lignes de transports en commun afin de limiter la taille de chaque fichier. Bien évidement, si un export thématique ou un use case n'exporte pas de ligne de transport en commun, cette règle ne s'applique pas.
  • L'interdiction de déduppliquer les données inquiète un peu. il est proposé en séance d'essayer de le contraindre et de voir si des problèmes sont rencontrés (il peut y avoir le même objet à des versions différentes).
  • Sur le dernier point, il y a consensus sur le fait que le nom ne doit pas contenir de sémantique particulière (à base d'identifiants spécifique), uniquement le fait que chaque fichier doit avoir un nom unique

@TuThoThai
Copy link
Collaborator Author

TuThoThai commented Nov 11, 2024

Relevé de décision de la réunion du 31 octobre 2024 :

Organisation par ligne

  • La proposition visant à présenter l’offre de transport sous la forme d’une seule archive sans sous archive est adoptée
  • La proposition visant pour les offres de transport à présenter un fichier par ligne est adoptée

Duplication des donnée

Les échanges ont conduit à la position commune suivante

  • pas de duplication des données “classe - identifiant - version” ce qui signifie que deux version différentes d’un même objet peuvent coexister
  • cette solution pourra évoluer en fonction des contraintes rencontrées lors de sa mise en oeuvre

Éviter les sur-informations

  • l’objectif de ce point est d’éviter l’introduction de données externes impliquant des dépendances à des sources externes de donnée (ex Code SIREN pour une AOM) ou non utiles pour la définition de l’offre objet de l’archive

@TuThoThai
Copy link
Collaborator Author

Relevé de décision de la réunion du 31 octobre 2024 :

Organisation par ligne

* La proposition visant à présenter l’offre de transport sous la forme d’une seule archive sans sous archive est adoptée

* La proposition visant pour les offres de transport à présenter un fichier par ligne est adoptée

Duplication des donnée

Les échanges ont conduit à la position commune suivante

* pas de duplication des données “classe - identifiant - version” ce qui signifie que deux version différentes d’un même objet peuvent coexister

* cette solution pourra évoluer en fonction des contraintes rencontrées lors de sa mise en oeuvre

Éviter les sur-informations

* l’objectif de ce point est d’éviter l’introduction de données externes impliquant des dépendances à des sources externes de donnée (ex Code SIREN pour une AOM) ou non utiles pour la définition de l’offre objet de l’archive

Lors de la réunion du 14 novembre 2024 : pas d'objection ➡️ à faire confirmer en plénière du GT7 du 21 novembre 2024

@TuThoThai TuThoThai self-assigned this Nov 14, 2024
@TuThoThai TuThoThai added résolu résolu, en attente de clôture et/ou PR en attente validation GT7 validé en sous-groupe, à reporter en plénière GT7 labels Nov 14, 2024
@TuThoThai TuThoThai added documentation Improvements or additions to documentation validé en GT7 validé en plénière du GT7 and removed en attente validation GT7 validé en sous-groupe, à reporter en plénière GT7 labels Nov 22, 2024
@TuThoThai
Copy link
Collaborator Author

validé en plénière en date du 21 novembre 2024
documentation à préparer

@TuThoThai TuThoThai added this to the v2.4 milestone Nov 26, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
documentation Improvements or additions to documentation résolu résolu, en attente de clôture et/ou PR Structure fichiers Pour toute discussion sur la structuration des jeux de données validé en GT7 validé en plénière du GT7
Projects
None yet
Development

No branches or pull requests

4 participants