-
Notifications
You must be signed in to change notification settings - Fork 9
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Proposition d'organisation du fichier ZIP du profil NeTEx France #56
Comments
Questions encore non résoluesUnicité de l'id des Frames LIGNELa règle d'unicité n'est pas respectée par les Frames NETEX_LIGNE. Chaque fichier de ligne contient la "même" Frame L'idéal serait d'avoir des Frame ids uniques aussi. Par exemple: Où mettre ?
Autres
|
Cette proposition a servi de base pour organiser les fichiers NeTEx créés par conversion par transport.data.gouv.fr/. Donc les exemples sont nombreux. |
Je partage ici ce que fait la Norvège (poke @gonzalezsuitt & @TuThoThai qui seront intéressés): Petit extrait:
Cette structuration est d'ailleurs attendue par le validateur NeTEx norvégien disponible ici https://github.com/entur/netex-validator-java#netex-validator-java: Qui dit structuration commune, dit validation homogène plus facile etc etc.
Il est intéressant de voir que la Norvège a choisi d'intégrer ces règles pratiques directement dans son profil ! À discuter 😄 |
Ce que je trouve le plus intéressant dans cette discussion (merci @albanpeignier) est aussi la possiblité de se rapprocher de l'outil de validation développé par Entur. Sans parler de la "simplification" perçue par les producteurs de données |
Relance du sujetDe mon côté, je constate également le fait que le manque de structure explicite des exports est un frein à l'adoption de la mise en place du Netex. Il me semble primordial de spécifier et documenter cette partie Nouvelle spec Vs profil NordicJ'avoue que j'ai été pas mal séduit par l'idée de reprendre les spécifications du profil Nordic pour tous les avantages listés plus haut. J'avoue avoir une préférence pour la proposition initiale d' @albanpeignier (discuté avec lui le 07/06). Quelques remarques sur la proposition initiale :
Sur les points listés comme "encore non résolues"Unicité de l'id des Frames LIGNEL'objectif de pouvoir cibler une Frame avec un ID unique semble interessante, donc je suis d'accord avec l'idée de mettre un ID unique sur les Frame. Mais j'ai un doute sur la proposition. A creuser. Ou mettre ?
Autres
A dispo pour faire avancer le sujet ! |
Suite aux différentes discussions, j'ai modifié la proposition de la structure du fichier avec les changements qui paraissaient évidents :
|
Je viens rajouter qu'à la suite d'un webinaire dédié à l'accessibilité, la région Auvergne Rhône Alpes souhaite participer aux discussions pour bien structurer leurs fichiers NeTEx. |
Grain à moudre que je peux apporter: dans le cadre d'autres travaux (indexation des fichiers, dont NeTEx, dans notre moteur de recherche v2 sur transport.data.gouv.fr, jusqu'au niveau arrêts) et suite à etalab/transport-site#3757, j'ai été amené à télécharger et dézipper la totalité des fichiers NeTEx actuellement répertoriés. Je partagerai leur "layout physique" (noms des fichiers) ainsi que des bizarreries détectées (il existe des zips contenant des zips) qu'il faudra à mon avis interdire explicitement (même travail plus ou moins que ce que j'ai fait ici sur le GTFS google/transit#379), pour simplifier la vie des réutilisateurs. |
Je trouve le découpage par ligne intéressant car au moins on a l’ensemble des concepts associés a celle-ci, plus de problème d’elements isolés. Par contre, il sera tres compliqué d'avoir l'unicité d'objets par fichier... car il y en aura toujours en double dans certain fichier (course couplée, ...) Cependant, avec ce mode de modélisation : Remarques sur le contenu du fichier ligne : Concernant les arrêts, tout ce qui est accessibilité des quais sera mis ailleurs ? Où placer les données d’organisation (operateur, network, organisationunit, ….) car c’est des notions importantes pour une ligne par ex. Je vois aussi un type de données qui nous ait demandé souvent et pas enumérée ici, c’est le référentiel des équipements. (nous on fait souvent des SIV, et on a besoin de ca). Ca serait dans accessibilité? Attention aussi a la taille des fichiers generés, ca rebute souvent du monde de parser des fichiers de taille trop importante. ca necessite des ressource trop importante. (ok il existe des parseur type Sax), mais ce n'est pas ceux utilisés le plus souvent pas nos différents consommateurs. |
Il y a quelques éléments utilisés pour la description de l'accessibilité qui n'ont pas encore été repris ici. Voici quelques propositions : pour le fichier STOP.xml
pour le fichier POI.xml
pour le fichier ACCESSIBILITY.xml
pour le fichier RESOURCE.xml ?
|
Petite remarque sur le message de @fxpicavet
Pour le premier point, si un utilisateur n'est intéressé que par une seule ligne, oui il doit connaitre son ID ou tout parser. Il en va de même pour un utilisateur qui ne serait intéressé que par les lignes de Tram. C'est le même problème que pour un GTFS. Et pour les propositions d'ajouts de notions des 2 messages, je regarde asap 👍 |
Question transverse qui pointe de partout à la fois, c'est le traitement de la donnée d'accessibilité, effectivement. Re @TuThoThai
Et @nlehuby La question qui revient c'est: si j'utilise AccèslibreMobilités, qu'est-ce qui est produit en sortie, à quel point il faut le retravailler pour avoir une donnée qui pourra suivre les recommendations qu'on va faire ici, à quel point c'est redondant ou pas avec un fichier d'arrêts etc. |
Aujourd'hui, AccèsLibre Mobilités produit un unique fichier xml, contenant un GeneralFrame NETEX_ACCESSIBILITE avec tous les objets manipulés. Il y plusieurs types d'objets qui ne sont pas gérés dans la proposition actuelle (cf mon dernier message), mais à part ça je ne vois pas d'impossibilité technique, il s'agira principalement pour nous de répartir les objets dans plusieurs fichiers ( |
Autre information qui ne trouve pas de place dans les frames telles que définies actuellement. Nous travaillons sur une meilleure gestion des ServiceFacilitySets notamment en essayant d'optimiser les exports de courses avec des services à bord. Pour ce faire, il faut pouvoir définir les ServiceFacilitySets et les référencer dans les courses.
C'est normalement possible dans les TimetableFrames (quand elles sont utilisées). Il faudrait qu'une frame accepte (gentillement) dans le profil France ce type de resources, dans RESOURCE.xml ou ACCESSIBILITY.xml par exemple. |
Vous trouverez dans cette feuille de calcul partagée un extrait des fichiers présents dans les ressources NeTEx publiées sur le PAN. Le tableau contient les colonnes suivantes :
Extrait fait depuis les données présentes dans la nuit du 15 au 16 octobre 2024. |
Ticket clos en faveur de #121 |
Voici une proposition d'organisation d'un fichier ZIP regroupant les informations. Elle se base sur un atelier du GT7 sur le nommage des fichiers et la description des Frames existante dans le profil NeTEx France.
Règles de base
Quelques règles de base ont dirigé les réflexions autour de cette organisation:
Organisation par ligne
Entre un fichier unique et une organisation en plusieurs fichiers, l'axe qui semble fournir le découpage le plus utile pour l'utilisateur des fichiers est celui par ligne.
Pas de duplication de ressources NeTEx
L'objectif est définir une organisation qui interdit la duplication des données entre les fichiers XML contenu dans le même fichier ZIP.
Une ressource est identifiée par sa classe et son id(entifiant).
Éviter les sur-informations
De nombreuses informations pourraient être mises en oeuvre, notamment dans le nommage des fichiers. Les discussions au sein du GT7 ont privilégié l'utilisation uniquement des informations strictement nécessaires à la bonne organisation interne du fichier ZIP.
Données associées à une ligne
Entrée ZIP:
LINE-<id>.xml
La valeur de
<id>
doit être unique dans le fichier.References
Données associées aux arrêts
Entrée ZIP:
STOP.xml
References
Données associées aux points d'intérêt
Entrée ZIP:
POI.xml
References
Aucune :(
Données communes
Entrée ZIP:
RESOURCE.xml
References
Données associées à la tarification
Entrée ZIP:
FARE.xml
Travail en cours
Données associées à l'accessibilité
Entrée ZIP:
ACCESSIBILITY.xml
Travail en cours
Données associées aux parkings
Entrée ZIP:
PARKING.xml
Travail en cours
The text was updated successfully, but these errors were encountered: