Skip to content
This repository was archived by the owner on May 13, 2024. It is now read-only.

Commit

Permalink
fix: update usecase (#83)
Browse files Browse the repository at this point in the history
  • Loading branch information
YoannNumericite authored Jul 12, 2022
1 parent b6ba632 commit dbd6b08
Showing 1 changed file with 10 additions and 8 deletions.
18 changes: 10 additions & 8 deletions _data/usecases/pseudonymisation.md
Original file line number Diff line number Diff line change
Expand Up @@ -26,15 +26,15 @@ Cela peut être effectué manuellement. Cependant, le processus est long et fast

**Pseudonymisation :** « La pseudonymisation consiste à remplacer les données directement identifiantes (nom, prénom, etc.) d’un jeu de données par des données indirectement identifiantes (alias, numéro dans un classement, etc.). [...] En pratique, il est toutefois bien souvent possible de retrouver l’identité de ceux-ci grâce à des données tierces. C’est pourquoi des données pseudonymisées demeurent des données personnelles. L’opération de pseudonymisation est réversible, contrairement à l’anonymisation. »

[Guide de la CNIL sur l’anonymisation des données](https://www.cnil.fr/fr/lanonymisation-des-donnees-un-traitement-cle-pour-lopen-data)
[Guide d’Etalab, “Pseudonymiser des documents grâce à l’IA”](https://guides.etalab.gouv.fr/pseudonymisation/pourquoi-comment/#qu-est-ce-que-la-pseudonymisation)

Le processus d’anonymisation est irréversible et présente moins de risques de retrouver l’identité des personnes. En revanche, il entraîne une perte d’informations qui peut être un obstacle à la réutilisation des données.

Pour déterminer si vous devez anonymiser ou pseudonymiser vos documents, vous devez donc prendre en compte le cadre légal, les enjeux techniques et les usages à venir des données.

Pour en savoir plus :

- Voir [le guide d’Etalab sur la pseudonymisation des données](https://guides.etalab.gouv.fr/pseudonymisation/pourquoi-comment/#quelle-difference-entre-anonymisation-et-pseudonymisation) qui présente un exemple concret de l’anonymisation ou de la pseudonymisation de la même base de données.
- Voir [le guide d’Etalab sur la pseudonymisation des données](https://guides.etalab.gouv.fr/pseudonymisation/pourquoi-comment/#quelles-donnees-personnelles-dois-je-retirer-de-mes-donnees) qui présente un exemple concret de l’anonymisation ou de la pseudonymisation de la même base de données.
- Le guide d’Etalab donne également des conseils à destination des équipes projet, techniques et juridiques pour déterminer quelles informations retirer des documents et comment.

## Quels outils ?
Expand All @@ -50,7 +50,7 @@ Il y a deux manières d’automatiser l’annotation des documents.
- **Par des règles de gestion :** ce sont des règles déterminées avec les équipes métier. Par exemple : “quand un mot au milieu d’une phrase commence par une majuscule, alors c’est un nom propre (et il faut l’anonymiser)”. Ces règles sont ensuite implémentées par les équipes techniques dans un programme informatique. Cependant, il est parfois difficile de lister de manière exhaustive toutes les règles (et les exceptions) d’annotation. Par exemple, une adresse peut comporter un nom propre qui ne doit pas être anonymisé.
- **Par des méthodes d’intelligence artificielle :** les méthodes d’intelligence artificielle, quand elles sont bien utilisées, permettent d’améliorer la performance des systèmes. Dans ce cas, on donne à un programme informatique des documents déjà annotés (ce qu’on appelle une “base de données d’entraînement”). A partir de ces documents et par un processus d’essai-erreur (sous la supervision de _data scientists_, des spécialistes de la donnée), le programme va déduire lui-même les règles d’annotation. Ces règles pourront ensuite être appliquées à de nouveaux documents.

Pour en savoir plus sur la différence entre moteurs de règles et intelligence artificielle : [L’IA dans la spère travail (1)](https://ressourcerie.fabrique.social.gouv.fr/articles/IA%20partie%201)
Pour en savoir plus sur la différence entre moteurs de règles et intelligence artificielle : [L’IA dans la sphère travail (1)](https://ressourcerie.fabrique.social.gouv.fr/articles/IA%20partie%201)

Guide sur les techniques de pseudonymisation (à destination de publics techniques) : [https://guides.etalab.gouv.fr/pseudonymisation/en-pratique/#formater-ses-donnees-annotees](https://guides.etalab.gouv.fr/pseudonymisation/en-pratique/#formater-ses-donnees-annotees)

Expand All @@ -74,7 +74,7 @@ Certains projets proposent également déjà des briques mutualisées et de la d

Le Lab IA d’Etalab a développé un modèle de pseudonymisation qui peut être adapté à plusieurs types de documents. Dans le cadre du travail effectué avec le Conseil d’Etat, il a par exemple été entraîné sur des documents du Conseil d’Etat pour que l’outil soit adapté possible à la pseudonymisation desdits documents.

**Le modèle a permis d’améliorer les performances de 20% par rapport à un moteur de règles standard. **
**Le modèle a permis d’améliorer les performances de 20% par rapport à un moteur de règles standard (\*\***[source](https://transformations-droit.com/webinaire-la-pseudonymisation-des-decisions-de-justice-travaux-du-lab-ia-avec)\***\*). **

[https://github.com/etalab-ia/pseudo_conseil_etat](https://github.com/etalab-ia/pseudo_conseil_etat)

Expand All @@ -86,13 +86,15 @@ La Cour de Cassation devait répondre à des problématiques similaires. Elle a

Documentation publique de la Cour de Cassation sur le sujet : [https://github.com/Cour-de-cassation/moteurNER](https://github.com/Cour-de-cassation/moteurNER)

### 3.Les outils de Pôle Emploi
### 3.Le guide du secret statistique de l’Insee

Une ressource utile sur l’anonymisation de données : [le guide du secret statistique de l’Insee](https://www.insee.fr/fr/information/1300624).

## Je veux lancer un projet d’anonymisation/de pseudonymisation : que faire ?
## Je veux lancer un projet d’anonymisation ou de pseudonymisation : que faire ?

- Rassemblez des acteurs pluridisciplinaires (expertise métier, chefferie de projet, technique, juridique)
- Explorez les ressources indiquées ci-dessus et contactez les équipes qui les ont créées.
- Si vous ne trouvez pas la réponse à votre question, contribuez dans le Q&A Ressourcerie !
- Explorez les ressources indiquées ci-dessus et contactez les équipes qui les ont créées
- Vous ne savez pas par où commencer ? Contactez-nous ([[email protected]](mailto:[email protected])) !

## J’ai mené un projet d’anonymisation/de pseudonymisation dans la sphère travail : que faire ?

Expand Down

0 comments on commit dbd6b08

Please sign in to comment.