You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Deux retours à la ligne d'affilé (changement de paragraphe) ne sont pas considérés comme un changement de phrase dans nlp.add_pipe("eds.sentences")
#241
Open
JudithCo opened this issue
Dec 22, 2023
· 1 comment
Lors de l'utilisation de nlp.add_pipe("eds.sentences"), deux retours à la ligne d'affilés (ou séparés par un espace) ne sont pas considérés comme un changement de phrase, certains changements de paragraphes ne sont donc pas considérés comme des changements de phrase. C'est notamment le cas quand le deuxième paragraphe commence par une date (et non par une lettre majuscule) et que les points ne sont pas utilisés.
Hello @JudithCo, est-ce que tu rencontres souvent des débuts de phrase en minuscule ?
En reprenant ton exemple, les dates qui commencent par "le" en minuscule sont délicates à gérer car si c'est un simple retour à la ligne => pas de nouvelle phrase, si c'est deux retours à la ligne => c'est ambigü.
Description
Lors de l'utilisation de
nlp.add_pipe("eds.sentences")
, deux retours à la ligne d'affilés (ou séparés par un espace) ne sont pas considérés comme un changement de phrase, certains changements de paragraphes ne sont donc pas considérés comme des changements de phrase. C'est notamment le cas quand le deuxième paragraphe commence par une date (et non par une lettre majuscule) et que les points ne sont pas utilisés.How to reproduce the bug
Your Environment
The text was updated successfully, but these errors were encountered: