为啥不支持多语言同时识别? #14347
Replies: 2 comments 4 replies
-
PaddleOCR 当前不支持同时指定多种语言进行识别,这是因为每次初始化模型时,系统会加载特定语言的预训练模型,而这些模型是为单一语言或语言组(如中文和英文)优化的,无法同时支持多语言的混合识别。 原因分析
现状根据文档,PaddleOCR 支持 80 多种语言,但目前的实现方式是通过 ocr = PaddleOCR(use_angle_cls=True, lang='ch') # 中文
ocr = PaddleOCR(use_angle_cls=True, lang='japan') # 日文 但无法直接实现类似以下功能: ocr = PaddleOCR(use_angle_cls=True, lang='ch+japan') # 不支持多语言同时指定 解决办法
建议PaddleOCR 未来可以考虑引入多语言联合识别功能,例如:
这种功能目前可能需要社区贡献或官方的后续开发支持。如果您有相关需求,也可以参与相关开发。 Response generated by 🤖 feifei-bot | chatgpt-4o-latest |
Beta Was this translation helpful? Give feedback.
-
每次初始化模型时,只能指定一种语言
当文档多语种、语种未知时,就麻烦了,要一个个试试?
建议增加一次指定多语种的功能,像 tesseract 一样
Beta Was this translation helpful? Give feedback.
All reactions