Skip to content

Releases: hiroi-sora/PaddleOCR-json

PaddleOCR-json v1.4.1

28 Aug 09:31
Compare
Choose a tag to compare

v1.4.1 主要更新内容

  • 推理后端 Paddle Inference 由于 3.0.0 的不稳定性,沿用 2.3.2 旧版推理库。
  • 修复:语言库 繁体中文 配置文件不正确的问题。
  • Linux 发行版
    • glibc 依赖库向下调整至 2.31 版本,兼容 debian-11、ubuntu-20.04 及以上的发行版。

发布包说明

所有发布包默认已附带 简中,繁中,英,日,韩,俄 多国语言识别库。如有需要,您可参考 README 删除不需要的库来节省空间。

Windows

  • PaddleOCR-json_v1.4.1_windows_x64.7z (88.4MB)
  • SHA256: c0912a70acb1f8f18fafe1f438a2935292a6ec7e2859156fa48a33e91358d71d

支持:Windows 7 及以上的系统。

Linux

  • PaddleOCR-json_v1.4.1_debian_x64_glibc2.31.tar.xy (118.4MB)
  • SHA256: 92a8e5bfe668e1ddec161cd3525c90756cc4c7c608e451a7a2872eb9066d456b

已通过测试的系统:Debian 11/12, Ubuntu 20.04/22.04, Kali 2023.3 。若您运行时提示缺少库文件,请根据报错内容,安装对应的系统组件。

此发布包不一定兼容所有 Linux 系统。可参考 Linux 构建指南Docker 部署指南 ,从源码构建本项目。

OpenCV 预构建依赖库(不是项目本体!!)

  • opencv_410_debian_x64_glibc2.31.zip (21.5MB)
  • SHA256: ce7f0aa00420a15d2c2b027dffa53466d6d7772404c243cc8b30aecc5b4630ba

适合 PaddleOCR-json 项目的轻量化 OpenCV 依赖库。供开发者从源码构建 PaddleOCR-json 时使用。

PaddleOCR-json v1.4.1 dev

30 Jul 17:57
Compare
Choose a tag to compare
Pre-release

此 Release 为开发中的测试版。您也可以选择 稳定版

CPU兼容性注意!

由于 Paddle Inference 新版推理后端的一些问题(#10346),
新版程序+新版模型库(V4),在 非AVX512 处理器上的运行速度较慢。

支持 AVX512 指令集的处理器:
Intel: 酷睿10代及之后的 i5、i7、i9 ,至强
AMD: 锐龙7代及之后的 R5、R7、R9
Windows 可通过 cpu-z 查看CPU指令集,Linux可通过 lscpu | grep avx 查看。

如果您的CPU不支持AVX512,或者使用 PaddleOCR-json v1.4.1 dev 时发现速度明显下降,可行的解决方案:

  • 新版程序+旧版模型库(V3)。下载 models_1.3 ,替换到 PaddleOCR-json v1.4.1 的 models 目录。
  • 暂时使用 稳定版程序

v1.4.1 dev 目前更新

  • 更新推理后端至 Paddle Inference 3.0.0 beta-1
  • 大幅优化内存占用:峰值由 2.5GB 降至约 1.5GB 。
  • 增加命令行参数:内存自动清理界限 --cpu_mem 。见 文档
  • 小幅优化初始化耗时。
  • 支持 PP-OCR V4 系列模型库,及PPOCR算法挑战赛 冠军方案模型库
  • 由于语言库cyrillic(斯拉夫字母/俄语)的准确度较低、使用频率较低,发行包中不再包含此语言库。有需要的用户可 自行下载
  • Python API: 修复了布尔类型启动参数设为 False 不生效的问题。
  • 测试版中,可能在 stderr 管道输出额外的调试信息(如内存占用等)。

发布包说明

发布包默认附带 简中,繁中,英,日,韩 语言库。如有需要,您可参考 README 删除不需要的库来节省空间。

PaddleOCR-json v1.4.0

22 Jul 03:44
Compare
Choose a tag to compare

v1.4.0 主要更新内容

  • 支持 Linux 平台。
  • 返回值新增:文字方向分类相关参数。 👉 返回值说明
  • 出于安全考虑,默认弃用 剪贴板读取 功能。(如有需要,可参考项目构建指南启用该功能)

发布包说明

所有发布包默认已附带 简中,繁中,英,日,韩,俄 多国语言识别库。如有需要,您可参考 README 删除不需要的库来节省空间。

Windows

  • PaddleOCR-json_v1.4.0_windows_x86-64.7z (98.4MB)
  • SHA256: 25f31dacc982a7b72912f5d1f362e2b73ecb3b851eb0bed880dd85ca512df3ca

支持:Windows 7 及以上的系统。

Linux

  • PaddleOCR-json_v1.4.0_debian_gcc_x86-64.tar.xz (126.5MB)
  • SHA256: 9c1669dcdafb0a5bfefa593042a7bfcf714580156a2da5e2d6bb9b9c47dbf9c3

已通过测试的系统:Debian 12, Ubuntu 22.04, Kali 2023.3 。若您运行时提示缺少库文件,请根据报错内容,安装对应的系统组件。

此发布包不一定兼容所有 Linux 系统。可参考 Linux 构建指南Docker 部署指南 ,从源码构建本项目。

PaddleOCR-json v1.4.0 Beta 2

09 Jul 04:05
Compare
Choose a tag to compare
Pre-release

v1.4.0 主要更新内容

  • 支持 Linux 平台。
  • 出于安全考虑,默认弃用剪贴板读取功能。(如有需要,可参考项目构建指南启用该功能)

v1.4.0 beta.2 更新

此 Release 为测试版,欢迎提 Issue 报告问题。

发布包说明

所有发布包默认已附带 简中,繁中,英,日,韩,俄,德,法 多国语言识别库。如有需要,您可参考 README 删除不需要的库来节省空间。

Windows

  • PaddleOCR-json_v1.4.0.beta.2_windows_x86-64.7z (98.4MB)
  • SHA256: 25f31dacc982a7b72912f5d1f362e2b73ecb3b851eb0bed880dd85ca512df3ca

支持:Windows 7 及以上的系统。

Linux

  • PaddleOCR-json_v1.4.0.beta.2_debian_gcc_x86-64.tar.xz (126.5MB)
  • SHA256: 9c1669dcdafb0a5bfefa593042a7bfcf714580156a2da5e2d6bb9b9c47dbf9c3

已通过测试的系统:Debian 12, Ubuntu 22.04, Kali 2023.3 。若您运行时提示缺少库文件,请根据报错内容,安装对应的系统组件。

此发布包不一定兼容所有 Linux 系统。可参考 Linux 构建指南Docker 部署指南 ,从源码构建本项目。

OpenCV 预构建依赖库(不是项目本体!!)

  • opencv-release_debian_x86-64.zip (21.5MB)
  • SHA256: 363c82bbe32d04d9de748979557581d20258ebc8eb285251a6b898f7b0578568

适合 PaddleOCR-json 项目的轻量化 OpenCV 依赖库。供开发者从源码构建 PaddleOCR-json 时使用。

PaddleOCR-json v1.4.0 Beta

05 Jul 13:03
Compare
Choose a tag to compare
Pre-release

v1.4.0 主要更新内容

  • 支持 Linux 平台。
  • 出于安全考虑,默认弃用剪贴板读取功能。(如有需要,可参考项目构建指南启用该功能)

此 Release 为测试版,可能含有潜在的缺陷。Windows用户可以继续使用 v1.3.1 版本。

软件版本

所有发布包默认已附带 简中,繁中,英,日,韩,俄,德,法 多国语言识别库。如有需要,您可参考README删除不需要的库来节省空间。

Windows:

PaddleOCR-json_v1.4.0.beta_windows_x86-64.7z (96.2MB)
SHA256: bd176a3bdff3aa4f05cbd57e4a1c4444517065e1d3bfccf49d5ab98043c6291b

支持:Windows 7 及以上的系统。

Linux:

PaddleOCR-json_v1.4.0.beta_debian_gcc_x86-64.tar.xz (126.3MB)
SHA256: 062d654850f0c6e97baadc207f6cc7e0f766327768827c719c9027ffe355e0cb

已通过测试的系统:Debian 12, Ubuntu 22.04, Kali 2023.3 。若您运行时提示缺少库文件,请根据报错内容,安装对应的系统组件。

此发布包不一定兼容所有 Linux 系统。可参考 Linux 构建指南Docker 部署指南 ,从源码构建本项目。

PaddleOCR-json v1.3.1

10 Oct 13:20
Compare
Choose a tag to compare

下载 PaddleOCR-json.v1.3.1.7z
解压,点击 PaddleOCR-json.exe 测试程序,或参考 README 通过API调用。
默认已附带 简中,繁中,英,日,韩,俄,德,法 多国语言识别库。如有需要,您可参考README删除不需要的库来节省空间。

v1.3.1 主要更新内容:

  • 兼容 Win7 x64 。
  • (若 Win7 报错计算机中丢失 VCOMP140.DLL ,请安装 VC运行库

SHA256: 9ebc13cd2facc85f7986c9358e805a6d95c35d769a626a3c9fbb5a53d34d43b5

models v1.3

23 Jun 10:21
Compare
Choose a tag to compare
models v1.3 Pre-release
Pre-release

模型库文件

2024.7.5 更新:

  • 添加 全语言描述文件 configs.txt (Umi-OCR依赖)

2024.8.19 更新:

  • 修复有关繁体中文的配置文件错误
  • 移除无用的rec库

PaddleOCR-json v1.3.0

19 Jun 03:43
Compare
Choose a tag to compare

下载 PaddleOCR-json.v1.3.0.7z
解压,点击 PaddleOCR_json.exe 测试程序,或参考 README 通过API调用。
默认已附带 简中,繁中,英,日,韩,俄,德,法 多国语言识别库。如有需要,您可参考README删除不需要的库来节省空间。

v1.3.0 主要更新内容:

  • 新功能:Base64传图片。
  • 新功能:套接字服务器模式。
  • API和指令与v1.2旧版略有修改,老用户请参考README及 详细使用指南更新说明

PaddleOCR-json v1.3.0 Alpha

25 May 17:33
Compare
Choose a tag to compare
Pre-release

这是一个重构版本,重写了部分代码,并新增了以下功能:

  • 可通过Base64字符串传输图片。可实现完全意义上的内存传图,无需用本地文件或剪贴板来中转。
  • 添加新交互模式:套接字服务器模式,通过TCP接受客户端的指令。

指令基本兼容旧版,删除了一些不好用或意义不大的功能,如 use_debug 和参数热更新机制等。

由于源项目PPOCR并未更新,所以本项目v1.3与v1.2在OCR性能和准度上没有任何变化;旧版v1.2已经能满足需求的用户无需升级v1.3。

旧版用户如需升级,请再阅读一次README和详细使用指南等项目文档。

alpha 是先行测试版,可能含有未知的问题或不稳定的因素,欢迎提issue。

为方便测试,PaddleOCR-json_v.1.3.0_alpha.x.7z 已包含 简中,繁中,英,日,韩,俄,德,法 全部语言识别库。


alpha.2 更新:
修复了套接字模式在非本地环回下,服务端接收数据不完整的问题

PaddleOCR-json v1.2.1

28 Sep 04:35
Compare
Choose a tag to compare

下载 PaddleOCR-json.v1.2.1.7z
解压,点击 PaddleOCR_json.exe 测试程序,或参考 README 通过API调用。

v1.2.1主要更新内容:

  • 修复了一些BUG。
  • 解决非中文windows难以读取中文路径的问题,拥抱utf-8,彻底摆脱对gbk等区域性编码的依赖。
  • 新功能:直接读取并识别剪贴板内存中的图片。
  • 错误代码和提示更详细。
  • 更新了一些输出格式,如文本包围盒box的定义
  • 注意,API与v1.2.0不通用