Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

🚀 功能建议:希望增加批量选择图片OCR功能 #615

Open
4 of 5 tasks
CanaanLv opened this issue Jul 18, 2024 · 4 comments
Open
4 of 5 tasks

🚀 功能建议:希望增加批量选择图片OCR功能 #615

CanaanLv opened this issue Jul 18, 2024 · 4 comments
Labels
enhancement New feature or request good first issue Good for newcomers

Comments

@CanaanLv
Copy link

请先确认以下事项

  • 已仔细阅读了 README
  • issues 页面搜索过(包括已关闭的 issue),未发现类似功能建议
  • Easydict 已升级到 最新版本
  • 我理解并认可上述内容,并理解项目维护者精力有限,不遵循规则的 issue 可能会被无视或直接关闭

功能描述

能够批量选择图片进行ocr,然后将输出到同一个文本中,如果可以的话选择是否调用翻译。目前#52 有合入,但是缺少批处理入口

使用场景

很多视频是内嵌字幕的,用程序生成大量字幕截图,希望调用ocr识别后翻译。

实现方案(可选)

个人理解调用原有的本机离线ocr功能即可,这个issue中有实现,只不过没有批处理入口,#52,准确度还可以,只是包装一个批处理程序。

个人浅薄见解

是否愿意提交 PR 实现该功能

  • 我愿意提交 PR
@CanaanLv CanaanLv added the enhancement New feature or request label Jul 18, 2024
Copy link

Hello CanaanLv, Thank you for your first issue contribution 🎉

@tisfeng
Copy link
Owner

tisfeng commented Jul 18, 2024

能够批量选择图片进行ocr,然后将输出到同一个文本中

听起来不错,OCR 功能是现成的,但具体怎么集成到 Easydict,如何实现你说的这个需求,还需要构思一下。

请问类似应用有这样的功能吗,或许可以参考一下 😶

@tisfeng tisfeng added the good first issue Good for newcomers label Jul 18, 2024
@CanaanLv
Copy link
Author

CanaanLv commented Jul 18, 2024

感谢答复,目前搜索了一番发现只有Bob有类似的,入口就在OCR下面加入一个选择文件的入口:

Screenshot 2024-07-18 at 17 24 41

选择文件后会弹出扫描结果的窗口,bob有一个预览,然后所有的识别结果在右侧展示,可以直接拷贝或者翻译

Screenshot 2024-07-18 at 17 30 30

如果与兴趣参考bob的设计,我有一些建议:

  1. 左侧预览:我觉得单一预览就好,批量ocr的需求一般直接去处理输出的文本结果了,不太关心预览,感觉bob框选识别内容没必要。 不过如果这功能系统接口自带的那就是怎么简单怎么来。
  2. 右侧识别结果:想到的场景就是拷贝、输出txt(两个按钮功能应该就能解决)、翻译(不知道调用现有的翻译窗口方不方便?)。bob有一个文本处理,不过ocr一般不会100%准确,从需求上看用户一般会用其他强大的文字处理工具拷贝处理,所以觉得没必要。

所以我觉得应该就增加一个view界面,然后翻译功能嵌套一下之前翻译的view就行,入口在菜单栏,逻辑部分可以直接调用现有的ocr功能(只不过要写一个批处理脚本)

一些建议,可以参考一下☺️

@tisfeng
Copy link
Owner

tisfeng commented Jul 19, 2024

ok,大概了解了,这个看起来还有有点复杂的。。。

我正在忙着实现 Easydict 本地服务器功能 #580 ,稍后可以考虑开放一个 ocr 接口,让用户自己做一些自定义操作,比如你这个批量图片 OCR。

@CanaanLv 你会写 Swift 吗,对于当前这个功能,是否可以尝试来 PR ?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request good first issue Good for newcomers
Projects
None yet
Development

No branches or pull requests

2 participants