Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请教关于预测的问题 #25

Open
yazheng0307 opened this issue Nov 21, 2022 · 12 comments
Open

请教关于预测的问题 #25

yazheng0307 opened this issue Nov 21, 2022 · 12 comments

Comments

@yazheng0307
Copy link

你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢?

输入图片:
00000495

程序结果:
92959e6c1ddf7e6c0be4ba116882d78

@SuperHHzy
Copy link

请问一下,你的印刷体公式数据集是使用的IM2LATEX-100K这个数据集吗?如果是使用印刷体公式的数据集来训练模型需要修改什么参数吗?谢谢

@yazheng0307
Copy link
Author

用的数据集是IM2LATEX-100K的子集,需要改config里面的字典长度,根据自己的数据集字典长度修改

请问一下,你的印刷体公式数据集是使用的IM2LATEX-100K这个数据集吗?如果是使用印刷体公式的数据集来训练模型需要修改什么参数吗?谢谢

用的数据集是IM2LATEX-100K的子集,需要改config里面的字典长度,根据自己的数据集字典长度修改

@SuperHHzy
Copy link

用的数据集是IM2LATEX-100K的子集,需要改config里面的字典长度,根据自己的数据集字典长度修改

请问一下,你的印刷体公式数据集是使用的IM2LATEX-100K这个数据集吗?如果是使用印刷体公式的数据集来训练模型需要修改什么参数吗?谢谢

用的数据集是IM2LATEX-100K的子集,需要改config里面的字典长度,根据自己的数据集字典长度修改

可以分享一下这个子集吗?

@SuperHHzy
Copy link

你好,我在用IM2LATEX-100K这个数据集进行训练的时候,我把字典换成了IM2LATEX-100K这个数据集对应的字典,为什么会报这个错误呢?你有出现这个错误吗?
image

@SuperHHzy
Copy link

你好,想请问你使用的IM2LATEX-100K的子集,是怎么生成PKL文件的呢?

@SuperHHzy
Copy link

你好,我子集制作了一个IM2LATEX-100K的子集,训练集大约有10000张图片,验证集大概2000张图片,我只修改了config里面的字典长度,训练了220个epoch之后,ExpRate只有21%左右,不知道这是什么原因呢?不知可否告知一下你的数据集大小呢?

@ZCappuccino
Copy link

您好,打扰了,我想使用印刷体数据集进行训练,但是当我把config中与数据集相关的配置文件转换成自己的以后,出现了图中所示的问题。请问您在训练运行的过程中出现了类似的问题吗?可以帮忙提一点建议吗?
屏幕截图_20221225_203552

@Yuxiang1995
Copy link

您好,打扰了,我想使用印刷体数据集进行训练,但是当我把config中与数据集相关的配置文件转换成自己的以后,出现了图中所示的问题。请问您在训练运行的过程中出现了类似的问题吗?可以帮忙提一点建议吗? 屏幕截图_20221225_203552

读图的时候读灰度图

@Yuxiang1995
Copy link

你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢?

输入图片: 00000495

程序结果: ![92959e6c1ddf7e6c0be4ba116882d78](https://user-images.githubusercontent.com/50820616/202946248-e668071a-ea14-4112-81f2-2d741c61b332.jpg

@yazheng0307 我拿数据集之外的图片来测效果也很差,似乎模型的泛化能力不好?请问你解决了吗

@SuperHHzy
Copy link

你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢?
输入图片: 00000495
程序结果: ![92959e6c1ddf7e6c0be4ba116882d78](https://user-images.githubusercontent.com/50820616/202946248-e668071a-ea14-4112-81f2-2d741c61b332.jpg

@yazheng0307 我拿数据集之外的图片来测效果也很差,似乎模型的泛化能力不好?请问你解决了吗

你使用的是自己预训练的模型吗?请问模型的准确率如何呢?

@limaopeng1
Copy link

你好,我想测试一下模型在印刷体公式识别上的效果,测试的ExpRate达到0.8,但是另外使用外来的图片预测的时候,结果总是一串相同的字符,这会是什么原因引起的呢?
输入图片: 00000495
程序结果: ![92959e6c1ddf7e6c0be4ba116882d78](https://user-images.githubusercontent.com/50820616/202946248-e668071a-ea14-4112-81f2-2d741c61b332.jpg

@yazheng0307 我拿数据集之外的图片来测效果也很差,似乎模型的泛化能力不好?请问你解决了吗

一样遇到这个问题,请问有人解决了吗

@SWHL
Copy link

SWHL commented Nov 6, 2023

我似乎也遇到这问题了,训练印刷体公式识别时,效果一直很差。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants