Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

为什么复现不出论文中的效果 #35

Open
zengyangzang opened this issue Oct 23, 2023 · 4 comments
Open

为什么复现不出论文中的效果 #35

zengyangzang opened this issue Oct 23, 2023 · 4 comments

Comments

@zengyangzang
Copy link

直接使用Github中的代码,没有任何改动,epoch为240,batchsize为8,不使用数据增强,随机种子也没用修改。为什么在CROHME2014数据集的正确率为56.09%,比论文中的57%的正确率低了0.91%。如果想复现出论文中的效果,超参数应该如何设置

@Da1sypetals
Copy link

请问你使用什么GPU大概训练了多久到240epoch?

@gaoshaojie0708
Copy link

请问你使用什么GPU大概训练了多久到240epoch?
我看作者说V100训1天,但是我用A100已经训了三四天了

@zengyangzang
Copy link
Author

zengyangzang commented Apr 12, 2024

请问你使用什么GPU大概训练了多久到240epoch?
我看作者说V100训1天,但是我用A100已经训了三四天了

很奇怪,我用的学校的平台的A800,batchsize=8,CROHME训练集、
之前跑大概5分钟就有1epoch,差不多20个小时就可以跑完240轮。
最近不知道怎么回事,可能是学校超算有问题了,大约16分钟一个epoch,240轮需要两天多吧
我觉得你用A100跑三四天应该不太对

@zengyangzang
Copy link
Author

请问你使用什么GPU大概训练了多久到240epoch?

A800,两天左右

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants