大佬好，我用两张3090去使用你所提供的那个100w的数据集训练，可是很快loss稳定在3.0就不降低了 #101

iniroc · 2022-11-26T02:08:20Z

可是很快loss稳定在3.0就不降低了，大概也就十几个epoch吧，请问最好的效果是这样吗
或者说还有没有什么训练方法可以让模型得到更好的效果呢

iniroc · 2022-11-26T02:08:58Z

batch_size设置的128

cxhermagic · 2022-12-06T09:28:16Z

我也有同样的问题，怎么解决阿？

cxhermagic · 2022-12-06T09:28:28Z

batch设置的是64

cxhermagic · 2022-12-06T09:30:33Z

我的都已经过了好31个epoch了，从27个epoch开始就在3左右徘徊，是不是遇到了局部最优？

Jehuty-ML · 2023-03-10T06:28:02Z

同3090我在13个epoch就开始在3降不下去了，可能数据质量不好。

Whylickspittle · 2023-06-15T06:21:47Z

请问你们loss到3左右降低不下去了的时候，batch_acc大概多少呢我只有3060训练，我减少了语料 batch_size为32 训练了40的Epoch batch_acc只有0.3左右

Mylszd · 2023-11-07T14:02:31Z

请问数据集可以再分享一下吗，链接失效了，谢谢

1dengguosong · 2024-03-26T13:02:02Z

大佬们谁发一下数据集链接作者的不可用了

Provide feedback