language model一些问题 #11

hmwang97414 · 2022-03-05T08:23:08Z

你好，看了之前的issue，您说一个训练集是1k原始数据，另一个训练集是1k*n+augment混合的结果
我有一个疑问，就是在gengrate.py中，指定了每次生成的num_sentence ，那么如何确定augment的数据与原始数据的比例呢，比如原始训练集是1k,需要augment多少数据进行混合，才算比较合理呢

Bosheng2020 · 2022-07-12T07:35:20Z

您好谢谢您的问题。在我们的paper里面有提到oversample ratio的讨论您可以参考一下。也可以根据自己的实际情况跑跑实验。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

language model一些问题 #11

language model一些问题 #11

hmwang97414 commented Mar 5, 2022

Bosheng2020 commented Jul 12, 2022

language model一些问题 #11

language model一些问题 #11

Comments

hmwang97414 commented Mar 5, 2022

Bosheng2020 commented Jul 12, 2022