浙江大学《人工智能与系统》课程作业,作家风格识别
项目来源于:https://mo.zju.edu.cn/workspace/5f8ed41148689dc2e7441a23?type=app&tab=2(似乎只有我登录了自己的号才能看到。。。)
具体数据处理过程说明可查看 torch_main.ipynb
。
直接运行 svm_train.py
即可开始拟合。
之后运行 nn_predict.py
对预设的文字进行预测,输出结果。
通过 model_test.py
测试结果为 50 个中正确 45 个。
直接运行 nn_train.py
即可开始训练。
训练过程输出:
epoch:0 | valid_acc:0.2632
epoch:1 | valid_acc:0.4286
epoch:2 | valid_acc:0.6184
epoch:3 | valid_acc:0.8120
epoch:4 | valid_acc:0.8816
epoch:5 | valid_acc:0.9023
epoch:6 | valid_acc:0.8929
epoch:7 | valid_acc:0.9117
epoch:8 | valid_acc:0.9154
epoch:9 | valid_acc:0.9098
epoch:10 | valid_acc:0.8966
epoch:11 | valid_acc:0.9117
epoch:12 | valid_acc:0.9023
epoch:13 | valid_acc:0.9117
epoch:14 | valid_acc:0.9023
epoch:15 | valid_acc:0.9229
epoch:16 | valid_acc:0.8910
epoch:17 | valid_acc:0.9211
epoch:18 | valid_acc:0.9060
epoch:19 | valid_acc:0.9229
best accuracy:0.9436
之后运行 nn_predict.py
对预设的文字进行预测,输出结果:
LX
通过 model_test.py
测试结果为 50 个中正确 46 个。
先安装 transformers 库:
pip install transformers
然后运行 bert_train.py
。
部分输出如下:
step: 0 loss: 0.012350269593298435
step: 50 loss: 0.12088379263877869
...
step: 450 loss: 0.0010281536960974336
eval step: 0 loss: 0.002066229470074177
eval step: 1 loss: 0.0006851256475783885
eval step: 2 loss: 0.0010056671453639865
...
eval step: 51 loss: 0.03821168094873428
eval step: 52 loss: 0.0007723120506852865
Saved model
Train loss : 0.056686907584876996
Validation loss: 0.11087377357652481
Accuracy: 0.9716981132075472
通过 model_test.py
测试结果为 50 个正确 48 个,就是推理慢了点。
(因 bert 训练后的模型文件过大,未上传模型文件)