TextCNN网络的实现,并且在MR数据集中实现训练与测试
论文地址为:
Convolutional Neural Networks for Sentence Classification
- Pytorch = 1.5.0
- GTX1080
- MR数据集下载地址:https://www.cs.cornell.edu/people/pabo/movie-review-data/
- Word2vec下载地址: https://drive.google.com/file/d/0B7XkCwpI5KDYNlNUTTlSS21pQmM/edit 下载后放入根目录下的models文件夹中
- 正则化方法:根据论文中的方法1)Dropout.2)L2正则
- 采样10折交叉验证,提升模型的准确率
- 可根据需要在utils中设置earlystopping
- 数据集划分: 10%的Test数据集,90%的train,val数据集
- 模型的详细参数均可以在config类中设置
1)融合到大规模预训练模型输出端,实现文本分类。
2)。。。