## 实验要求 1. 对 Seq2Seq 网络进行训练,结合Seq2Seq框架及内部使用单元思考,Seq2Seq框架在编码-解码过程中是否存在信息丢失,具体表现在哪些方面(15%) 2. 提出三句日常使用句子,使模型进行翻译并且出现翻译错误,对其进行分析(25%) 3. 使用 [BLEU](https://en.wikipedia.org/wiki/BLEU) 作为评价方法,对验证集的翻译结果进行评价,另外修改基于 GRU 的 Seq2Seq 模型为基于双向 GRU 的 Seq2Seq,对比实验结果及具体测试样例并给出分析(30%) 4. 对 Seq2Seq 的模型梯度进行限制,并给出不同梯度裁剪方式和梯度裁剪超参数的对比实验,分析不同梯度裁剪方式对模型训练的影响(不同梯度裁剪方式如梯度范数的约束,分析梯度超参数的影响包括裁剪的阈值是多少,为什么选择这个阈值,可以选择从别人的博客,实验中的梯度分析或者多个消融实验去了解)(30%) **注:以上实验要求中的分析部分需要在报告中详细说明,包括实验结果、分析和结论,包括但不限于训练验证损失曲线,翻译效果,bad case 分析等,如果认为是重要的内容,可以适当加粗和标红** ## 得分细节 1. 提交的报告文件 pdf 格式,包含实验结果、分析和结论(80%) 2. 提交的代码文件,包含模型训练代码和模型预测代码(20%)