TN流程
2019-10-21 12:07:34 6 举报
aabbcc
作者其他创作
大纲/内容
标注人员判断TN行是否正确(分成两个文件,一个正确的文件,一个错误的文件)
爬取数据
训练集用于判断修改后的tn是否提升了错误率
将错误文件中的TN错误进行归纳后,对不可容忍的错误进行修复
修复后原句和正确的TN句子
正确文件
N
具体如:1、将数据TN,原文一行,TN后文本一行。2、每行文本前都需加上序号等,具体格式可通过询问jerry知道导入的格式)
错误文件
判断错误是否修复完毕
Y
将数据处理成标注平台可以输入的文件格式
放入训练集
原句和依然错误的TN句子
开始
0 条评论
下一页