瑞金糖尿病数据命名实体识别项目思维导图
2022-06-17 10:48:01 0 举报
AI智能生成
登录查看完整内容
瑞金糖尿病命名实体识别比赛项目实现思维导图
作者其他创作
大纲/内容
o
Test
Disease
Anatomy
Drug
Test_Value
Symptom
Reason
Level
Amount
Treatment
Duration
Method
SideEff
Operation
Frequency
通过ann文件,得到实体标签
排序、去重
拆分长句子
拆分短句子
匹配 标签符号、前后文本
匹配关键词、连接词,进行分割
匹配序号
切分数据文本
数据处理
写入新标签,B I 实体类别
文本读取,获取标注文件中的标签(label)
获取词边界特征(bound)
提取词性(flag)
获取拼音特征(pinyin)
获取偏旁部首特征(radical)
读取文本数据,生成BIO文件
生成标注信息的三元组
映射字典
数据集划分
词向量Word2vec
Seq2Seq模型搭建
Bi-LSTM+CRF 序列标注
瑞金糖尿病数据
0 条评论
回复 删除
下一页