地址识别规范化流程
2022-05-16 16:14:47 0 举报
地址识别规范化流程
作者其他创作
大纲/内容
NER识别
合并NER识别和模糊匹配识别出来的规范化地址
计算去重拼接处理后且属于NER的地址与规范化地址的音形码相似度
是
数据采集
地址识别及规范化流程
去重的时候优先保留匹配识别出来的结果
候选地址实体
构建DFA模型
地址识别
构建id2location_dict、location2id_dict、location2ssc_dict
基于DFA模型的音形码模糊匹配
构建all_location_dict
输入文本
选择相似度最高的作为最终规范化地址
否
地址纠错及规范化
匹配识别
直接输出结果
输出规范化结果及原始地址及位置索引
数据采集及处理
根据候选实体的位置索引进行去重及拼接
识别出的原始地址与规范化地址是否相同
0 条评论
回复 删除
下一页