基于自我反馈的高质量问答对构建
2025-11-11 14:38:16 0 举报
本发明具有以下特点: 1.大模型辅助识别:利用大模型的强大语义理解能力,自动识别文档中的敏感信息。 2.用户反馈机制:用户可以对识别结果进行反馈,系统根据反馈优化识别模型,提高准确性。 3.问答对构建:系统生成关于识别到的密点的问答对,帮助用户理解识别结果。 4.动态优化:采用基于强化学习GRPO(Group Relative Policy Optimization)的优化策略动态的学习用户的真实反馈
作者其他创作
大纲/内容
条件
span style=\
是
否
0 条评论
下一页