AI技术 | RAG
2025-03-05 21:12:40 64 举报
AI智能生成
AI技术 | RAG 检索增强生成
作者其他创作
大纲/内容
基础知识
目的:提供更多的上下文,让LLM更容易召回和问题相关的信息,从而提供准确性
定义:一种模式/解决方案
个人思考
向量化(Embedding)究竟是啥?文字编成向量是啥意思,怎么做的?
为什么query从文本编码成的向量之后,用余弦相似度就能找到相关的知识?这合理吗?
除了 embedding 之外,还有别的召回相关信息的方法么?关键词召回
为什么RAG是有效的?能提高LLM回答的准确率?这是魔法么? RAG技术会改变LLM预测下一个词时的概率分布
【扩展】COT 为什么有效?
经典的RAG应用的架构图
核心范式:检索器+生成器
文档解析&切片
embedding 技术
small to big 检索策略
ReRank 排序策略
评估指标:答案的准确性、答案的相关性和上下文的相关性。
如何提升检索效果?
查询改写
查询拆分
查询路由
结合查询历史
FQA快速干预用户问答
结果过滤
结果重排
参考文档
DeepSeek大模型应用探讨与RAG技术全景
0 条评论
下一页