检索增强生成RAG架构图
2025-12-04 00:21:43 0 举报
这张检索增强生成(RAG)架构图呈现了 “数据预处理 - 检索增强 - 大模型生成” 的完整流程:首先对原始数据进行拆分,得到多个文本块,再通过 Embedding 技术将文本块转换为向量并存入向量库,完成数据的向量化预处理;当用户提出问题后,问题先经 Prompt 提示词工程优化,再通过 Embedding 实现指令向量化,随后基于向量相似度从向量库中检索匹配的相关结果;最后将检索结果作为上下文提交给大模型,大模型结合该上下文生成精准回答并返回给用户。此架构通过 “检索外部知识 + 大模型生成” 的模式,既提升了回答的准确性,也增强了内容的时效性与相关性。
作者其他创作
大纲/内容
Embedding
返回结果
指令向量化
提出问题
大模型
Prompt提示词工程
结果 1结果 2……结果 N
数据
文本块 3
提交上下文
文本块 2
向量库
检索增强生成---RAG
文本块 1
用户
输出问题
拆分
检索
0 条评论
下一页