RAG检索增强生成整体架构
2025-09-14 16:17:03 0 举报
RAG检索增强生成整体架构
作者其他创作
大纲/内容
解析、分割
top-k 文档1/top-k 文档2
原始文档
存入向量数据库
prompt
top-k 文档2
数据预处理
向量
Cross-Encoder模型
嵌入模型
上下文构建
重排序(Re-Ranking)
top-k 文档1
GPT、LLaMA
从知识库召回
检索
Embedding模型
用更精细的模型重新计算相似度
通过向量数据库相似度匹配
用户输入文本
chunk文本
向量数据库
生成式模型
大语言模型中的RAG(检索增强生成)架构
BERTSentence-BERT
上下文
+
知识库
文本→向量
符合查询意图引用可靠来源
文本、PDF、网页等
0 条评论
下一页