Rag
2025-08-04 18:55:49 2 举报
AI智能生成
rag
作者其他创作
大纲/内容
LangChain
Runnable协议
LCEL表达式语言
. RAG框架常见结构
Query
-basedRAG
-basedRAG
经典RAG:Query → 检索 → 拼接Prompt → LLM生成
Latent Representation-based RAG
Latent空间检索:Query编码为向量→语义匹配(多跳/dense)
Logit-based RAG
Token级匹配:基于LLM输出logit分布选择文档
Speculative RAG
小模型辅助:预生成中间答案加速主模型推理
RAG系统问题与优化方向
问题
文档处理:格式、准确性、分块(Chunking)策略
检索优化:Embedding模型选择、Query标准化、噪声过滤
生成优化:Prompt排序、后处理(离谱输出)、结果冗余
优化方向
输入优化
数据增强、Query改写/拆分
技术:Self-Querying Retriever、Multi-Query、StepBack Prompting、历史记忆
检索优化
检索器微调:领域数据训练
检索策略:Sentence Window、Parent-Child、混合检索
重排序(Re-ranking):RRF(倒数排序融合)、Ensemble
Prompt工程、后处理规则
RAG评估工具
Llama-Index:优化与评估
Ragas:上下文召回率等指标
TruLens-Eval:可观测性
LangChain支持的数据库
Qdrant、Milvus(对比Chroma)
RAG核心流程
文档 → 分块 → 向量化 → 向量数据库 → 检索 → Prompt → LLM生成
0 条评论
下一页