需求场景
2025-02-24 12:46:59 0 举报
AI智能生成
脑图
作者其他创作
大纲/内容
RAG
概念
RAG,即检索增强生成(Retrieval-Augmented Generation),是一种结合了信息检索和自然语言生成的技术框架,旨在提升生成模型的效果和可靠性。在RAG架构中,模型首先通过检索模块从大型知识库或文档集合中获取相关的信息片段,然后将这些检索到的信息作为上下文输入到生成模块中,从而生成更加准确和富有信息的文本。
特点
外部知识库,可随时更新,灵活
模型本身具备相关领域的知识效果最好
技术落地细节
知识库准备阶段
文档读取
多种文档格式支持
其他处理等
文档分块
chunk size选择
overlap选择
动态长度等
Embedding模型选择
向量数据库选择
输入预处理
问题扩充
问题优化
检索阶段(提高检索效果)
多路召回
重排序
生成提示词阶段
prompt的设计及优化
文本生成阶段
大模型的选择
大模型的微调
最终文本处理
最终回答结果审核
是否需要重新处理任务
最终文本二次处理等
其他
多模态相关
Graph RAG
引入知识图谱
参考资料
https://www.bilibili.com/video/BV1nXiRYXEHt/?spm_id_from=333.1387.favlist.content.click&vd_source=212f06db51acb804b90ed4b4ee96a895
deepseek对RAG的影响
参考资料
https://www.bilibili.com/video/BV1EQAgefEZC/?spm_id_from=333.1387.favlist.content.click&vd_source=212f06db51acb804b90ed4b4ee96a895
参考视频资料
https://www.bilibili.com/video/BV1mr421T7UY?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895
https://www.bilibili.com/video/BV12H4y157og?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895
In-context Learning
概念
In-context Learning是一种新兴的机器学习方法,其核心理念是在不进行显式参数更新的情况下,通过在推理阶段利用上下文信息来完成任务。这种方法主要应用于大型语言模型中,通过在输入中提供一系列示例或上下文信息,模型能够从中学习并生成相应的输出。
特点
zero shot & few shot
处理复杂任务时,可能需要更长的上下文和更复杂的示例结构,这对模型的计算资源和推理速度提出了更高的要求。
技术细节
提示工程
参考资料
https://www.bilibili.com/video/BV1n9CwYoEro/?spm_id_from=333.337.search-card.all.click&vd_source=212f06db51acb804b90ed4b4ee96a895
Fine tuning
概念
模型的微调是指在已有预训练模型的基础上,针对特定任务或领域进行进一步的训练和优化,以提升模型在该任务或领域中的表现。预训练模型通常在大规模通用数据集上进行训练,具备一定的语言理解和生成能力,但直接应用于特定任务时可能存在一定的局限性。微调的过程通过使用与目标任务相关的少量标注数据,对预训练模型的参数进行更新,使其更好地适应特定的应用场景。
特点
充分利用预训练模型在大规模数据上学到的通用知识
通过特定任务的训练数据来增强模型在特定领域的专业能力
能够显著提高模型在特定任务上的准确性和效率
能减少对大量标注数据的依赖,降低训练成本
技术细节
微调的不同方式
全量微调
LoRA微调
参考资料
https://www.bilibili.com/video/BV1tthPeFEWb?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895
微调数据处理
多轮问答任务
方案生成任务
微调的实现
使用unsloth进行微调
微调模型的导出及保存
微调后模型的下载及使用
微调后模型效果评估
参考资料
https://www.bilibili.com/video/BV13f421z7Ed?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895
其他
大模型部署
ollama
vllm
webui相关
dify
轻量级AI的API代码开发
langchain
参考资料
https://python.langchain.com/docs/introduction/
agent相关
参考资料
https://www.bilibili.com/video/BV1gg4ze9EBh?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895
https://www.bilibili.com/video/BV1vPHMefEtn?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895
deepseek相关
推理的原理
微调时给出推理过程提升效果
推理过程对功能实现的作用
0 条评论
下一页