首页  思维导图  详情



 



需求场景

2025-02-24 12:46:59   0  举报





仅支持查看

AI智能生成

脑图

研发

模板推荐

作者其他创作

大纲/内容

RAG

概念

RAG，即检索增强生成（Retrieval-Augmented Generation），是一种结合了信息检索和自然语言生成的技术框架，旨在提升生成模型的效果和可靠性。在RAG架构中，模型首先通过检索模块从大型知识库或文档集合中获取相关的信息片段，然后将这些检索到的信息作为上下文输入到生成模块中，从而生成更加准确和富有信息的文本。

特点

外部知识库，可随时更新，灵活

模型本身具备相关领域的知识效果最好

技术落地细节

知识库准备阶段

文档读取

多种文档格式支持

其他处理等

文档分块

chunk size选择

overlap选择

动态长度等

Embedding模型选择

向量数据库选择

输入预处理

问题扩充

问题优化

检索阶段（提高检索效果）

多路召回

重排序

生成提示词阶段

prompt的设计及优化

文本生成阶段

大模型的选择

大模型的微调

最终文本处理

最终回答结果审核

是否需要重新处理任务

最终文本二次处理等

其他

多模态相关

Graph RAG

引入知识图谱

参考资料

https://www.bilibili.com/video/BV1nXiRYXEHt/?spm_id_from=333.1387.favlist.content.click&vd_source=212f06db51acb804b90ed4b4ee96a895

deepseek对RAG的影响

参考资料

https://www.bilibili.com/video/BV1EQAgefEZC/?spm_id_from=333.1387.favlist.content.click&vd_source=212f06db51acb804b90ed4b4ee96a895

参考视频资料

https://www.bilibili.com/video/BV1mr421T7UY?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895

https://www.bilibili.com/video/BV12H4y157og?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895

In-context Learning

概念

In-context Learning是一种新兴的机器学习方法，其核心理念是在不进行显式参数更新的情况下，通过在推理阶段利用上下文信息来完成任务。这种方法主要应用于大型语言模型中，通过在输入中提供一系列示例或上下文信息，模型能够从中学习并生成相应的输出。

特点

zero shot & few shot

处理复杂任务时，可能需要更长的上下文和更复杂的示例结构，这对模型的计算资源和推理速度提出了更高的要求。

技术细节

提示工程

参考资料

https://www.bilibili.com/video/BV1n9CwYoEro/?spm_id_from=333.337.search-card.all.click&vd_source=212f06db51acb804b90ed4b4ee96a895

Fine tuning

概念

模型的微调是指在已有预训练模型的基础上，针对特定任务或领域进行进一步的训练和优化，以提升模型在该任务或领域中的表现。预训练模型通常在大规模通用数据集上进行训练，具备一定的语言理解和生成能力，但直接应用于特定任务时可能存在一定的局限性。微调的过程通过使用与目标任务相关的少量标注数据，对预训练模型的参数进行更新，使其更好地适应特定的应用场景。

特点

充分利用预训练模型在大规模数据上学到的通用知识

通过特定任务的训练数据来增强模型在特定领域的专业能力

能够显著提高模型在特定任务上的准确性和效率

能减少对大量标注数据的依赖，降低训练成本

技术细节

微调的不同方式

全量微调

LoRA微调

参考资料

https://www.bilibili.com/video/BV1tthPeFEWb?spm_id_from=333.788.videopod.sections&vd_source=212f06db51acb804b90ed4b4ee96a895

微调数据处理