AI的12个核心概念总结思维笔记模板_ProcessOn思维导图、流程图

1. LLM（大语言模型）

简要介绍

LLM(Large Language Model)是基于Transformer 架构，通过海量文本数据预训练而成的超大规模语言模型，具备理解、生成、推理和知识整合能力，是当前AI应用的“大脑”，支撑着从聊天机器人到复杂智能体的各类系统。

底层逻辑

核心是白注意力机制，通过捕捉文本中的长距离依赖关系，学习语言规律世界知识和逻辑推理模式。

以“预测下一个 Token”，的方式生成连贯文本，本质是对海量数据中统计规律的建模，而非真正的“理解”。

最新发展现状

多模态融合:从纯文本向“文本+图像+视频+语音”统一理解与生成演进，如 GPT-40、Owen-VL等。

轻量化与边缘部署:模型参数规模从万亿级向高效小模型优化，支持手机、IoT 等边缘设备本地运行。

推理效率提升:通过KV缓存、量化、稀疏化等技术，推理速度提升10-100倍，降低落地成本。

2. Prompt（提示词）

简要介绍

Prompt是用户向大模型下达任务的指令或问题，是引导模型输出符合预期结果的关键，被称为“大模型的编程方式”，直接决定AI的输出质量和任务完成度。

底层逻辑

通过自然语言描述任务目标、约束条件和输出格式，激活模型中预训练的相关知识和能力，本质是“上下文工程”的核心。

高质量Prompt能精准约束模型行为，减少幻觉和无关输出，提升任务执行效率。

最新发展现状

自动优化：从手动编写向AI自动生成和优化Prompt演进，出现Prompt工程框架(如LangChain Prompt模板)和自动提示优化工具。

动态生成：结合Agent实现动态Prompt生成，根据任务进展和环境变化实时调整指令。

标准化：行业形成Prompt设计范式，如“角色-任务-约束-输出格式四要素模板，降低使用门槛。

3. Context（上下文）

简要介绍

Context是模型在生成回答时可参考的历史对话或相关信息，决定了模型对当前任务的理解深度和交互连贯性，是实现持续对话和复杂任务处理的基础。

底层逻辑

通过Transformer的上下文窗日(Context Window) 存储和处理历史信 息，窗口大小直接限制模型处理长文本和多轮对话的能力。

上下文窗口内的信息以Token形式存储，超过窗口长度的内容会被截断或遗忘。

最新发展现状

窗口扩容:上下文窗口从早期的4K/8K扩展到百万级Token(如GPT-40支持1M +上下文)，可处理整本书或长文档。

上下文压缩:通过摘要、向量检索等技术，在不丢失关键信息的前提下压缩上下文，突破窗口大小限制。

长时序处理:支持数天甚至数周的长期对话记忆，适配复杂项目和持续交互场景。

4. Memory（记忆）

简要介绍

Memory是AI系统存储和复用历史信息的能力，分为短期上下文记忆和长期知识记忆，是实现持续交互、个性化服务和复杂任务学习的核心。

底层逻辑

短期记忆：依赖上下文窗口存储近期对话和任务信息，随对话推进动态更新。

长期记忆：通过向量数据库、知识图谱等方式存储历史经验和领域知识，通过检索机制在需要时召回相关信息。

最新发展现状

分层记忆架构：从简单的历史对话存储向“工作记忆-情景记忆-语义记忆程序记忆”四层架构演进，模拟人类记忆模式。

主动记忆管理：Agent可自主判断需要存储或遗忘的信息，优化记忆效率避免信息过载。

·跨场景复用：记忆可在不同任务和场景间迁移，支持AI持续学习和能力迭代

5. Agent（智能体）

简要介绍

AIAgent是以大模型为认知中枢，融合任务规划、工具调用、记忆管理和反馈优化能力，能自主理解用户宏观目标、拆解子任务、选择工具执行并闭环优化的智能系统，核心是从“指令驱动”升级为“目标驱动”。

底层逻辑

典型架构包含感知-记忆-规划-工具集成-反思五大模块，模拟人类解决问题的思维过程。

主流范式如ReAct模式，通过“思考(Reasoning)-行动(Acting)交替推进，实现复杂任务的闭环执行。

最新发展现状

多Agent协作：从“单兵作战”向“主协调Agent+专精子Agent”团队模式演进，群体智能爆发，Gartner预测40%企业应用将嵌入多Agent系统。

具身化交互：对接物理世界，成为机器人、IOT设备的“大脑”，实现“看到-思考-行动”的实体执行。

企业级落地：出现数字员工、行业解决方案等产品，成为大模型商业化的核心载体。

6. RAG（体验增强生成）

简要介绍

RAG(Retrieval-Augmented Generation)是将外部知识库与大模型深度融合的技术，通过检索相关知识片段注入生成过程，解决大模型知识过时、易产生幻觉的核心问题，是企业AI应用的标准配置。

底层逻辑

遵循“检索-增强-生成”工程化闭环

1）知识准备:将非结构化数据转换为向量，存储在向量数据库中。

2）查询理解:解析用户问题，生成检索向量。

3）检索阶段:从向量数据库中召回相关知识片段。

4）增强阶段:将检索结果与问题拼接为扩展上下文。

5）生成阶段:大模型基于扩展上下文生成准确、可追溯的回答。

最新发展现状

Agentic RAG:将RAG流程封装在智能体内部，由Agent决策何时检索如何检索、是否迭代，提升灵活性。

多模态RAG:支持文本、图像、音频等多类型知识检索，适配复杂场景(如医疗影像分析)。

性能突破:结合动态路由、上下文压缩、增量索引等技术，检索精度提升40%，token消耗降低30%。

概念关系总结

这些概念并非孤立存在，而是构成了现代AI应用的完整技术栈

核心大脑：LLM

LLM是核心大脑🧠，Prompt和Context是交互式入口，Memory是信息存储

外部知识与工具：

RAG和Search提供外部知识；

Function Calling和MCP连接我外部工具；

能力整合：Agent

Agent整合所有能力，通过Workflow和SKILL执行任务，SubAgent实现群体协作；

基础设施：LangChain

LangChain等框架提供了开发和部署的基础设施，加速技术落地；

7. Function Calling（函数调用）

简要介绍

Function Calling是大模型通过调用外部函数或API扩展能力的机制，让模型能执行代码、查询数据库、控制设备等，突破纯文本生成的局限，实现“思考+行动”的闭环。

底层逻辑

模型生成符合预定义Schema的函数调用参数，由系统解析并执行，再将结果返回给模型继续生成，形成“思考-行动-反馈”的循环。

核心是将模型的认知能力与外部工具的执行能力结合，拓展AI的应用边界。

最新发展现状

复杂工作流支持：从单一函数调用向多函数链式调用和并行执行演进，可完成跨系统的复杂任务(如“预订机票+预订酒店+发送行程提醒”)。

标准化集成:结合MCP协议实现工具调用的标准化，降低集成成本，支持更多工具接入。

安全增强:新增权限控制和结果校验机制，避免恶意调用和错误执行。

8. MCP（模型上下文协议）

简要介绍

MCP(Model Context Protocol)是由Anthropic推出的开放标准协议被誉为AI世界的“万能USB-C接口”，核心目标是统一大模型与外部工具、数据源的交互方式，实现“一次集成，多端复用”。

底层逻辑

定义了Tools、Resources、Prompts三大核心原语，通过JSON-RPC over StdiO/HTTP实现标准化通信；

oTools：封装具体功能的可执行单元。

oResources：暴露工具元数据的查询接口。

oPrompts：内置工作流模板，支持场景化任务调度。

支持异步任务和状态管理，适配长时间运行的复杂流程。

最新发展现状

行业事实标准：已成为AIAgent开发的通用协议，支持主流大模型(GPT4、Claude 3、0wen等)和工具(数据库、API、办公软件)。

功能升级：新增Tasks特性(SEP-1686)，支持任务跟踪、状态轮询和取消操作，适配复杂企业流程。

企业降本：替代高成本微调，帮助企业AI落地降本80%+，成为连接模型与业务系统的关键技术。

9. LangChain

简要介绍

LangChain是开源AI应用开发框架，提供模块化组件和工具链，帮助开发者快速构建基于大模型的复杂应用，如RAG、Agent和多模态系统，降低AI应用开发门槛。

底层逻辑

通过模块化设计(如LLMs、Prompts、VectorStores、Agents)实现组件复用，支持灵活组合和扩展，开发者可按需搭建应用架构。

核心是封装底层技术细节，让开发者聚焦业务逻辑，而非重复造轮子。

最新发展现状

LangGraph强化：推出LangGraph，强化多Agent协作和工作流编排能力，支持复杂任务的分布式执行。

MCP深度集成：与MCP协议无缝对接，实现工具调用的标准化，提升应用兼容性。

企业级支持：推出LangChainEnterprise，提供安全审计、权限管理和私有化部署，适配大型企业需求。

10. WorkFlow（工作流）

简要介绍

Workflow是将复杂任务拆解为一系列有序步骤的自动化流程，是Agent执行复杂任务的核心调度机制，支持条件分支、并行执行和异常处理，实现任务的全流程自动化。

底层逻辑

通过有向无环图(DAG)或状态机定义任务流程，由调度器按顺序执行每个步骤，支持人工介入和动态调整。

核心是将复杂任务模块化，提升执行效率和可维护性。

最新发展现状

动态工作流：从静态预定义向Agent自主生成和优化工作流演进.根据任务进展实时调整步骤。

低代码普及：结合低代码平台，让非技术人员也能通过拖拽方式构建复杂工作流，降低开发门槛。

跨系统协同：支持跨平台、跨工具的流程集成，实现企业级端到端自动化。

11. SKILL（技能）

简要介绍

SKILL是将行业知识、业务逻辑和工具调用能力封装成的标准化可复用单元，类似给AI配备的“岗位 SOP”，解决AI“听话但健忘”的核心痛点，让AI无需每次重新学习就能精准完成专业任务。

底层逻辑

采用三层渐进式披露架构:

1）元数据层:Skill的“名片”，仅包含名称和描述，消耗极少token。

2）指令层:核心操作指南，包含执行流程和规则。

3）实现层:具体代码或工具调用细节，按需加载。

工作流程：AI接收任务→检索匹配Skill→加载对应层级内容→执行任务→返回结果。

最新发展现状

行业标准化：Skill定义格式(如SKIL.md)成为行业事实标准，包含名称、描述、输入输出、执行逻辑等要素。

生态繁荣：各AI平台(如豆包、Claude)推出Skill市场，支持第三方开发与共享，覆盖办公自动化、数据分析等领域。

多技能协同：从单一任务执行向多技能组合演进，支持条件触发和流程编排，形成复杂工作流。

12. SubAgent（子智能体）

简要介绍

SubAgent是在多Agent系统中，负责特定子任务的专业智能体，与主Agent分工协作，共同完成复杂目标，是群体智能的核心单元，打破了单个Agent的能力边界。

底层逻辑

主Agent负责任务拆解、结果汇总和全局协调，SubAgent专注于特定领域(如代码、设计、分析)，通过标准化通信协议实现分工协作。

核心是“专业的人做专业的事”，提升任务执行效率和精度。

最新发展现状

主流协作模式:“主协调Agent+专精子Agent”成为多Agent系统的主流架构，如CrewAI框架的团队协作模式。

行业化落地：在金融、医疗、工业等领域出现定制化SubAgent，如“投研“医疗影像分析SubAgent”。

生态扩展：SubAgent可跨平台复用，支持不同厂商的Agent系统协同，推动群対坨抢轂创隐体齜战智能生态成熟。