AI
推荐
模板社区
专题
登录
免费注册
首页
思维笔记
详情
AI的12个核心概念总结
2026-03-12 16:13:57
0
举报
分享方式
使用 (¥5)
AI的12个核心概念总结
一图看懂AI
AI
核心概念
AI总结
AI核心概念
模板推荐
作者其他创作
大纲/内容
1. LLM(大语言模型)
简要介绍
LLM(Large Language Model)是基于Transformer 架构,通过海量文本数据预训练而成的超大规模语言模型,具备理解、生成、推理和知识整合能力,是当前AI应用的“大脑”,支撑着从聊天机器人到复杂智能体的各类系统。
底层逻辑
核心是白注意力机制,通过捕捉文本中的长距离依赖关系,学习语言规律世界知识和逻辑推理模式。
以“预测下一个 Token”,的方式生成连贯文本,本质是对海量数据中统计规律的建模,而非真正的“理解”。
最新发展现状
多模态融合:从纯文本向“文本+图像+视频+语音”统一理解与生成演进,如 GPT-40、Owen-VL等。
轻量化与边缘部署:模型参数规模从万亿级向高效小模型优化,支持手机、IoT 等边缘设备本地运行。
推理效率提升:通过KV缓存、量化、稀疏化等技术,推理速度提升10-100倍,降低落地成本。
2. Prompt(提示词)
简要介绍
Prompt是用户向大模型下达任务的指令或问题,是引导模型输出符合预期结果的关键,被称为“大模型的编程方式”,直接决定AI的输出质量和任务完成度。
底层逻辑
通过自然语言描述任务目标、约束条件和输出格式,激活模型中预训练的相关知识和能力,本质是“上下文工程”的核心。<br>
高质量Prompt能精准约束模型行为,减少幻觉和无关输出,提升任务执行效率。
最新发展现状
自动优化:从手动编写向AI自动生成和优化Prompt演进,出现Prompt工程框架(如LangChain Prompt模板)和自动提示优化工具。
动态生成:结合Agent实现动态Prompt生成,根据任务进展和环境变化实时调整指令。<br>
标准化:行业形成Prompt设计范式,如“角色-任务-约束-输出格式四要素模板,降低使用门槛。
3. Context(上下文)
简要介绍
Context是模型在生成回答时可参考的历史对话或相关信息,决定了模型对当前任务的理解深度和交互连贯性,是实现持续对话和复杂任务处理的基础。
底层逻辑
通过Transformer的上下文窗日(Context Window)<br>存储和处理历史信<br>息,窗口大小直接限制模型处理长文本和多轮对话的能力。
上下文窗口内的信息以Token形式存储,超过窗口长度的内容会被截断或遗忘。
最新发展现状
窗口扩容:上下文窗口从早期的4K/8K扩展到百万级Token(如GPT-40支持1M +上下文),可处理整本书或长文档。
上下文压缩:通过摘要、向量检索等技术,在不丢失关键信息的前提下压缩上下文,突破窗口大小限制。
长时序处理:支持数天甚至数周的长期对话记忆,适配复杂项目和持续交互场景。
4. Memory(记忆)
简要介绍
Memory是AI系统存储和复用历史信息的能力,分为短期上下文记忆和长期知识记忆,是实现持续交互、个性化服务和复杂任务学习的核心。
底层逻辑
短期记忆:依赖上下文窗口存储近期对话和任务信息,随对话推进动态更新。
长期记忆:通过向量数据库、知识图谱等方式存储历史经验和领域知识,通过检索机制在需要时召回相关信息。
最新发展现状
分层记忆架构:从简单的历史对话存储向“工作记忆-情景记忆-语义记忆程序记忆”四层架构演进,模拟人类记忆模式。
主动记忆管理:Agent可自主判断需要存储或遗忘的信息,优化记忆效率避免信息过载。
·跨场景复用:记忆可在不同任务和场景间迁移,支持AI持续学习和能力迭代
5. Agent(智能体)
简要介绍
AIAgent是以大模型为认知中枢,融合任务规划、工具调用、记忆管理和反馈优化能力,能自主理解用户宏观目标、拆解子任务、选择工具执行并闭环优化的智能系统,核心是从“指令驱动”升级为“目标驱动”。
底层逻辑
典型架构包含感知-记忆-规划-工具集成-反思五大模块,模拟人类解决问题的思维过程。
主流范式如ReAct模式,通过“思考(Reasoning)-行动(Acting)交替推进,实现复杂任务的闭环执行。
最新发展现状
多Agent协作:从“单兵作战”向“主协调Agent+专精子Agent”团队模式演进,群体智能爆发,Gartner预测40%企业应用将嵌入多Agent系统。
具身化交互:对接物理世界,成为机器人、IOT设备的“大脑”,实现“看到-思考-行动”的实体执行。
企业级落地:出现数字员工、行业解决方案等产品,成为大模型商业化的核心载体。
6. RAG(体验增强生成)
简要介绍
RAG(Retrieval-Augmented Generation)是将外部知识库与大模型深度融合的技术,通过检索相关知识片段注入生成过程,解决大模型知识过时、易产生幻觉的核心问题,是企业AI应用的标准配置。
底层逻辑
遵循“检索-增强-生成”工程化闭环
<span style="font-size: inherit;">1)知识准备:将非结构化数据转换为向量,存储在向量数据库中。</span>
<span style="font-size: inherit;">2)查询理解:解析用户问题,生成检索向量。</span>
3)检索阶段:从向量数据库中召回相关知识片段。<br>
4)增强阶段:将检索结果与问题拼接为扩展上下文。<br>
5)生成阶段:大模型基于扩展上下文生成准确、可追溯的回答。
最新发展现状
Agentic RAG:将RAG流程封装在智能体内部,由Agent决策何时检索如何检索、是否迭代,提升灵活性。
多模态RAG:支持文本、图像、音频等多类型知识检索,适配复杂场景(如医疗影像分析)。
性能突破:结合动态路由、上下文压缩、增量索引等技术,检索精度提升40%,token消耗降低30%。
概念关系总结
这些概念并非孤立存在,而是构成了现代AI应用的完整技术栈
核心大脑:LLM
LLM是核心大脑🧠,Prompt和Context是交互式入口,Memory是信息存储
外部知识与工具:
RAG和Search提供外部知识;
Function Calling和MCP连接我外部工具;
能力整合:Agent
Agent整合所有能力,通过Workflow和SKILL执行任务,SubAgent实现群体协作;
基础设施:LangChain
LangChain等框架提供了开发和部署的基础设施,加速技术落地;
7. Function Calling(函数调用)
简要介绍
Function Calling是大模型通过调用外部函数或API扩展能力的机制,让模型能执行代码、查询数据库、控制设备等,突破纯文本生成的局限,实现“思考+行动”的闭环。
底层逻辑
模型生成符合预定义Schema的函数调用参数,由系统解析并执行,再将结果返回给模型继续生成,形成“思考-行动-反馈”的循环。
核心是将模型的认知能力与外部工具的执行能力结合,拓展AI的应用边界。
最新发展现状
复杂工作流支持:从单一函数调用向多函数链式调用和并行执行演进,可完成跨系统的复杂任务(如“预订机票+预订酒店+发送行程提醒”)。<br>
标准化集成:结合MCP协议实现工具调用的标准化,降低集成成本,支持更多工具接入。<br>
安全增强:新增权限控制和结果校验机制,避免恶意调用和错误执行。
8. MCP(模型上下文协议)
简要介绍
MCP(Model Context Protocol)是由Anthropic推出的开放标准协议被誉为AI世界的“万能USB-C接口”,核心目标是统一大模型与外部工具、数据源的交互方式,实现“一次集成,多端复用”。
底层逻辑
定义了Tools、Resources、Prompts三大核心原语,通过JSON-RPC over StdiO/HTTP实现标准化通信;<br>
oTools:封装具体功能的可执行单元。
oResources:暴露工具元数据的查询接口。
oPrompts:内置工作流模板,支持场景化任务调度。
支持异步任务和状态管理,适配长时间运行的复杂流程。
最新发展现状
行业事实标准:已成为AIAgent开发的通用协议,支持主流大模型(GPT4、Claude 3、0wen等)和工具(数据库、API、办公软件)。<br>
功能升级:新增Tasks特性(SEP-1686),支持任务跟踪、状态轮询和取消操作,适配复杂企业流程。<br>
企业降本:替代高成本微调,帮助企业AI落地降本80%+,成为连接模型与业务系统的关键技术。
9. LangChain
简要介绍
LangChain是开源AI应用开发框架,提供模块化组件和工具链,帮助开发者快速构建基于大模型的复杂应用,如RAG、Agent和多模态系统,降低AI应用开发门槛。
底层逻辑
通过模块化设计(如LLMs、Prompts、VectorStores、Agents)实现组件复用,支持灵活组合和扩展,开发者可按需搭建应用架构。<br>
核心是封装底层技术细节,让开发者聚焦业务逻辑,而非重复造轮子。
最新发展现状
LangGraph强化:推出LangGraph,强化多Agent协作和工作流编排能力,支持复杂任务的分布式执行。
MCP深度集成:与MCP协议无缝对接,实现工具调用的标准化,提升应用兼容性。<br>
企业级支持:推出LangChainEnterprise,提供安全审计、权限管理和私有化部署,适配大型企业需求。
10. WorkFlow(工作流)
简要介绍
Workflow是将复杂任务拆解为一系列有序步骤的自动化流程,是Agent执行复杂任务的核心调度机制,支持条件分支、并行执行和异常处理,实现任务的全流程自动化。
底层逻辑
通过有向无环图(DAG)或状态机定义任务流程,由调度器按顺序执行每个步骤,支持人工介入和动态调整。<br>
核心是将复杂任务模块化,提升执行效率和可维护性。
最新发展现状
动态工作流:从静态预定义向Agent自主生成和优化工作流演进.根据任务进展实时调整步骤。<br>
低代码普及:结合低代码平台,让非技术人员也能通过拖拽方式构建复杂工作流,降低开发门槛。<br>
跨系统协同:支持跨平台、跨工具的流程集成,实现企业级端到端自动化。
11. SKILL(技能)
简要介绍
SKILL是将行业知识、业务逻辑和工具调用能力封装成的标准化可复用单元,类似给AI配备的“岗位 SOP”,解决AI“听话但健忘”的核心痛点,让AI无需每次重新学习就能精准完成专业任务。
底层逻辑
采用三层渐进式披露架构:
1)元数据层:Skill的“名片”,仅包含名称和描述,消耗极少token。
2)指令层:核心操作指南,包含执行流程和规则。<br>
3)实现层:具体代码或工具调用细节,按需加载。<br>
工作流程:AI接收任务→检索匹配Skill→加载对应层级内容→执行任务→返回结果。
最新发展现状
行业标准化:Skill定义格式(如SKIL.md)成为行业事实标准,包含名称、描述、输入输出、执行逻辑等要素。<br>
生态繁荣:各AI平台(如豆包、Claude)推出Skill市场,支持第三方开发与共享,覆盖办公自动化、数据分析等领域。<br>
多技能协同:从单一任务执行向多技能组合演进,支持条件触发和流程编排,形成复杂工作流。
12. SubAgent(子智能体)
简要介绍
SubAgent是在多Agent系统中,负责特定子任务的专业智能体,与主Agent分工协作,共同完成复杂目标,是群体智能的核心单元,打破了单个Agent的能力边界。
底层逻辑
主Agent负责任务拆解、结果汇总和全局协调,SubAgent专注于特定领域(如代码、设计、分析),通过标准化通信协议实现分工协作。<br>
核心是“专业的人做专业的事”,提升任务执行效率和精度。
最新发展现状
主流协作模式:“主协调Agent+专精子Agent”成为多Agent系统的主流架构,如CrewAI框架的团队协作模式。<br>
行业化落地:在金融、医疗、工业等领域出现定制化SubAgent,如“投研“医疗影像分析SubAgent”。<br>
生态扩展:SubAgent可跨平台复用,支持不同厂商的Agent系统协同,推动群対坨抢轂创隐体齜战智能生态成熟。
收藏
立即使用
大模型中的核心概念与架构全解
收藏
立即使用
如何有效管理团队
收藏
立即使用
AI的12个核心概念总结
收藏
立即使用
Linux运维工程师技能树
冷水泡茶
职业:暂无
去主页
Collect
Get Started
空间域名的概念
Collect
Get Started
AI学习总线
Collect
Get Started
概念龙头
Collect
Get Started
概念理解2
评论
0
条评论
下一页
Document