AI学习总结思维导图模板_ProcessOn思维导图、流程图

智能体(agent)

定义

是一种具备自主感知、决策、规划与执行能力的智能系统，它以大模型为“大脑”，能够理解用户目标，自动拆解任务、调用工具、协调资源并完成复杂操作，而不仅仅是被动回答问题。

核心能力

大脑（LLM）：负责理解与推理，如Qwen、GPT等大模型

工具调用：可连接外部API或软件，如查天气、发邮件、操作数据库。

思考模式（AgentType）：决定其行为逻辑，如ReAct（边推理边行动）或先规划后执行

记忆与学习：记住上下文，积累经验，持续优化表现

应用场景

编程智能体claude code,open AI codex

智能客服自动处理多轮对话

企业流程自动化（如财务报销、订单管理）

个人助理（日程安排、信息整理）

模型（model）

定义

是一种通过数据训练出来的程序，能够自主识别模式、做出预测或决策，而无需人为编写具体规则。

常见类型

大语言模型（LLM）：如文心一言、GPT系列，擅长理解与生成自然语言。

视觉模型：如ResNet、ViT，用于图像识别、目标检测。

多模态模型：可同时处理文本、图像、音频等，如GPT-4o、DALL·E。

生成式模型：能创造新内容，如写文章、画图、作曲。

模型上下文协议（mcp）

定义

MCP（Model Context Protocol，模型上下文协议）是一种开放标准协议，旨在为大语言模型（LLM）安全、高效地连接外部工具和数据源提供统一接口，被广泛称为“AI世界的USB-C”。

核心架构角色

Host（宿主）：运行AI应用的环境，如IDE或聊天平台（如Cursor、Claude）。

Client（客户端）：位于宿主中，负责与MCP服务器通信。

MCP Server（服务器）：暴露具体能力的服务，如文件系统、数据库、GitHub API等。

Model（大模型）：作为“大脑”发起请求，但不直接访问系统资源。

关键优势

统一接入：不同工具（如Git、浏览器、数据库）只需实现MCP标准即可被AI调用，避免重复开发。

安全可控：支持权限控制、日志审计和用户确认机制，防止越权操作。

动态发现：AI可实时查询当前可用的工具和资源，提升灵活性。

跨平台兼容：一套协议适配多种模型与工具，降低迁移成本。

热门 MCP Server 详解

https://docs.trae.cn/ide/most-used-mcp-servers-in-trae

MCP 教程：将 Figma 设计稿转化为前端代码

https://docs.trae.cn/ide/tutorial-mcp-figma

MCP 教程：实现网页自动化测试

https://docs.trae.cn/ide/tutorial-mcp-playwright

技能（skills）

定义

指AI系统为完成特定任务而具备的可调用、可复用的标准化能力模块，它让AI从“能思考”进化到“会做事”。

核心特点

模块化设计：每个Skill独立封装，包含功能描述、输入参数、执行逻辑和校验规则，支持跨任务复用。

按需加载：仅在触发条件满足时才激活，节省计算资源与上下文长度。

可编排性：多个Skills可被智能体（Agent）协调调用，形成复杂工作流，如“搜索信息 → 整理摘要 → 发送邮件”。

低门槛使用：用户无需编程，只需表达需求，AI自动匹配并执行相应技能。

常见AI技能类型

办公效率：自动生成周报、会议纪要转文字、邮件分类

编程开发：代码生成、Debug、单元测试编写

数据处理：表格分析、趋势预测、数据清洗

内容创作：小红书文案生成、公众号文章排版、视频脚本撰写

系统集成：调用API、操作数据库、控制机器人

研发场景十大热门 Skill 推荐

https://docs.trae.cn/ide/top-10-recommended-skills-for-development-scenarios

如何写好一个 Skill

https://docs.trae.cn/ide/best-practice-for-how-to-write-a-good-skill

规则（rules）

定义

是一套用于约束和引导AI行为的规范体系，确保其输出符合特定标准、风格或安全要求，就像为AI设定的“工作手册”或“行为宪法”。

核心作用

统一输出风格：强制AI遵循命名规范、代码格式、语言风格等。例如，“所有变量名使用驼峰命名”“注释必须用中文”。

对齐技术栈与项目背景：限定AI使用指定的技术框架（如React而非Vue）、依赖库或架构模式，避免生成“正确但不适用”的内容。

增强上下文感知：通过预设项目结构、模块职责等信息，帮助AI更准确理解“这段代码该放在哪里”“这个功能如何落地”。

减少重复沟通：将高频要求（如“补全类型声明”“按团队注释规范输出”）沉淀为规则，提升交互效率。

提示词（prompt）

定义

是用户输入给大语言模型的指令或问题，用于引导模型生成特定内容，是人与AI交互的核心桥梁。<br>简单来说，prompt就是你对AI说的一句话，决定了它“思考什么”和“如何回应”。无论是写文章、写代码、回答问题，还是生成图像，都需要通过prompt来传达你的需求。<br>

核心构成要素

任务指令：明确要做什么（如“写一篇小红书文案”）

内容主体：具体对象或主题（如“红宝石咖啡馆”）

细节要求：格式、风格、长度、关键词等（如“包含拿铁、酸奶碗、手冲咖啡”）

输出形式：指定返回结构（如“用表情分段”“输出JSON格式”）

如何写出好Prompt

说清楚：避免模糊表达，如“写点东西”应改为“写一篇800字关于AI伦理的议论文”

做强调：突出关键需求，如“必须包含2026年最新数据”

定人设：设定角色提升专业性，如“你现在是资深投资分析师”

追提问：根据AI回复继续细化，形成多轮引导

找参考：借鉴优秀prompt模板进行迭代优化

Rules 与 Prompt 的区别

Prompt 决定“这次要做什么”，关注当前任务目标（如“写一个登录接口”）。

Rules 决定“应该怎么做”，约束执行方式（如“用TypeScript、加注释、按RESTful规范”）。<br>两者互补：Prompt是“任务指令”，Rules是“默认工作标准”。

上下文（context）

定义

是模型在处理任务时所能直接访问的“临时工作区”，它包含了当前对话或任务中所有相关的输入信息，决定了AI“此刻知道什么”。

核心作用

保持对话连贯：让AI记住你刚才说了什么，避免“前言不搭后语”。

支撑任务执行：在写代码、生成报告等复杂任务中，上下文会包含指令、代码片段、反馈等关键信息。

实现上下文感知：通过整合系统提示、用户偏好和历史交互，提升响应的相关性与个性化程度。

上下文的组成内容

用户输入：你当前提出的问题或指令。

系统提示（System Prompt）：预设的角色设定与行为规范（如“你是一个资深医生”）。

历史对话：最近几轮的问答记录，用于维持对话连续性。

工具调用结果：AI通过技能调用外部系统后返回的数据。

文件片段：上传文档中的关键段落或表格内容。

上下文管理的关键机制

滑动窗口：只保留最近N轮对话，自动丢弃最老信息。

摘要压缩：将早期对话浓缩为一句摘要，节省空间。

相关性筛选：优先保留与当前问题最相关的内容，剔除冗余信息。

注意

会话结束后，上下文通常会被清空，AI不会“记住”你，除非借助记忆体（Memory）将关键信息持久化存储并后续注入新的上下文中。

记忆体（memory）

定义

是实现信息持久化存储与跨会话复用的“长期大脑”，它让AI能够记住用户偏好、历史交互和任务进度，从而提供个性化、连续性的服务。

核心类型与作用

短期记忆：保留当前会话内的关键状态

记住用户刚修改的参数设置

长期记忆：跨会话保存用户习惯与知识

“我不喝咖啡” → 推荐饮品自动避开咖啡类

情景记忆：存储特定事件的完整上下文

回忆上周三会议中客户提到的需求细节

语义记忆：存储通用事实与规则知识

记住“Python中缩进代表代码块”

程序记忆：存储可复用的任务流程

自动执行“生成报告→发邮件→归档”工作流

实现机制

向量数据库（如Chroma、Pinecone）：将对话内容编码为向量，支持语义检索，例如通过“上周见的客户”找到具体对话。

键值存储（如Redis）：用于快速存取临时状态，适合会话级记忆管理。

关系型数据库（如MySQL）：存储结构化用户画像、任务日志等长期数据。

记忆索引策略：以时间轴为索引（如Moonix系统），用户可自然语言查询“昨天下午我做了什么”。

与上下文区别

上下文 = 模型输入序列中的“当前可见信息”，临时且有限。

记忆体 = 外部存储的“可调用历史档案”，持久且可扩展。

智能体(agent)

专业人士（如医生、律师、工程师）

负责整体判断与决策，协调各方资源完成任务。

模型（model）

大脑

提供认知、推理和语言能力，是思考的核心。

模型上下文协议（mcp）

工具接口（如听诊器、手术刀、代码编辑器）

连接外部系统，让AI能“动手”操作真实世界资源。

技能（skills）

标准化操作流程

比如“血常规检查”“CT扫描”“开处方”，是可复用的专业动作模块。

规则（rules）

执业规范与安全准则

比如“处方必须双人核对”“病历书写需符合格式”，确保操作合规。

提示词（prompt）

客户提出的具体需求

比如“我头疼三天了，帮忙诊断一下”，它告诉Agent“要做什么”。

上下文（context）

当前诊室里的资料桌面

放着本次就诊的病历、检查报告、医嘱单等，是此刻能直接查看的信息集合。

记忆体（memory）

个人经验库与患者档案

存储过往病例、用户偏好、成功方案，支持长期学习与个性化服务。