智能体(agent)
定义
是一种具备自主感知、决策、规划与执行能力的智能系统,它以大模型为“大脑”,能够理解用户目标,自动拆解任务、调用工具、协调资源并完成复杂操作,而不仅仅是被动回答问题。
核心能力
大脑(LLM):负责理解与推理,如Qwen、GPT等大模型
工具调用:可连接外部API或软件,如查天气、发邮件、操作数据库。
思考模式(AgentType):决定其行为逻辑,如ReAct(边推理边行动)或先规划后执行
记忆与学习:记住上下文,积累经验,持续优化表现
应用场景
编程智能体claude code,open AI codex
智能客服自动处理多轮对话
企业流程自动化(如财务报销、订单管理)
个人助理(日程安排、信息整理)
模型(model)
定义
是一种通过数据训练出来的程序,能够自主识别模式、做出预测或决策,而无需人为编写具体规则。
常见类型
大语言模型(LLM):如文心一言、GPT系列,擅长理解与生成自然语言。
视觉模型:如ResNet、ViT,用于图像识别、目标检测。
多模态模型:可同时处理文本、图像、音频等,如GPT-4o、DALL·E。
生成式模型:能创造新内容,如写文章、画图、作曲。
模型上下文协议(mcp)
定义
MCP(Model Context Protocol,模型上下文协议) 是一种开放标准协议,旨在为大语言模型(LLM)安全、高效地连接外部工具和数据源提供统一接口,被广泛称为“AI世界的USB-C”。
核心架构角色
Host(宿主):运行AI应用的环境,如IDE或聊天平台(如Cursor、Claude)。
Client(客户端):位于宿主中,负责与MCP服务器通信。
MCP Server(服务器):暴露具体能力的服务,如文件系统、数据库、GitHub API等。
Model(大模型):作为“大脑”发起请求,但不直接访问系统资源。
关键优势
统一接入:不同工具(如Git、浏览器、数据库)只需实现MCP标准即可被AI调用,避免重复开发。
安全可控:支持权限控制、日志审计和用户确认机制,防止越权操作。
动态发现:AI可实时查询当前可用的工具和资源,提升灵活性。
跨平台兼容:一套协议适配多种模型与工具,降低迁移成本。
热门 MCP Server 详解
https://docs.trae.cn/ide/most-used-mcp-servers-in-trae
MCP 教程:将 Figma 设计稿转化为前端代码
https://docs.trae.cn/ide/tutorial-mcp-figma
MCP 教程:实现网页自动化测试
https://docs.trae.cn/ide/tutorial-mcp-playwright
技能(skills)
定义
指AI系统为完成特定任务而具备的可调用、可复用的标准化能力模块,它让AI从“能思考”进化到“会做事”。
核心特点
模块化设计:每个Skill独立封装,包含功能描述、输入参数、执行逻辑和校验规则,支持跨任务复用。
按需加载:仅在触发条件满足时才激活,节省计算资源与上下文长度。
可编排性:多个Skills可被智能体(Agent)协调调用,形成复杂工作流,如“搜索信息 → 整理摘要 → 发送邮件”。
低门槛使用:用户无需编程,只需表达需求,AI自动匹配并执行相应技能。
常见AI技能类型
办公效率:自动生成周报、会议纪要转文字、邮件分类
编程开发:代码生成、Debug、单元测试编写
数据处理:表格分析、趋势预测、数据清洗
内容创作:小红书文案生成、公众号文章排版、视频脚本撰写
系统集成:调用API、操作数据库、控制机器人
研发场景十大热门 Skill 推荐
https://docs.trae.cn/ide/top-10-recommended-skills-for-development-scenarios
如何写好一个 Skill
https://docs.trae.cn/ide/best-practice-for-how-to-write-a-good-skill
规则(rules)
定义
是一套用于约束和引导AI行为的规范体系,确保其输出符合特定标准、风格或安全要求,就像为AI设定的“工作手册”或“行为宪法”。
核心作用
统一输出风格:强制AI遵循命名规范、代码格式、语言风格等。例如,“所有变量名使用驼峰命名”“注释必须用中文”。
对齐技术栈与项目背景:限定AI使用指定的技术框架(如React而非Vue)、依赖库或架构模式,避免生成“正确但不适用”的内容。
增强上下文感知:通过预设项目结构、模块职责等信息,帮助AI更准确理解“这段代码该放在哪里”“这个功能如何落地”。
减少重复沟通:将高频要求(如“补全类型声明”“按团队注释规范输出”)沉淀为规则,提升交互效率。
提示词(prompt)
定义
是用户输入给大语言模型的指令或问题,用于引导模型生成特定内容,是人与AI交互的核心桥梁。<br>简单来说,prompt就是你对AI说的一句话,决定了它“思考什么”和“如何回应”。无论是写文章、写代码、回答问题,还是生成图像,都需要通过prompt来传达你的需求。<br>
核心构成要素
任务指令:明确要做什么(如“写一篇小红书文案”)
内容主体:具体对象或主题(如“红宝石咖啡馆”)
细节要求:格式、风格、长度、关键词等(如“包含拿铁、酸奶碗、手冲咖啡”)
输出形式:指定返回结构(如“用表情分段”“输出JSON格式”)
如何写出好Prompt
说清楚:避免模糊表达,如“写点东西”应改为“写一篇800字关于AI伦理的议论文”
做强调:突出关键需求,如“必须包含2026年最新数据”
定人设:设定角色提升专业性,如“你现在是资深投资分析师”
追提问:根据AI回复继续细化,形成多轮引导
找参考:借鉴优秀prompt模板进行迭代优化
Rules 与 Prompt 的区别
Prompt 决定“这次要做什么”,关注当前任务目标(如“写一个登录接口”)。
Rules 决定“应该怎么做”,约束执行方式(如“用TypeScript、加注释、按RESTful规范”)。<br>两者互补:Prompt是“任务指令”,Rules是“默认工作标准”。
上下文(context)
定义
是模型在处理任务时所能直接访问的“临时工作区”,它包含了当前对话或任务中所有相关的输入信息,决定了AI“此刻知道什么”。
核心作用
保持对话连贯:让AI记住你刚才说了什么,避免“前言不搭后语”。
支撑任务执行:在写代码、生成报告等复杂任务中,上下文会包含指令、代码片段、反馈等关键信息。
实现上下文感知:通过整合系统提示、用户偏好和历史交互,提升响应的相关性与个性化程度。
上下文的组成内容
用户输入:你当前提出的问题或指令。
系统提示(System Prompt):预设的角色设定与行为规范(如“你是一个资深医生”)。
历史对话:最近几轮的问答记录,用于维持对话连续性。
工具调用结果:AI通过技能调用外部系统后返回的数据。
文件片段:上传文档中的关键段落或表格内容。
上下文管理的关键机制
滑动窗口:只保留最近N轮对话,自动丢弃最老信息。
摘要压缩:将早期对话浓缩为一句摘要,节省空间。
相关性筛选:优先保留与当前问题最相关的内容,剔除冗余信息。
注意
会话结束后,上下文通常会被清空,AI不会“记住”你,除非借助记忆体(Memory) 将关键信息持久化存储并后续注入新的上下文中。
记忆体(memory)
定义
是实现信息持久化存储与跨会话复用的“长期大脑”,它让AI能够记住用户偏好、历史交互和任务进度,从而提供个性化、连续性的服务。
核心类型与作用
短期记忆:保留当前会话内的关键状态
记住用户刚修改的参数设置
长期记忆:跨会话保存用户习惯与知识
“我不喝咖啡” → 推荐饮品自动避开咖啡类
情景记忆:存储特定事件的完整上下文
回忆上周三会议中客户提到的需求细节
语义记忆:存储通用事实与规则知识
记住“Python中缩进代表代码块”
程序记忆:存储可复用的任务流程
自动执行“生成报告→发邮件→归档”工作流
实现机制
向量数据库(如Chroma、Pinecone):将对话内容编码为向量,支持语义检索,例如通过“上周见的客户”找到具体对话。
键值存储(如Redis):用于快速存取临时状态,适合会话级记忆管理。
关系型数据库(如MySQL):存储结构化用户画像、任务日志等长期数据。
记忆索引策略:以时间轴为索引(如Moonix系统),用户可自然语言查询“昨天下午我做了什么”。
与上下文区别
上下文 = 模型输入序列中的“当前可见信息”,临时且有限。
记忆体 = 外部存储的“可调用历史档案”,持久且可扩展。
技能(skills)
标准化操作流程
比如“血常规检查”“CT扫描”“开处方”,是可复用的专业动作模块。
规则(rules)
执业规范与安全准则
比如“处方必须双人核对”“病历书写需符合格式”,确保操作合规。
提示词(prompt)
客户提出的具体需求
比如“我头疼三天了,帮忙诊断一下”,它告诉Agent“要做什么”。
上下文(context)
当前诊室里的资料桌面
放着本次就诊的病历、检查报告、医嘱单等,是此刻能直接查看的信息集合。
记忆体(memory)
个人经验库与患者档案
存储过往病例、用户偏好、成功方案,支持长期学习与个性化服务。