AI 名词汇总思维导图模板_ProcessOn思维导图、流程图

人工智能（AI：Artificial Intelligence） 泛指一切旨在模仿或超越人类智能的人造技术、产品及其理论体系。 它区别于天然的人脑智能， 也不同于仅能执行预设指令的传统自动化工具

机器学习 ML 是AI的一个子集，目前看也是最大的一个子集

神经网络 NN

深度学习DL

深度学习常见网络

卷积神经网络(CNN)

循环神经网络（RNN)

图神经网络（GNN）

核心架构

Transformer 当前所有大语言模型的基石。它通过“自注意力机制”并行处理序列数据，解决了长距离依赖问题。 将时间复杂度从平方级降低到线性级，以解决长序列处理中的效率瓶颈，尤其在处理更长的文本或数据时更有效率。 Llama2/ChatGLM、LLaMA 3等模型都基于此架构

大语言模型 Large Language Modal LLM 基于海量数据训练、拥有巨大参数量的Transformer模型， 具备强大的语言理解和生成能力 通常指参数量>10B的预训练模型

代表性大语言模型

ChatGLM  智谱AI的中文大模型

OpenAI：GPT-4.1、GPT-4o、o3

Anthropic/ænˈθrɑːpɪk/：Claude 3.5 Sonnet、Claude 3 Opus

Google：Gemini/ˈdʒemɪnaɪ/ 1.5 Pro、Gemini 1.5 Flash（以及后续 2.x 系列）

Meta（开源）：Llama/ˈlɑːmə/ 3、Llama 3.1

xAI：Grok 系列

国内常见：通义千问（Qwen）、文心一言（ERNIE）、豆包（Doubao）、智谱 GLM、Kimi（月之暗面）、DeepSeek 系列

训练与部署层

训练 让模型通过数据学习参数

预训练 是什么：在海量通用数据（网页、书籍、代码等）上做基础学习，让模型先具备“通识能力”（语言理解、知识记忆、推理雏形）。 应用场景：训练通用大模型底座（如聊天、写作、问答、代码的基础能力）；通常由大厂或研究机构完成，小团队一般直接使用预训练好的底模。

RLHF（Reinforcement Learning from Human Feedback）：基于人类反馈的强化学习 是什么：先收集人类偏好（A回答比B好），再用强化学习优化模型，让输出更符合“人类觉得好”的方向。 应用场景：提升回答质量与安全性（更有帮助、少冒犯、少跑偏），常用于通用助手产品体验优化。

DPO（Direct Preference Optimization）：直接偏好优化（用偏好数据直接优化模型） 是什么：同样利用“人类偏好数据”，但不走复杂强化学习流程，直接做偏好优化训练。可理解为 RLHF 的更简化/更稳定替代方案之一。 应用场景：希望用偏好数据快速提升“回答更符合人类偏好”时；在工程上常用于对齐阶段，训练成本和实现复杂度通常更友好。

FT (Fine-tuning)  微调 是什么：在已有大模型上，用特定领域数据再训练，让模型掌握垂直领域能力。SFT 其实是 FT 的一种常见形式。 应用场景：法律、医疗、金融、政务等专业问答；企业私有语料适配；让模型学会行业术语与流程。

SFT（Supervised Fine-Tuning）：监督微调（用标注数据微调） 是什么：用“输入-标准答案”样本继续训练，让模型学会按你想要的风格和格式回答。 应用场景：客服话术统一、企业知识问答、固定格式输出（如JSON）、让模型更“听指令”。

LoRA / PEFT：低秩适配 / 参数高效微调（只训练少量参数） 是什么：不改全量参数，只训练少量新增/关键参数（如低秩适配器），显存和算力开销更低。LoRA 是 PEFT 的代表方法。 应用场景：资源有限时做领域适配；同一个底模做多个轻量“插件化”版本（不同部门/任务各一个 LoRA）；快速迭代实验。

压缩优化 降低模型体积和计算开销的优化

量化 指的是：把模型里的数值（权重、激活值）从高精度表示（如 FP32/FP16）转换成低精度表示（如 INT8、INT4），从而减少显存占用和计算开销。 可以类比成图片压缩： 原图超清（细节多、体积大） 压缩图稍微糊一点（细节少一点、体积小很多） 模型也是一样： 好处：更省显存、更快、成本更低 代价：可能有一点点精度下降（回答偶尔没那么稳） 应用场景:  大模型部署跑不动时  显存不够放 FP16 模型，就量化到 8bit/4bit，让它先“能跑起来”。 本地跑 LLM 个人电脑只有普通显卡或内存有限，4bit/8bit 模型更容易本地运行。 手机/边缘设备实时推理  设备算力弱、电池敏感，量化后速度和功耗更友好。 在线服务高并发降成本  同样硬件能扛更多请求，延迟更低，云算力费用更省。 和蒸馏一起做模型压缩  先把模型“变小”（蒸馏），再“变省”（量化），适合对体积和性能都敏感的场景。

蒸馏 一种模型压缩技术，将大模型（教师模型）的知识迁移到小模型（学生模型）中，从而在保持性能的同时降低模型复杂度和计算成本 含义: 用大模型教小模型，压缩模型体积 作用: 降低部署成本，提高推理速度

模型部署与推理

Inference 是模型上线后“做题/干活”的阶段,上线后执行模型计算 训练：学习知识（改参数） 推理：使用知识（不改参数）

Ollama 一个专注于在本地简单运行大模型的工具。它简化了模型的下载、管理和运行（尤其是量化版模型）， 对个人开发者非常友好 含义: Ollama 本地运行大模型的工具 场景: 离线使用、隐私保护、模型微调测试

vLLM 高性能,高吞吐大模型推理引擎大模型推理引擎，支持PagedAttention

PagedAttention 分页注意力机制（提升长上下文推理效率、节省显存）

ONNX：保证模型表示的一致性（跨框架、跨推理后端）

知识增强与应用层

RAG 检索增强生成。核心思想是让LLM在回答时，先从外部知识库检索相关信息， 再基于这些信息生成答案，以此减少“幻觉”，提高专业性 含义: 检索增强生成，结合外部知识库回答 作用: 解决幻觉问题，支持实时信息 场景：企业知识库问答、客服机器人、基于最新文档回答。

Agentic RAG 这是RAG的进化形态。传统RAG是线性的“检索-生成”， 而Agentic RAG引入了智能体，能够主动规划、多轮检索、动态调用工具，以解决复杂问题 含义: 带“代理决策能力”的 RAG，能自己规划检索步骤、反复查询和调用工具 特性: 动态选择工具、多步推理 场景: 复杂多跳问题、需要先查多源再汇总的任务 智能体增强的 RAG。结合了 Agent 的规划和执行能力与 RAG 的检索增强生成能力，使 AI 能够更自主地进行信息检索、整合和生成，以完成复杂任务

数据与检索

Token / Tokenizer

是什么：Token 是模型处理的最小文本单位；Tokenizer 负责切分文本。 场景：算输入长度、控制成本、避免超上下文。

Embedding/ɪmˈbedɪŋ/

是什么：把文本/图片等映射为向量，便于语义相似度检索。 场景：向量检索、语义搜索、推荐、聚类。

Context Window

是什么：模型一次能看到的上下文长度上限。 场景：长文问答、长对话，需要分块与摘要策略。

向量数据库

用于存储和快速检索“向量嵌入”的专用数据库。它是RAG架构中的核心组件，用于存储从知识库中提取的向量化知识 是什么：专门存向量并做近似最近邻检索的数据库。 场景：RAG 文档召回、相似内容查找。

应用能力

Prompt Engineering

是什么：通过提示词设计引导模型稳定输出。 场景：格式化输出、角色设定、任务拆解、提升可控性。

Function Calling / Tool Use

是什么：让模型按结构化方式调用外部函数/工具（API、数据库、搜索等）。 场景：查天气、下单、查库存、执行自动化流程。

Agent

智能体,它是一个能感知环境、进行决策并执行动作的系统。 在LLM语境下，它通常指能调用工具、具备记忆和规划能力的AI程序 是什么：能感知目标、规划步骤、调用工具并迭代完成任务的智能体。 场景：自动调研、流程自动化、多步骤任务执行。

Skills

是什么：给 Agent 封装的可复用能力模块（如特定检索、解析、部署能力）。 场景：快速组合业务能力，减少重复开发。

OpenClaw (Moltbot / Clawdbot)

是什么：是一款开源的本地化AI智能助手，。 场景：做可扩展 Agent 系统、接入多工具与数据源。 https://docs.openclaw.ai/zh-CN/cli

应用框架

LangChain  一个用于开发基于 LLM 应用程序的框架。它提供了一系列工具、组件和接口， 帮助开发者将 LLM 与其他数据源、工具和 Agent 结合起来，构建复杂的 AI 应用。 是什么：LLM 应用开发框架，强调组件化链路与工具集成, 链式调用LLM。 场景：快速做 RAG、工具调用、Agent原型。

LangGraph 是LangChain库的一部分，它基于图结构来定义和编排智能体的工作流， 特别适合构建包含复杂决策循环、有状态的多智能体系统 LangChain的扩展，用于构建复杂多Agent工作流图 一个用于构建有状态、多 Actor 应用程序的库，通常与 LangChain 结合使用。 它允许创建更复杂的 Agent 工作流和多 Agent 系统。 是什么：基于图状态机的 Agent/工作流编排框架。 场景：复杂多步骤、可回溯、可中断恢复的 Agent 流程。

LlamaIndex

LlamaIndex 一个用于连接 LLM 和外部数据的框架。它专注于数据索引和检索， 帮助 LLM 从各种数据源（如文档、数据库）中获取信息，并用于 RAG 等应用。 是什么：以“数据接入与索引检索”为核心的框架。 场景：构建企业知识库、文档解析及问答、检索质量优化。

Dify

含义: 开源LLM应用开发平台，可视化编排 场景: 低代码构建AI工作流、Agent应用 更偏开发者与私有化/自托管能力，开源属性更强，二次开发灵活。 要可控性、私有部署、可定制：优先看 Dify

Coze

更偏平台化、生态和渠道发布体验（尤其在其生态内接入/分发） 要快速上线、平台生态联动：优先看 Coze

协议与协作

MCP Model Context Protocol，是Anthropic提出的一种标准化协议。 它旨在让任何LLM应用都能以统一、安全的方式轻松连接到外部数据源和工具， 解决应用与工具集成的碎片化问题 含义: Model Context Protocol，模型上下文协议，AI的"USB-C接口" 作用: Anthropic推动的开放标准，连接AI与外部系统

A2A 含义: Agent2Agent Protocol，Google推出的Agent间通信协议 作用: 让不同厂商的Agent能互相协作

未来方向与范式

大模型应用范式 NSP（Next State Prediction）范式

下一状态预测范式。从传统的“预测下一个词”升级到“预测世界下一状态”， 标志着 AI 在掌握时空连续性与因果关系方面的进展。

目前的大语言模型，其最根本的训练目标就是“自回归地预测下一个词”。 工作机制：模型在海量文本数据上进行训练，学习给定上文，下一个最可能出现的词是什么。它本质上是一个极高级的概率模型。 能力涌现：令人惊讶的是，当模型规模足够大、数据足够多时，单纯为了“预测下一个词”这个简单目标，竟然涌现出了理解语法、知识、逻辑、上下文，甚至一定程度的推理和规划能力。 局限性：然而，这种能力是基于文本空间的统计相关性，而非对物理世界的直接理解。它知道“苹果落地”这句话大概率跟在“牛顿看到”后面，但它并不真正理解“万有引力”。这就是所谓的“世界知识贫乏”问题。

预测下一个词： 处理的对象是“词”这个符号。模型学习的是符号与符号之间的关系。 可以基于“如果A，通常紧接着B”的统计相关性。但这可能是虚假相关（如“公鸡打鸣”和“太阳升起”）。 预测世界下一状态： 处理的对象是世界的“状态”。这包括物体的位置、速度、形状、颜色、关系，以及物理规律（如重力、惯性、碰撞）、因果逻辑（如按下开关，灯亮）等。 示例：一个物体被抛出去，下一状态是什么？AI需要预测它的运动轨迹。这要求AI理解物体、空间、时间和力。 必须建立因果模型。要预测一个球撞倒另一个球后的状态，AI必须理解“碰撞”这个因，是如何导致“被撞球运动”这个果的。这迫使AI学习世界的因果结构，而非表面关联。

预测下一个词”是手段，是当前阶段最有效的“代理任务”，它让AI在语言的海洋中学会了关于世界的大量统计知识。 “预测世界下一状态”是目的，是AI从“鹦鹉”走向“科学家”的关键。它要求AI不仅要学会语言的语法，更要学会物理的语法、因果的语法、时空的语法。 目前的前沿研究，如世界模型、具身智能、视频生成（如Sora尝试通过生成视频来隐式学习物理规律）等，本质上都是在探索如何让AI学会“预测世界下一状态”。Sora之所以引起巨大震动，就是因为它生成的视频，展现出了对物体 permanence、重力、光影等世界基本规律的某种“理解”，尽管这种理解还远不完美。 AI正在从前者向后者艰难而激动人心地跨越。前者是它的训练方式，后者是它正在学习的能力，也是评判它是否真正“智能”的更高标准。

Agentic AI

指具备目标驱动、多步骤规划和自我适应能力的智能体系统

是AI Agent的更高级形态，强调自主性。

AGI（通用人工智能）：AI 的 “终极目标”—— 具备人类级智慧，能做任何人类能做的事（做饭、编程、科研），目前还在理论阶段；

ASI（超级人工智能）：比人类智慧还强的 AI，目前仅存在于设想中。

Mamba /ˈmæmbə/ 一种新型的序列模型架构，被视为Transformer的潜在竞争者。 它采用选择性状态空间模型，在处理超长序列时可能具有更高的效率。 新型架构，解决Transformer长序列计算复杂度问题 线性复杂度，适合超长文本处理

任务方向

NLP (Natural Language Processing) 自然语言处理 是人工智能领域的一个分支，专注于使计算机能够理解、解释、生成和处理人类语言。

多模态

AI能统一处理和理解文本、图像、语音、视频等多种信息形式。2025年已走出演示阶段，生成视频质量接近电影水平。

是迈向更通用AI的关键，相关大模型如Sora、 CLIP、Flamingo

框架

TensorFlow：Google 推出的深度学习框架

PyTorch：常用深度学习框架, 更灵活的动态图框架

JAX：Google 的高性能数值计算/自动微分框架(Google新框架)

https://developer.jdcloud.com/article/4429

Venn图

AI 技术的核心逻辑可概括为 “从数据找规律到落地实用” 的递进过程，本质简洁且层层聚焦： 核心是让机器从数据中学习规律 —— 机器学习是基础 “找规律”，深度学习是 “多层递进找规律”，大模型则是 “海量数据 + 多层架构” 的高效找规律。具体通过四层实现： 基础层：机器学习让机器 “从数据中找规律”，神经网络是实现这一目标的 “骨架”； 进阶层：Transformer 架构 + 注意力机制让机器 “高效找规律、记重点”，解决长文本、高难度任务； 优化层：量化、蒸馏、微调、MOE 等技术让机器 “变小、变快、变便宜”，适配更多场景； 应用层：大模型（如 ChatGPT、DeepSeek）是最终成果，直接服务于日常聊天、办公、编程等需求。

能力层级：`AI -> ML -> DL -> LLM`。  讲工程链路：`预训练 -> 对齐 -> 微调 -> 压缩 -> 部署`。  知识增强：`Embedding -> 向量数据库 -> RAG -> Agentic RAG`。  协作生态：`MCP` 让模型接外部系统，`A2A` 让 Agent 彼此协作。