AI大语言模型技术栈技术路线
2025-10-30 09:59:16 11 举报
这张 AI 大语言模型技术栈技术路线架构图从下到上分为五层。最底层是算力管理层,硬件涵盖 NVIDIA(H100、A100)、AMD(M1350、M1300)、昇腾(910B、910A)等芯片,软件包含 Slurm、Docker、Kubernetes 等,实现资源分配、负载均衡等管理。往上是数据处理和管理层,涉及预训练数据(网页、代码、书籍、论文等分类及语言检测、数据去重等处理)、对齐训练数据(Prompt 与 Responses 交互)、评测数据(从知识能力、安全可信等维度评测)。再上是通用模型层,包含模型训练(预训练、对齐训练,采用 SFT、RLHF 等方法及多种并行技术)、模型部署(动态批处理、算子量化等)、模型评测(OpenEval、UltraEval 等工具)。之后是行业模型层,通用模型经行业数据的领域微调训练、行业对齐训练,完成行业模型部署与评测。最上层是应用层,支持自主规划、工具调用、信息检索、智能客服、图文创作、代码生成等多类应用场景。
作者其他创作
大纲/内容
Pipeline Parallel
910B
算力管理
论文
处理流程
预训练数据
Tensor Parallel
网页
领域微调训练
容错机制
内容过滤
SFT
C
Chatbot Arena
模型量化
模型训练
FlagEval
通用模型
General-purposeModel
智能客服
模型剪枝
行业模型
价值对齐
书籍
行业模型评测
Sequence Parallal
Expert Parallel
评测数据
自主规划
Open LLM Leaderboard
数据去重
领域对齐训练
预训练
Data Parallel
SpecializedModel
Data Processingand Management
应用层
Best of N sampling
Application
A100
D
质量筛选
Responses
模型评测
硬件
Prompt
M1350
910A
H100
……
OpenEval
行业数据
OpenCompass
模型蒸馏
性能监控
代码生成
行业模型部署
弹性扩展
UltraEval
M1300
专业领域
DPO
Zero
RLHF
知识能力
代码
B
版本控制
动态批处理
数据分类
负载均衡
>
图文创作
FlashAttention
对齐训练数据
语言检测
领域分析
安全可信
ComputingManagement
资源分配
工具调用
软件
对齐训练
任务调度
数据处理和管理
算子量化
信息检索
行业对齐数据
模型部署
A
0 条评论
下一页