Gen AI 工程师学习路径
2025-06-06 10:41:23 0 举报
AI智能生成
GenAI LLM RAG MCP
作者其他创作
大纲/内容
1、基础能力:Coding & ML Fundamentals
编程语言:Python、Bash(必要),Typescript(可选)
Python快速入门与工程化实践
掌握AI开发所需的Python编程能力
Bash命令与自动化脚本
熟悉Shell脚本在部署和运维中的作用
Typescript入门
理解前后端集成场景下的类型安全开发
基础数学:统计学
统计学与数据理解
掌握基础统计知识,支持AI模型分析
机器学习模型基础知识(监督/非监督、分类、回归等)
机器学习模型分类
学会常见ML模型背后的工作原理
2、模型与API基础能力
LLM APIs
LLM 类型(OpenAI, Claude, DeepSeek等)
掌握各类LLM API调用
使用 OpenAI / DeepSeek / Claude 等API
Structured Outputs(结构化输出)
Structured Output 与多模态支持
构建结构化响应与图文/语音结合应用
Prompt 缓存机制
多模态模型(文本+图像+语音)
Model Adaptation
Prompt Engineering 提示词设计
Prompt Engineering 入门与实践
学会构造不同类型的提示词结构
工具调用(Tool Use)
Tool Use 与插件机制解析
理解Agent如何调用外部工具
模型微调(Finetuning)
微调(Finetuning)实战
使用LoRA等方式对模型做领域适配
Storage for Retrieval(RAG 的基础)
向量数据库(如FAISS, pgvector, Weaviate)
向量数据库原理与构建
使用FAISS、Weaviate等管理语义向量
图数据库(如Neo4j)
图数据库与知识图谱
使用Neo4j构建关系型语义检索网络
混合检索(Hybrid retrieval)
混合检索系统设计
实现结构化+语义的双通道RAG
3、智能体与RAG系统构建
AI Agent设计模式(如ReAct, Reflexion)
多智能体系统(Multi-Agent)
智能体设计模式详解
ReAct、Reflexion等智能体结构
多智能体系统开发
构建多Agent协作系统
记忆机制(Memory)
Memory机制实现
构建短期与长期记忆的Agent架构
人类参与机制(Human-in/on-the-loop)
Agent Orchestration框架
LangGraph, CrewAI 等调度工具使用
智能体编排框架(如LangGraph, CrewAI)
Agentic RAG 系统详解
结合检索生成与Agent框架构建完整应用
RAG & Agentic RAG
数据准备(PDF, Word, Web等)
数据检索与生成(Data Retrieval + Generation)
重排序(Reranking)
MCP协议(多组件编排)
MCP 多组件编排协议
构建端到端RAG系统工作流逻辑
LLM编排框架(LangChain等)
4、部署与基础设施
Infrastructure
Kubernetes, 云服务
云服务平台快速部署指南
在阿里云/腾讯云AWS/GCP/Azure上部署AI系统
Kubernetes基础与模型部署
将AI服务容器化与自动伸缩
CI/CD流程
CI/CD与版本控制
自动化部署、回滚与灰度测试
模型路由与部署策略
模型路由策略
动态分发模型请求至最优模型版本
5、监控与评估
Observability & Evaluation
智能体观测能力(Instrumentation)
实现数据采集、指标统计与回溯分析
评估平台(如Trulens, Ragas)
Ragas/Trulens等平台实战使用
评估技术与指标(如BLEU, ROUGE)
构建可追溯的模型质量验证机制
智能体评估流程
6、安全与合规
Guardrails与边界控制
限制LLM输出、保护用户隐私
LLM安全性测试
构建输入输出的测试框架
道德与合规考虑(如偏见、输出风险)
消除偏见,规避社会风险与法律问题
7、未来趋势与扩展能力
Forward-looking Elements
语音与视觉代理(Speech, Vision Agents)
构建语音控制或图像识别智能体
机器人智能体
AI与物理世界的结合实践
终端设备、CLI Agents
实现全自动任务执行型Agent
自动化 Prompt 工程(如AutoGPT)
提升生成式AI提示效率与质量
0 条评论
下一页