AI人工智能实战课-大纲
2025-11-07 23:17:49 0 举报
AI智能生成
人工智能深度学习实战课-大纲,可以定制学习
作者其他创作
大纲/内容
1. AI必备基础
1. Python快速入门
1. 开发环境搭建
2. 基础语法与编程思维
3. 核心数据结构
4. 程序流程控制与函数
5. 综合实战与外部世界交互
2. AI概念与认知
1. 人工智能核心概念
2. AI各领域间的逻辑关系
3. AI体系结构与发展脉络
4. AI应用场景
5. AI未来趋势与思考
3. AI开发环境搭建
1. 硬件与系统环境
2. 驱动与加速库
3. Python开发环境
4. AI框架与生态
5. 无GPU的AI开发替代方案
4. AI数学基础
1. 线性代数
1. 标量向量矩阵和张量
2. 线性空间与运算
3. 范数
4. 特征分解
5. 奇异值分解
6. 向量相似度的度量
7. 神经网络前向传播
2. 概率与统计
1. 概率统计基础
2. 随机变量
3. 概率分布
4. 朴素贝叶斯
5. 极大似然估计
6. 期望值最大化
7. 概率图模型
3. 微积分与优化
1. 微积分基础
2. 梯度下降优化
3. 神经网络反向传播
4. 损失函数
5. 最小二乘法参数估计
2. AI核心算法
1. ML机器学习
1. 核心算法
1. 基本概念
2. 线性回归
3. 逻辑回归
4. 数据预处理
5. 模型评估
6. 性能度量
7. 相似度的度量
8. 损失函数
9. 参数估计与优化
10. 决策树与随机森林
11. 神经网络模型
12. SVM支持向量机
13. 特征选择与降维
14. 集成学习
15. 聚类
16. 强化学习
17. 半监督学习
18. 迁移学习
19. 增量学习
2. 实战项目
1. 红楼梦文本分析
2. 新闻分类
3. 量化交易与金融分析
4. 金融欺诈检测
5. 商品价格预测
6. 电量消费预测
7. 泰坦尼克号存活率预测
8. 电影推荐系统
9. 广告点击率预测
10. 顾客行为预测
11. 产品销量预测
12. 异常检测与可视化
13. 高斯混合模型复杂数据建模
14. 贝叶斯准则选择GMM成分数量
15. 稀疏编码应用
2. DL深度学习
1. 核心网络原理
1. 传统BP神经网络
2. 卷积神经网络CNN
3. 自编码器AE
4. 循环神经网络RNN
5. 生成对抗网络GAN
6. Transformer架构
7. 扩散模型Diffusion
8. 图神经网络GNN
9. 深度强化学习DeepRL
10. 概率与能量模型EBM
11. 推荐系统深度架构RS
12. 多模态模型架构MM
13. 状态空间模型SSM
14. 频域与隐式模型FIM
2. 落地实战项目
1. 基础视觉分类实战
2. 图像增强与模型性能提升
3. 迁移学习快速建模
4. YOLO 系列目标检测实战
5. 实例分割与交互式分割
6. 文本分类与文本表示
7. 时间序列建模
8. Transformer 综合实战
9. 模型部署
3. CV计算机视觉
1. OpenCV开发
1. 基础操作
1. 图像视频基本操作
2. 图像融合与颜色空间
3. 透视变换与仿射变换
4. 形态学操作与边缘检测
5. 图像二值化与形状检测
6. 图像频域变换与滤波
7. 角点与特征点检测
8. 运动检测与前景分割
9. 相机标定与畸变矫正
2. 实战项目
1. 视线检测与实时跟踪
2. 基于视频的心率实时检测
3. 医学图像增强
4. 眼镜实时检测
5. 耳朵检测
6. 视频中图像和视频片段的提取
7. 结合cvzone库各种复杂视觉应用
8. 背景建模
9. 简易安防系统
10. 光流法运行检测
11. 驾驶员监控系统
2. scikit-image视觉库
1. 基础操作
1. 图像读取与基本操作
2. 图像滤波与去噪
3. 图像增强与直方图处理
4. 边缘检测与特征提取
5. 图像阈值化与分割基础
6. 形态学图像处理
7. 连通域分析
8. 几何变换与空间操作
9. 特征点与角点检测
2. 实战项目
1. 工业表面缺陷检测
2. 医学图像肿瘤区域分割
3. 农业植物病害识别
4. 工业零件尺寸检测
5. 卫星遥感图像分割
6. 食品质量检测
7. 文档图像增强与版面检测
8. 工业焊缝检测
9. 显微图像细胞计数
10. 道路裂缝检测
3. PyTorch基础
1. 张量
2. 数据集与数据加载
3. 变换
4. 构建神经网络
5. 梯度优化
6. 调参
7. 保存与读取模型
8. 数据加载、训练、预测的基本过程
9. torch.nn 详解
10. 理解 requires_grad、retain_grad、Leaf/Non-leaf Tensor
11. 可视化:TensorBoard 与 FashionMNIST
12. 数据加载性能优化
13. 可视化梯度
4. 图像分类
1. 商品与零售领域
1. 服饰图片经典分类
2. 线上商品审核
2. 金融与数据智能
1. 股票走势曲线分类与优化
3. 安全与身份识别
1. 图像分类实现人脸活体检测
4. 农业与食品检测
1. 水果类别不平衡分类解决方案
5. 医疗与生命科学
1. 皮肤病分类
2. 医学图像病灶识别
6. 工业制造与质检
1. 电子元件识别
2. 装配过程监控
7. 交通与出行
1. 车辆识别
8. 常见问题与解决方案
1. 如何根据应用场景选择分类模型
2. 数据不足
3. 类别数量不平衡
4. 模型过拟合
5. 模型收敛慢或不稳定
6. 模型准确率高但泛化差
7. 数据噪声或标注错误
8. 模型预测可解释性不足
9. 模型部署困难
10. 模型评估指标不全面
5. 目标检测
1. YOLO系列与检测框架
1. 为何YOLOv5是新的突破
2. 运行部署YOLOv5
3. 详解YOLOv5检测案例
4. YOLOv5–YOLOv12技术对比
5. 最新YOLOv12技术详解
6. YOLO12部署与应用案例
2. 行业应用场景实践
1. 公共安全与行为识别
1. 抽烟检测
2. 异常行为检测
2. 医疗健康与生命科学
1. 肺结节检测
3. 工业制造与质量检测
1. 产品缺陷与瑕疵检测
2. 地面裂缝检测
3. 电子元件检测
4. 农业与智能农场
1. 果实计数
2. 病虫害检测
5. 交通与零售
1. 车辆与行人检测
2. 客流量统计
3. 货架商品检测
6. 体育与娱乐媒体
1. 赛事直播实时检测
3. 常见问题与解决方案
1. 检测不准或漏检
2. 训练不收敛
3. 推理速度慢
4. 小目标检测效果差
5. 类别不平衡
6. 姿态估计
1. 姿态估计核心框架与原理
1. MediaPipe库简介
2. MediaPipe用于姿态估计
3. MMPose姿态估计库
4. YOLO系列姿态估计模块
5. MediaPipe、MMPose、YOLO系列姿态估计对比
2. 典型应用场景案例
1. 人机交互与动作分析
1. 手部骨骼点实时检测与追踪
2. 人机交互手势控制
2. 运动与健康监测
1. 健身计数
2. 动作打分
3. 康复训练指导
3. 安全监测与安防识别
1. 工人动作安全检测
2. 入侵检测
3. 摔倒检测
4. 驾驶员监控
5. 异常行为检测
3. 常见问题与解决方案
1. 检测抖动或不稳定
2. 小目标检测困难
3. 模型延迟高
4. 多人姿态检测错误
5. 动作识别误判
7. 图像分割
1. 图像分割技术框架与原理
1. YOLO系列用于图像分割
2. SAM系列用于图像分割
3. 医学图像分割大模型
4. 其他各种流行分割模型
2. 行业应用场景案例
1. 医疗健康领域
1. 医学图像器官与肿瘤分割
2. 病灶变化跟踪
2. 交通与城市基础设施
1. 道路场景理解
2. 卫星遥感影像分析
3. 工业与制造业
1. 基于分割的产品质检
2. 仓库货品拣选
4. 农业与自然生态
1. 农作物生长检测
2. 地表变化检测
5. 娱乐与多媒体应用
1. 视频高质量抠图应用
2. 人像抠图
3. 增强现实沉浸式互动
3. 常见问题与解决方案
1. 边界模糊或分割不精确
2. 模型训练数据不足
3. 小目标分割困难
4. 分割速度慢
5. 类别混淆
8. 图像生成
1. 图像生成核心技术与发展脉络
1. AI生成内容(AIGC)的核心技术体系
2. 图像生成三大主流技术对比:GAN、Swin Transformer 与 Diffusion
2. GAN系列生成案例
1. DCGAN人脸生成
2. DCGAN生成不同类型图片
3. 基于GAN的视频换脸
4. 基于GAN的风格迁移
3. Swin Transformer生成案例
1. Swin Transformer图像超分辨率
2. Swin Transformer图像去噪
4. Diffusion扩散模型生成案例
1. Diffusion文生图(Text-to-Image)
2. Diffusion文/图生视频(Text/Image-to-Video)
5. 常见问题与解决方案
1. 生成图像质量不稳定
2. 模型崩溃(Mode Collapse)
3. Diffusion生成速度慢
4. 文生图内容不准确
5. 超分辨率或去噪细节缺失
9. MediaPipe强大视觉库
1. MediaPipe框架概述与系统架构
1. MediaPipe是什么
2. MediaPipe的优势
3. MediaPipe常用组件
2. 人脸识别与表情交互系统
1. 人脸检测与表情识别
2. 多人识别与身份验证
3. 手部与姿态检测的互动应用
1. 手部关键点检测与手势控制
2. 全身姿态识别与动作分析
4. 视觉分割与增强现实应用
1. 人像抠图与背景替换
2. 三维目标检测与增强现实
5. MediaPipe多模态融合与行业实战
1. 语音与视觉联合识别
2. 医疗与工业落地案例
3. 与深度学习模型融合
4. NLP自然语言处理
1. NLP核心基础知识
1. NLP的核心目标与应用场景
2. NLP技术的演进历程
3. 基于规则与统计的早期方法
4. 词向量与上下文表示技术
5. 大规模预训练语言模型
2. NLP实战
1. NLP 工具生态
1. Python 与 NLP 常用开发库
2. 基于 PyTorch 的 NLP 框架与工具
3. HuggingFace 基础与模型调用
2. 基于Python的NLP库经典案例
1. 文本分类:新闻分类与评论分类
2. 情感分析:用户评价与舆情分析
3. 命名实体识别:商品机构地点信息抽取
4. 文本相似度:句子匹配与相似商品推荐
5. 主题建模:LDA 主题分析
6. 词向量构建:Word2Vec 与 Gensim
7. 序列模型:LSTM 文本建模与情绪识别
8. 文本生成:基于语言模型的短文本生成
3. 基于 PyTorch 与 HuggingFace 的 NLP 实战应用
1. Transformer 基础操作与文本处理示例
2. 基于 PyTorch 的 Transformer 模型原理与实现
3. BERT 模型加载与微调流程
4. BERT 中文文本分类应用
5. BERT 中文命名实体识别应用
6. 文本特征表示构建 Word2Vec 与 Token Embedding
7. 文本摘要模型构建与微调
8. 文本相似度模型 Siamese 与 Sentence-BERT
9. 文本生成 GPT 模型推理与示例
10. HuggingFace Datasets 数据处理与评估
4. 知识图谱
1. 知识图谱体系简介:结构组成与典型行业应用
2. 深度学习实体识别:BERT 与 BiLSTM-CRF 方法
3. 关系抽取:基于 BERT 的关系分类与抽取模型
4. 事件抽取:事件要素识别与事件链构建
5. 知识表示学习:TransE、RotatE、ComplEx 等 KG Embedding
6. 图神经网络在知识图谱中的应用:GNN 与 GAT 模型
7. 图数据库构建与查询:Neo4j 建模与可视化
8. 文本到知识的构建流程:自动抽取 Pipeline
9. 基于知识图谱的问答系统:KGQA 应用
10. 行业知识图谱案例:医疗、金融与政务场景
5. 推荐系统
1. 向量召回与双塔模型:DSSM、YouTube DNN、对比学习
2. 序列推荐:GRU4Rec、SASRec、BERT4Rec
3. CTR 建模与特征交叉:Wide&Deep、DeepFM、xDeepFM、DCN v2
4. 注意力与兴趣进化:DIN、DIEN、SIM
5. 图神经网络推荐:NGCF、LightGCN、PinSage
6. 多任务与长期价值建模:ESMM、MMoE、PLE
7. 多模态推荐:图像文本音频融合与 Transformers4Rec
8. 电商首页个性化推荐系统:双塔召回 + DIN/DIEN 排序
9. 短视频多模态内容推荐:SASRec/BERT4Rec + Transformers4Rec
10. 广告点击率预估与转化优化:DeepFM + MMoE/PLE
5. 大模型内部优化
1. 提示词工程
1. 提示词基础设计:角色、任务与场景设定
2. 指令工程:清晰指令、步骤分解与格式规范
3. 示例驱动提示:Few-Shot / One-Shot / Zero-Shot 技术
4. 思维链提示:Chain-of-Thought 与推理增强技巧
5. 自洽性提示:Self-Consistency 与多路径推理
6. 结构化提示:模板化、变量化与伪代码提示
7. 提示词调试与优化策略:错误定位与微调方法
8. 限制与对齐提示:内容边界、角色边界、安全控制
2. 训练微调
1. 大模型训练基础:数据流程、并行策略与优化器选择
2. 预训练数据构建:清洗、对齐、指令化与格式标准化
3. 微调技术体系:全参数微调、Adapter、Prefix Tuning
4. 参数高效微调(PEFT):LoRA、QLoRA 与差分更新方法
5. 大模型对齐训练:SFT、Reward Model 与 PPO 对齐
6. 训练加速与并行:DP、TP、PP、FSDP 与混合精度训练
7. 模型压缩与加速:量化、蒸馏、剪枝与 KV Cache 优化
8. 模型部署方式:本地部署、服务器部署与云端推理服务
9. 推理优化:ONNX、TensorRT、vLLM、FlashAttention 技术
10. 服务化与工程化部署:API 网关、监控、扩缩容与 A/B 测试
11. 阿里Qwen系列开源大模型本地微调与部署应用(通用+多模态)
6. 大模型外部增强
1. 工具调用
1. 工具调用基础:Schema、参数结构与函数设计规范
2. 大模型函数调用机制:OpenAI Function Calling / JSON Mode
3. 多工具调度:工具选择、工具链编排与优先级控制
4. 外部数据访问:调用数据库、搜索服务、内部 API
5. 业务流程执行:CRM 系统自动录入、工单自动生成
6. 文件处理工具:PDF 读取、Excel 分析、文档抽取
7. 代码级工具调用:脚本生成、任务执行与结果回传
8. 工具调用中的安全控制:权限、沙箱与输入限制
9. 错误恢复与重试策略:LLM 的工具调用自我纠错
10. 实战案例:客服自动工单处理系统(LLM + 工具链)
11. 实战案例:财务报表自动生成(LLM + Excel 工具)
12. 实战案例:内部系统自动查询助手(LLM 调用内部 API)
2. RAG检索增强生成
1. RAG 基础概念:检索增强生成的原理与价值
2. 向量库构建:文本切分、Embedding、入库策略
3. 检索算法对比:向量检索、BM25、Hybrid 检索
4. 文档切分优化:Chunk Size、Overlap、语义切分
5. Prompt + RAG 组合策略:上下文注入、检索提示
6. 高级 RAG:多轮检索、重排序(Re-Rank)、信息过滤
7. 企业级 RAG:权限控制、时效性数据、版本一致性
8. RAG 评价体系:检索效果、问答准确率、Hallucination 测试
9. RAG 加速部署:vLLM、FastEmbed、Milvus、FAISS
10. 实战案例:企业知识库问答系统(政策/产品/流程)
11. 实战案例:医疗说明书检索问答系统
12. 实战案例:法律合同检索与条款问答系统
3. Agent智能体
1. Agent 基础架构:Planner、Executor、Memory
2. ReAct 框架:推理 + 行动的智能体决策方式
3. 多工具协作 Agent:任务分解与多步工具执行
4. 工作流 Agent:流程自动化、任务链路闭环执行
5. 任务规划(Task Planning):自动生成行动计划
6. Agent 记忆系统:短期记忆、长期记忆、向量记忆
7. 多 Agent 协同:团队式 Agent、任务分工、信息共享
8. 安全控制:循环问题、幻觉过滤、工具权限管理
9. Agent 部署:API 服务化、异步任务执行、状态管理
10. 实战案例:电商商品上架自动化 Agent(抓取 → 解析 → 发布)
11. 实战案例:运维智能体:日志分析 → 指令执行 → 状态回传
12. 实战案例:销售助理:读取 CRM → 写跟进 → 发邮件
13. 实战案例(结合多模态图像):制造业质检系统:OCR+图像理解自动解析零件铭牌与工序记录
14. 实战案例(结合多模态语音):跨境电商语音客服助手:ASR+NLP 自动生成售后处理记录
收藏
0 条评论
下一页