2026人工智能大厂学习路线
2026-01-17 01:35:52 0 举报
AI智能生成
大厂学习路线
作者其他创作
大纲/内容
AI必备基础
python基础
1、Python快速入门
2、科学计算库-Numpy
3、数据分析处理库-Pandas
4、可视化库-Matplotlib
5、可视化库-Seaborn
AI应用数学
1、高等数学基础
2、微积分
3、泰勒公式与拉格朗日
4、性代数基础
5、征值与矩阵分解
6、随机变量
7、概率论基础
8、核函数变换
9、熵与激活函数
10、回归分析
11、假设检验
12、相关分析
13、方差分析
14、聚类分析
15、贝叶斯分析
AI核心算法
机器学习
机器学习算法
1、线性回归算法
2、逻辑回归算法
3、聚类算法
4、决策树
5、随机森林算法
6、集成算法
7、支持向量机
8、神经网络算法
9、贝叶斯算法
10、关联规则算法
11、词向量word2vec模型
12、线性判别分析降维算法
13、隐马尔科夫模型
14、HIIM应用实例
机器学习项目
1、随机森林气温预测实战
2、贝叶斯新闻分类实战
3、音乐推荐系统实战
4、时间序列预测(股价)
5、京东用户购买意向预测
6、酒店推荐系统
7、某商品销售额预测
8、绝地求生分析与建模
9、银行客户还款预测
10、快手活跃度预测
11、工业化生产预测
12、智慧城市时间预测
13、医学糖尿病数据预测
14、新闻关键词抽取模型
15、人口普查收入预测
16、音乐推荐系统实战
17、基于统计分析的电影推荐
18、python金融分析与量化交易实战
深度学习
深度学习算法
1、基础神经网络
2、卷积神经网络CNN
3、循环神经网络RNN
4、Transformer系列算法
5、PyTorch系列算法
6、生成模型系列
7、自编码器系列
8、深度强化学习系列
9、图神经网络GNN
深度学习项目
1、神经网络识别实战
2、图像增强相关实战
3、迁移学习实战
4、CNN应用文本分类实战
5、时间序列预测实战
6、Transformer实战系列
CV计算机视觉
Opencv图像处理框架实战
1、课程简介与环境配置
2、图像基本操作
3、阈值与平滑处理
4、图像形态学操作
5、图像梯度计算
6、边缘检测
7、图像金字塔与轮廓检测
8、直方图与傅里叶变换
9、信用卡数字识别
10、文档扫描OCR识别
11、图像特征-harris
12、图像特征-sift
13、全景图像拼接
14、停车场车位识别
15、答题卡识别判卷
16、背景建模
17、光流估计
18、Opencv的DNN模块
19、目标追踪
20、卷积原理与操作
21、疲劳检测
物体检测YOLO系列实战
1、Debug演示物体检测评估指标
2、深度学习经典检测方法概述
3、YOLO-V1整体思想与网络架构
4、YOLO-V2改进细节详解
5、YOLO-V3核心网络模型
6、基于V3版本进行源码解读
7、基于YOLO-V3训练自己的数据集与任务
8、YOLO-V4版本算法解读
9、V5版本项目配置
10、V5项工程源码解读
11、YOLO系列(V7)算法解读
12、V7源码解读
13、YOLO系列(V8)算法源码解读
14、基于Transformer的detr目标检测算法
15、Efficientnet模块解读
16、EfficientDet目标检测框架算法分析
17、EfficientDet源码分析与应用
18、Detr目标检测算法解读
19、Detr源码分析与应用实战
20、YOLO系列(V9)算法源码解读
21、Llava与YOLOv11算法及源码解读
22、YOLOv12引入区域注意力机制
23、YOLOv13超图理论和全流程聚合分发范式
缺陷检测系列实战
1、物体检测框架YOLO-V4版本算法解读
2、物体检测框架YOLO-V5版本项目配置
3、物体检测框架YOLO-V5项目工程源码解读
4、基于YOLOV5的钢材缺陷检测实战
5、Semi-supervised布料缺陷检测实战
6、Opnecv图像常用处理方法实例
7、Opnecv梯度计算与边缘检测实例
8、Opnecv轮廓检测与直方图
9、基于Opnecv缺陷检测项目实战
10、基于视频流水线的Opnecv缺陷检测项目
11、图像分割deeplab系列算法
12、基于deeplabV3+版本进行VOC分割实战
13、Deeplab铁质材料缺陷检测与开源项目应用流程
图像分割实战
1、图像分割及其损失函数概述
2、卷积神经网络原理与参数解读
3、Unet系列算法讲解
4、unet医学细胞分割实战
5、U2NET显著性检测实战
6、deeplab系列算法
7、基于deeplabV3+版本进行VOC分割实战
8、医学心脏视频数据集分割建模实战
9、分割模型Maskformer系列
10、Mask2former源码解读
11、物体检测框架-MaskRcnn项目介绍与配置
12、MaskRcnn网络框架源码详解
13、基于MASK-RCNN框架训练自己的数据与任务
AI论文实验MMLAB实战系列
1、MMCV安装方法
2、分类任务基本操作
3、训练结果测试与验证
4、模型源码DEBUG演示
5、使用分割模块训练自己的数据集
6、基于Unet进行各种策略修改
7、分割任务CVPR最新Backbone设计及其应用
8、mmdet训练自己的数据任务
9、DeformableDetr物体检测源码分析
10、DeformableDetr算法解读
11、Mask2former源码解读
12、KIE关键信息抽取与视频超分辨率重构
13、DBNET文字检测
14、ANINET文字识别
15、KIE基于图模型的关键信息抽取
16、stylegan2源码解读
17、BasicVSR++视频超分辨重构源码解读
18、多模态3D目标检测算法源码解读
19、模型蒸馏应用实例
20、模型剪枝方法概述分析
21、mmaction行为识别
22、OCR算法解读
23、在源码中加入各种注意力机制方法
视觉行为识别实战
1、slowfast算法知识点通俗解读
2、slowfast项目环境配置与配置文件
3、slowfast源码详细解读
4、基于3D卷积的视频分析与动作识别
5、视频异常检测算法与元学习
6、CVPR2021视频异常检测论文及其源码解读
7、基础补充-Resnet模型及其应用实例
目标追踪与姿态估计实战
1、姿态估计OpenPose系列算法解读
2、OpenPose算法源码分析
3、deepsort算法知识点解读
4、deepsort源码解读
5、YOLO-V4版本算法解读
6、V5版本项目配置
7、V5项目工程源码解读
Transformer实战系列
1、Transformer算法解读
2、视觉Transformer及其源码分析
3、Transformer在视觉中的应用VIT算法
4、VIT算法模型源码解读
5、swintransformer算法原理解析
6、swintransformer源码解读
7、基于Transformer的detr目标检测算法
8、detr目标检测源码解读
9、DeformableDetr算法解读
10、DeformableDetr物体检测源码分析
11、MedicalTrasnformer论文解读
12、MedicalTransformer源码解读
13、商汤LoFTR算法解读
14、局部特征关键点匹配实战
15、分割模型Maskformer系列
16、Mask2former源码解读
17、BEV特征空间
18、BevFormer源码解读
19、时间序列预测
20、Informer时间序列源码解读
21、Huggingface与NLP(讲故事)
图神经网络实战
1、图模型应用领域分析概述
2、图神经网络GNN原理与架构解读
3、图卷积GCN模块构建与效果
4、图神经网络框架PyTorch-Geometric安装与配置
5、图神经网络框架PyTorch-Geometric应用实战
6、使用PyTorch-Geometric搭建自己的图数据集
7、图注意力机制与图序列网络模型解读
8、图神经网络时间序列预测实战
9、图相似度计算与匹配算法解读
10、化学分子相似度计算匹配实战
11、基于图模型的轨迹估计
12、图模型轨迹估计实战
13、异构图神经网络
无人驾驶深度学习实战
1、深度估计算法及其原理解读
2、深度估计项目实战源码解读
3、车道线检测论文及其算法实现
4、基于深度学习的车道线检测项目实战
5、特征点匹配方法原理与论文分析
6、商汤最新特征点匹配算法实战
7、三维重建算法原理分析
8、TSDF方法应用与解读
9、商汤最新三维重建项目原理与源码解读
10、人体三维重建项目实战
11、NeuralRecon算法解读
12、NeuralRecon项目环境配置
13、NeuralRecon项目源码解读
14、轨迹估计算法与论文解读
15、轨迹估计预测实战
16、特斯拉无人驾驶解读
行人重识别实战
1、行人重识别原理及其应用
2、基于注意力机制的ReId模型论文解读
3、基于Attention的行人重识别项目实战
4、AI2025顶会算法精讲
5、基于行人局部特征融合的再识别实战
6、旷视研究院最新算法解读(基于图模型)
7、基于拓扑图的行人重识别项目实战
8、额外补充:行人搜索源码分析
对抗生成网络实战
1、对抗生成网络架构原理与实战解析
2、基于CycleGan开源项目实战图像合成
3、stargan论文架构解析
4、stargan项目实战及其源码解读
5、基于starganvc2的变声器论文原理解读
6、starganvc2变声器项目实战及其源码解读
7、图像超分辨率重构实战
8、基于GAN的图像补全实战
9、基础补充-PyTorch卷积模型实例
10、基础补充-Tensorflow2版本卷积模型实例
3D点云实战
1、3D点云应用领域分析
2、3D点云PointNet算法
3、PointNet++算法解读
4、Pointnet++项目实战
5、点云补全PF-Net论文解读06.点云补全实战解读
6、点云配准及其案例实战
7、基础补充-对抗生成网络架构原理与实战解析
NLP自然语言处理
NLP经典案例实战
1、NLP常用工具包实战
2、商品信息可视化与文本分析
3、贝叶斯算法
4、新闻分类任务实战
5、HMM隐马尔科夫模型
6、HMM工具包实战
7、语言模型
8、使用Gemsim构建词向量
9、基于word2vec的分类任务
10、NLP-文本特征方法对比
11、NLP-相似度模型
12、LSTM情感分析
13、机器人写唐诗
14、对话机器人
NLPHuggingface系列实战
1、Huggingface与NLP介绍解读
2、Transformer工具包基本操作实例解读
3、ransformer原理解读
4、BERT系列算法解读
5、文本标注工具与NER实例
6、文本预训练模型构建实例
7、GPT系列算法
8、GPT训练与预测部署流程
9、文本摘要建模
10、图谱知识抽取实战
11、补充Huggingface数据集制作方法实例
NLP通用框架-BERT实战
1、自然语言处理通用框架BERT原理解读
2、谷歌开源项目BERT源码解读与应用实例
3、基于BERT的中文情感分析实战
4、基于BERT的中文命名实体识别实战
5、必备基知识点-word2vec模型通俗解读
6、必备基础-掌握Tensorflow如何实现word2vec模型
7、必备基础知识点-RNN网络架构与情感分析应用实例
8、医学糖尿病数据命名实体识别
知识图谱实战系列
1、知识图谱介绍及其应用领域分析
2、知识图谱涉及技术点分析
3、Neo4j数据库实战
4、使用python操作neo4j实例
5、基于知识图谱的医药问答系统实战
6、文本关系抽取实践
7、金融平台风控模型实践
8、医学糖尿病数据命名实体识别
语音识别实战系列
1、seq2seq序列网络模型
2、LAS模型语音识别实战
3、starganvc2变声器论文原理解读
5、starganvc2变声器源码实战
6、语音分离ConvTasnet模型
7、ConvTasnet语音分离实战
8、语音合成tacotron最新版实战
推荐系统实战系列
1、推荐系统介绍及其应用
2、协同过滤与矩阵分解
3、音乐推荐系统实战
4、知识图谱与Neo4j数据库实例
5、基于知识图谱的电影推荐实战
6、点击率估计FM与DeepFM算法
7、DeepFM算法实战
8、推荐系统常用工具包演示
9、基于文本数据的推荐实例
10、基于统计分析的电影推荐
11、基于相似度的酒店推荐系统
Agent(LLM智能体)
COZE智能体搭建实战
1、COZE智能体搭建框架基本使用
2、COZE打造资料搜集与报告整理智能体
3、COZE结合飞书表格办公
4、文案(小红书笔记)生成智能体搭建方法
5、COZE发票助手
6、COZE邮件助手
AutogenStudio(本地化智能体)
1、autogen框架实战
2、部署与进阶应用实战
3、METAGPT框架解读
4、结合GPT打造自己领域专属客服
知识库与应用拓展
1、RAGFLOW本地化知识库
2、RAG检索架构分析与应用
3、斯坦福AI小镇架构与项目解读
本地大模型微调
1、llama3应用实战
2、llama3微调-量化-部署
应用拓展分析
1、计算机视觉项目实例
2、数据挖掘项目流程实例
3、自然语言处理项目流程
4、MOE多专家系统
5、OPENAI-LLM模型优化总结
强化学习与机器人
强化学习系列
1、强化学习简介及其应用
2、PPO算法与公式推导
3、PPO实战-月球登陆器训练实例
4、Q-learning与DQN算法
5、DQN算法实例演示
6、DQN改进与应用技巧
7、Actor-Critic算法分析(A3C)
8、用A3C玩转超级马里奥
9、CLIP系列解读
10、Diffusion模型解读
11、Dalle2及其源码解读
12、融合强化学习与机器人训练原理、架构、部署
强化学习机器人
1、融合强化学习与机器人训练原理架构、部署
2、强化学习的基础原理与常见算法(Q-Learning、DQN、PPO等)
3、常用的强化学习库及仿真环境(Stable-baselines3、Gym等)
4、强化学习在机器人控制、游戏AI等场景中的应用
5、强化学习算法的代码实现细节及训练过程
6、强化学习在新兴领域中的前沿应用与改进方向
7、探索未来的研究方向:多智能体协作与强化学习的结合
8、人形机器人模仿学习
人形机器人模仿学习范式
什么是模仿学习
人行机器人与模仿学习基础
案例:宇树人形机器人模仿学习案例
人形机器人实战,具备类人形态(头部、躯干、四肢)和运动能力,结合传感器(视觉、触觉等)、运动控制算法和 AI 决策系统,可实现自主行走、抓取物体、环境交互甚至复杂任务执行。
人形机器人模仿学习范式复现与实操
Mujoco和机器人基本知识介绍
模仿环境配置与代码讲解
复现实操
深度学习模型部署与剪枝优化实战
1、PyTorch框架部署实践
2、YOLO-V3物体检测部署实例
3、docker实例演示
4、tensorflow-serving实战
5、模型减枝-NetworkSlimming算法分析
6、模型减枝-NetworkSlimming实战解读
7、Mobilenet三代网络模型架构
8、基础补充-PyTorch卷积模型实例
9、基础补充-Tensorflow2版本卷积模型实例
11、AIoT人工智能物联网之认识 jetson nano
12、AIoT人工智能物联网之AI 实战
13、AIoT人工智能物联网之NVIDIA TAO 实用级的训练神器
14、AIoT人工智能物联网之deepstream
多模态与大模型
微调大模型
1、强化学习(RL)技术
2、预训练大模型( LLM、视觉模型)优化
多模态
1、多种数据类型处理(文本、图像、音频、视频、3D 点云等)
2、多模态跨模态交互技术实现
3、MLLM基础构成,拓展延伸
4、多模态大模型工具与平台
大模型框架
1、LangChai开源框架,用于简化大语言模型(LLM)与外部工具(数据库、API、搜索引擎等)的集成,支持构建复杂的 LLM 应用等
2、Langraph聚焦于构建 “有状态” 的多智能体(Agent)协作系统,支持更复杂的多步骤协作任务
大模型
1、视觉分割大模型SAM,EfficientSam SAM2系列
2、多模态大模型Cogvideo算法与源码解读
3、大模型微调llama-factory实例解析
4、Deepseek介绍与全球大模型技术发展格局和趋势
5、本地知识库RAGFLOW的搭建与应用
模型部署
1、服务器与云计算资源的选择与配置
2、AI模型的本地化部署
3、基于大模型及RAG的本地知识库部署
4、线上环境中的模型监控与性能优化
5、模型部署后的故障排查与迭代
RAG赋能大模型
1、langchain助攻RAG
AI的本质和模型结构演变
学习和AI对话,提示词工程
提示词具象化应用:RAG
RAG全解
案例:RAG实战
2、langraph建立旅游资讯agent
Agent主要设计概要
langraph框架
案例:使用langraph构建旅游资讯Agent
CV与NLP经典大模型解读
1、GPT系列算法解读
2、GPT2训练与预测部署流程
3、openai-dalle2论文解读
4、视觉自监督BEIT算法解读
5、视觉自监督任务BEITV2论文解读
6、视觉自监督任务BEITV2源码解读
7、BEV感知特征空间算法解读
8、BEVformer项目源码解读
9、视觉大模型基础-deformableAttention
10、LLM与LORA微调策略解读
11、LLM下游任务训练自己模型实战
12、视觉大模型SAM
13、视觉QA算法与论文解读
14、扩散模型diffusion架构算法解读
15、openai-dalle2论文解读
16、openai-dalle2源码解读
17、斯坦福AI小镇架构与项目解读
18、CVPR2024:EfficientSam
19、CVPR2024:YOLO- World
20、time-llm大模型多模态预测任务
21、llama3微调,量化,部署流程
22、智能体解读
23、Agent应用实战
新版更新(CV实战篇)
计算机视觉基础与卷积原理
1、任务体系与发展历程
2、图像数学基础:像素、张量与颜色空间
3、卷积本质:局部感受野与特征提取
经典CNN架构演进与深层网络
1、经典CNN结构:AlexNet→VGG→CoogLeNet
2、Residual Learning与深层网络(ResNet)
3、代轻量化CNN:MobileNet、shuffleNet
模型优化、数据与范式转变
1、正则化、归一化与优化 (BN、LN、 Dropout Adamw)
2、数据增广、偏差与质量管理
视觉学习范式的演变
1、特征表示与对比学习基础
2、范式转变:从判别式到生成式
Transformer革命与核心任务重构
1、ViT诞生:从卷积到自注意力
2、视觉Transformer家族:swin、ConvNeXt
3、视觉框架里程碑:DETR
通用视觉任务的现代解法
1、目标检测:边界框、loU、Anchor-Free思想
2、分割任务:语义/实例/全景统一逻辑
3、视频视觉理解:时序建模与表征
4、三维视觉:深度、点云与NeRF概念
AR新零告:美瞳虚拟试戴系统
1、Mediapipe面部关键点检测与追踪
2、图像融合与颜色匹配算法
3、实时视频流处理与集成
互动娱乐:人体体感游戏系统
1、Mediapipe人体姿态检测与提取
2、姿态映射与交互逻辑状态机
智能视频编辑:视频分割与特效系统
1、SAM模型原理与应用
2、视频处理流水线与编解码优化
3、视频特效合成与渲染
数字人文:古书智能修复系统
1、古籍国像区域识别与智能分割
2、端到端修复系统整舎
工业视觉:玻璃印D刷体异常检测系统
1、Anomalib异常检测框架搭建
2、产线环境集成与性能优化
新版更新(LLM实战篇)
大模型架构演进与工程化基础
1、架构生态论
2、程化落地实践
高级推理范式与system 2思维
1、链式思维(CoT)进阶
2、思考模型解析
MoE混合专家模型架构深度解析
1、稀疏激活机制详讲
2、SOTA模型架构精汥
基础认知与轻量化微调实战
1、手微调0.6B小模型
2、训练模型架构分类
3、训练模型架构分类
核心原理与LLaMA2从零构建
1、构建三阶段:pretrain、SFT与RLHF
2、手写核心组件(ROPE/SwiCLU/RMSNorm)
3、BPE分词器原理与从零训练
训练工程化与性能优化策路
1、大模型训练标准流程
2、有监督微调
视觉基础模型与多模态对齐
1、统一视觉基础模型(VFM):DINOV2、SAM、SegGPT
2、视觉与语言对齐:从对比学习到CLIP
3、跨模态表示与图生文:BLIP/BLIP2
视觉大模型与智能推理
1、视觉指令微调:LLaVA/Qwen-VL原理
2、跨模态Transformer统一建模:TACMI
3、开放词汇检测(OVD):YOLO-Word /CLIP
4、多模态涌现能力:推理、理解、指令遵循
参数高效微调(PEFT)高阶策略
1、LORA变体全景解析
2、垂直领域微调实战
模型对齐:从RLHF到DPO
1、RLHF完整流水线
2、DPO直接偏好优化
下一代检索增强生成
1、CraphRAG与混合检索
2、企业级RAG架构设计
垂直领域实战应用与RAG系统
1、进阶应用:数据工程与RAG系统
2、垂直领域落地:医疗CPT行业实
新版更新(科研+部署篇)
RT-DETR架构解析与大图推理适配
1、遥感影像大图分块推理与坐标还原
2、Hybrid Encoder适配与高分辨率特征融合
3、端剄端检测机制与Baseline搭建
小目标检测增强与Quey机制创
1、尺度感知与密度感知Query设计
2、高分辨率特征通路与细节保持
特征金字塔重构与模型轻量化
1、轻量级金字塔(Lite-FPN)设计
2、Transfommer压缩:量化、剪枝与低秩注意力
3、边缘设备加速:TensorRT/ONNX部署
研实验设计与论文全流程
1、创新点提炼与消融实验设计
2、论文故事线构建(Motivation到Method)
3、标期刊选择(TCRS/ISPRS)与写作规
医疗时序基础与经典统计模型
1、趋势性、季节性与噪声特征分析
2、AR/MA/ARIMA模型原理与流程
3、关键影响因素识别与预处理
生成式应用:VAE数据增强与合成
1、VAE原理:编码器、解码器与潜在空间
2、医学图像/时序数据生成与样本合成
场景落地、可视化与商业化
1、医疗场景(急诊/慢病/疫情)分析策略
2、临床决策支持可视化设计
3、商业化路径与概念验证
收藏
收藏
0 条评论
下一页