gpt-知识库-一些图文整理
2024-08-14 11:39:00 0 举报
AI智能生成
gpt-知识库-设计图
作者其他创作
大纲/内容
AI运算
cpu
Central Processing Unit-中央处理器
电脑的心脏,管运算,管调度,管一切
单通道
gpu
Graphics Processing Unit-图形处理器
显卡的心脏,为运算而生
双向100车道
ai可以使用cpu或gpu运算,但是gpu的纯运算能力超出cpu数量级,所以大模型现都是用gpu运算
AIGC - AI Generated Content (AI生成内容 暂无版权概念)<br>UGC(User Generated Content)<br>PGC(Professional user Generated Content)<br>
机器学习&深度学习<br>第一阶段:传统机器学习(Machine Learnin)<br>第二阶段 V1:“深度学习”(Deep Learnin)<br>第二阶段 V2:Google Transformer 模型 2018年(GPT的T)<br>
机器学习
学习策略
模拟人脑工作原理的“符号学习”和“神经网络学习”
基于数学统计分析得机器学习
学习方法
归纳学习
演绎学习
类比学习
分析学习
学习方式
无监督学习(自学)
有监督学习(带老师指导)
强化学习(通过环境奖惩反馈进步)
深度学习
卷积网络(CNN - Convolutional Neural Networks)
循环神经网络(RNN - Recurrent Neural Networks)+递归神经网络(RNN - Recursive Neural Networks)
长短期记忆RNN(LSTM - Long short-term memory)
为了解决 LSTM/RNN 中的一些问题的解决办法加入Attention机制的Transformer框架。
深度学习在计算机视觉(CV、如图像识别)、自然语言处理(NLP)、自动驾驶、机器人控制 等方面比传统机器学习效果更好。
GPT发展之路
GPT1
2018年
1.17亿参数(训练数据)
GPT2
2019年
1.5B参数
GPT3
2020年
175B参数
Chat+GPT3.5
2022年11月
175B(1750亿)参数
同步发布了 Chat for GPT-3.5的对话聊天机器人,引爆全世界
语料采集截止时间为2020年5月
费用
(NVIDIA)的A100型号GPU一万张,目前京东A100的卡销售价格大约为人民币10万元
ChatGPT大概训练算力成本粗略预估为10亿人民币左右
对于ChatGPT公布的数据来看,一次大模型的训练大约需要1200万美元
chatgpt三阶段
阶段一:无监督学习(Unsupervised Learning)
阶段二:监督学习(Supervised Fine-Tune)
阶段三:强化学习(RL - Reinforcement Learning)
GPT4
2023年3月
N倍的参数
语料采集截止时间是2021年9月
chat&gpt简单原理说明
gpt
基于上文生成下一个单词,再把这个单词加入上文,生成下一个,如此往复。 <br>(这也就是为什么ChatGPT 输出内容总是一个字一个字蹦出来的原因)<br>
Generative - 生成下一个词<br>Pre-trained - 文本预训练(互联网各种文字材料)<br>Transformer - 基于Transformer架构
chat
分析用户语义,并将连续对话组装成上下文传递给gpt,告诉gpt,你将这些作为已知条件,然后结合自己的认知,重新组织,告诉我答案
RLHF (Reinforcement Learning from Human Feedback 人类反馈强化学习)
ChatGLM(清华GPT)
鼎源万家方案
商用产品
dify
隐私数据最终会传给gpt
可以建立本地知识库
模型使用chatgpt
收费 功能较为完善 体检较好
体验链接 https://udify.app/chat/iye8tslgmSCIMt1p
钉钉
AI 助理(agent)
ai嵌入钉钉
安排日程
处理待办
工作概览
请假审批
创作与文案
智能绘图
...
个人助理
企业助理<br>
助理市场
特点
连接钉钉用户数据<br>
openapi接口
连接公网系统
连接用户系统
第三方 交通 住宿 购物系统
大模型
不如 gpt3.5?
价格
openai
AI assitant
openapi接口
连接公网系统
连接用户系统
第三方 交通 住宿 购物系统
how work
gpt4 turbo
gpts 应用商店
gpt PLUS<br>
效果较好
限制过多
price
Gemini
用途设想
把保险协议作为知识库
1. 知识问答,比如次免赔额的定义
2. 做统计,比如对于次免赔额有多少种描述,后续方便做标准化
3. 面向客服的辅助工具,快速查询某个客户的保险协议
4. 做文本比对,比如同一个客户2023和2022保险协议的差异
文案工具机器人
结合知识库深度定制化
把代码库导入知识库
辅助编程
代码纠错?
快搜
注释生成?
gpt基础能力
提纲/文案写作
语言生成-交流能力
世界知识-自我学习
评论比较
角色扮演
开源方案
Langchain-Chatchat+自家知识库
支持模型
ChatGLM4模型 本地部署
gpt4
如需本地知识库库 必须要gpu
LangChain
≈chat
本地知识库
将我们多年沉淀的知识库导入,对gpt进行微调<br>导入越多数据,进行越多的训练才能越聪明
支持多种格式
租用云服务器带A10NVIDIA显卡进行调研<br>月费用2-4k不等。 按需租用
gpt4-pdf-chatbot-langchain
仅主要支持pdf
langchain框架
gpt能力
效果不如gpt PLUS
本地知识库 无空间限制
0 条评论
下一页