L1阶段总结
2025-07-07 21:53:33 27 举报
AI智能生成
ai学习总结
作者其他创作
大纲/内容
大模型的认知
AI的概念
AI1.0-2.0的变化
基于规则的系统和早期的机器学习算法
推荐算法
以深度学习、大数据和云计算
ChatGPT
大模型的定义
是一种基于机器学习和自然语言处理技术的模型,它通过对大量的文本数据进行训练,来学习服务人类语言理解和生成的能力
注意
对话产品和基座大模型实际上是两个东西
通用人工智能的定义
简称AGI,指的是一种智能,能够理解、学习和应用知识和技能
GPT模型的发展历程
GPT-1
GPT-2
参数1.5亿
GPT-3
1750亿个参数
GPT-3.5
引入人类反馈强化学习(RLHF)
减少有害内容生成,提升对用户意图的理解
GPT-4
国产大模型介绍
通义千问
智谱清言
文心一言
DeepSeek
GPT
Generative Pre-trained Transformer
生成式 预训练 变换模型
ChatGPT 的技术原理
GPT 模型使⽤ Google 几年前推出的 Transformer 架构 来预测下⼀个单词的概率分布
大模型的训练
预训练(Pre-training )
监督微调(SFT,Supervised Fine Tuning )
基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback )
大模型是如何生成内容的?
简单来说就是靠"猜"!
大模型阅读了人类曾说过的所有的话
把一串 token 后面跟着的不同 token 的概率记了下来
当我们给它若干 token,大模型就能算出概率最高的下一个 token 是什么
Token是什么?
Token是模型进行语言处理的基本信息单元
OpenAI中的角色理解
system(系统)
在 OpenAI 的技术框架中,system 代表了整个系统或应用程序。System 的目标是理解用户的意图和需求,并根据这些信息生成合适的响应
user(用户)
user 代表了与系统交互的用户。用户可以是人类用户,也可以是其他系统或应用程序。User 的目标是向 system 发送请求,获取所需的信息或服务
assistant(助手)
assistant 代表了 system 生成的响应。助手可以是文本、语音、图像等形式,其目标是满足用户的请求,提供所需的信息或服务
国产大模型API调用
from openai import OpenAI
from dotenv import load_dotenv
load_dotenv()
import os
deepseek_api_key = os.getenv("DEEPSEEK_API_KEY")
client = OpenAI(api_key=deepseek_api_key, base_url="https://api.deepseek.com")
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "你是小红书文案专家"},
{"role": "user", "content": "Hello"},
],
stream=False
)
print(response.choices[0].message.content)
from dotenv import load_dotenv
load_dotenv()
import os
deepseek_api_key = os.getenv("DEEPSEEK_API_KEY")
client = OpenAI(api_key=deepseek_api_key, base_url="https://api.deepseek.com")
response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "你是小红书文案专家"},
{"role": "user", "content": "Hello"},
],
stream=False
)
print(response.choices[0].message.content)
prompt介绍及常用技巧
什么是提示词(Propmt)
所谓的提示词其实指的就是提供给模型的一个文本片段,用于指导模型生成特定的输出或回答
获得更好结果的6中策略(ChatGPT)
● write clear instructions 编写清晰的说明
● provide reference text 提供参考文本
● split complex tasks into simpler subtasks 将复杂任务拆分为更简单的子任务
● give the model time to think 给模型时间思考
● use external tools 使用外部工具
● test changes systematically 系统地测试更改
● provide reference text 提供参考文本
● split complex tasks into simpler subtasks 将复杂任务拆分为更简单的子任务
● give the model time to think 给模型时间思考
● use external tools 使用外部工具
● test changes systematically 系统地测试更改
提示语策略差异
推理模型
提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)
通用模型
需显式引导推理步骤(如通过CoT提示),否则可能跳过关键逻辑
常用技巧
使用 清晰,明确,避免模糊的词语
角色扮演
告诉用户的角色
指定输出的格式
少样本提示
Prompt 调优
高质量 prompt 核心要点:具体、丰富、少歧义
Prompt 的典型构成
角色
指示
上下文
例子
输入
输出
Prompt进阶
零样本提示
少样本提示
少样本提示的限制
链式思考(思维链COT)
少样本思维链(Few-shot Cot)
零样本COT提示
自我一致性(自洽性)
思维树(Tree-of-thought, ToT)
提示词的安全与防护
常见的提示词攻击技术
同类型目标劫持
跨类型目标劫持
用户提示泄漏
越狱攻击
越狱攻击——模拟对话
越狱攻击——角色扮演
越狱攻击——对立响应
提示词攻击防护方法
基于规则进行过滤
少样本提示
基于模型的内容识别
AI编程
分步实现需求
Coze
Coze介绍
功能
提示词
插件
工作流
图像流
知识库
RAG
数据库
存数据
0 条评论
下一页