首页  思维导图  详情

L1阶段总结

2025-07-07 21:53:33   34  举报





AI智能生成

ai学习总结

综合知识

作者其他创作

大纲/内容

大模型的认知

AI的概念

AI1.0-2.0的变化

基于规则的系统和早期的机器学习算法

推荐算法

以深度学习、大数据和云计算

ChatGPT

大模型的定义

是一种基于机器学习和自然语言处理技术的模型，它通过对大量的文本数据进行训练，来学习服务人类语言理解和生成的能力

注意

对话产品和基座大模型实际上是两个东西

通用人工智能的定义

简称AGI，指的是一种智能，能够理解、学习和应用知识和技能

GPT模型的发展历程

GPT-1

GPT-2

参数1.5亿

GPT-3

1750亿个参数

GPT-3.5

引入人类反馈强化学习（RLHF）

减少有害内容生成，提升对用户意图的理解

GPT-4

国产大模型介绍

通义千问

智谱清言

文心一言

DeepSeek

GPT

Generative Pre-trained Transformer

生成式预训练变换模型

ChatGPT 的技术原理

GPT 模型使⽤ Google 几年前推出的 Transformer 架构来预测下⼀个单词的概率分布

大模型的训练

预训练（Pre-training ）

监督微调（SFT，Supervised Fine Tuning ）

基于人类反馈的强化学习（RLHF，Reinforcement Learning from Human Feedback ）

大模型是如何生成内容的？

简单来说就是靠"猜"！

大模型阅读了人类曾说过的所有的话

把一串 token 后面跟着的不同 token 的概率记了下来

当我们给它若干 token，大模型就能算出概率最高的下一个 token 是什么

Token是什么？

Token是模型进行语言处理的基本信息单元

OpenAI中的角色理解

system（系统）

在 OpenAI 的技术框架中，system 代表了整个系统或应用程序。System 的目标是理解用户的意图和需求，并根据这些信息生成合适的响应

user（用户）

user 代表了与系统交互的用户。用户可以是人类用户，也可以是其他系统或应用程序。User 的目标是向 system 发送请求，获取所需的信息或服务

assistant（助手）

assistant 代表了 system 生成的响应。助手可以是文本、语音、图像等形式，其目标是满足用户的请求，提供所需的信息或服务

国产大模型API调用

from openai import OpenAI
from dotenv import load_dotenv
load_dotenv()
import os

deepseek_api_key = os.getenv("DEEPSEEK_API_KEY")

client = OpenAI(api_key=deepseek_api_key, base_url="https://api.deepseek.com")

response = client.chat.completions.create(
model="deepseek-chat",
messages=[
{"role": "system", "content": "你是小红书文案专家"},
{"role": "user", "content": "Hello"},
],
stream=False
)

print(response.choices[0].message.content)

prompt介绍及常用技巧

什么是提示词(Propmt)

所谓的提示词其实指的就是提供给模型的一个文本片段，用于指导模型生成特定的输出或回答

获得更好结果的6中策略(ChatGPT)

● write clear instructions 编写清晰的说明
● provide reference text 提供参考文本
● split complex tasks into simpler subtasks 将复杂任务拆分为更简单的子任务
● give the model time to think 给模型时间思考
● use external tools 使用外部工具
● test changes systematically 系统地测试更改

提示语策略差异

推理模型

提示语更简洁，只需明确任务目标和需求（因其已内化推理逻辑）

通用模型

需显式引导推理步骤（如通过CoT提示），否则可能跳过关键逻辑

常用技巧

使用清晰，明确，避免模糊的词语

角色扮演

告诉用户的角色

指定输出的格式

少样本提示

Prompt 调优