人工智能实操知识点梳理(三级)
2025-07-14 09:33:28 1 举报
AI智能生成
人工智能实操考试知识点梳理
作者其他创作
大纲/内容
考分分布
考试时长
2小时
模拟考试地址
https://study.inpei.cn/AiTrainerExamNgWeb/#/login
账号为手机号码,密码为身份证号后六位
业务分析 25分(背一些语句)注意,as后双引号,in括号里面 单引,后面[]括号里也是单引号
第一题(背)
SQL语法
数据集名称
直接复制名称到答题区域名称栏目中即可
SQL语句所使用的数据表为:user_record,且将该表别名定义为:r
SELECT * FROM user_record;
1、查询所有字段
2、别名 在table_name 后面空格加上即可,注意与题目大小写保持一致
根据表定义字段名和别名
SELECT r.xm as "username",
r.lx as "type",
r.scrq as"data",
r.cs as"time"
FROM user_record r
r.lx as "type",
r.scrq as"data",
r.cs as"time"
FROM user_record r
1、查找对应字段名
SELECT xm,lx,scrq,cs FROM :user_record r;
2、定义别名,在原字段后面加 空格 加 as 加空格 加 “别名”,注意用英文双引号
3、字段前加 别名. (可加可不加)
所获取的数据范围:类型包括娱乐时事、政治时事、民生时事
SELECT r.xm as "username",
r.lx as "type",
r.scrq as"data",
r.cs as"time"
FROM user_record r
WHERE r.lx IN('娱乐时事','政治时事','民生时事');
r.lx as "type",
r.scrq as"data",
r.cs as"time"
FROM user_record r
WHERE r.lx IN('娱乐时事','政治时事','民生时事');
1、包含某些值 使用 IN 语法
SELECT {*|col_list} FROM table_name WHERE col_name IN(value1,value2,...)
SELECT {*|col_list} FROM table_name WHERE col_name IN(value1,value2,...)
2、col_name 为列名,因此 此内容为 lx(类型)
3、注意in的值用英文单引号,多个值用英文逗号 隔开
第二题(不管)
设计维度和指标列
1、新增维度列分组
直接答题区域点击 【新增层级】,并完成重命名
2、设置字段为维度列,设置分组为基本信息,编辑别名
直接拖字段到对应分组中,注意要按照题目字段顺序进行拖拽,拖拽后进行重命名
3与2一致,4 拖拽到 指标列即可
第三题(不管)
编写过滤条件
1、过滤条件命名
直接复制名称到答题区域名称栏目中即可
2、新增过滤条件
年龄 点击对应字段,并点击编辑,找到[a,b],设置内容即可
访问次数
智能训练 35分(背语句)
第一题 (看)
数据处理规范制定(python)
读取“/studymnt/01/data.csv"的数据集
data = read_csv(‘D:/studymnt/01/data.csv’)
显示前十五行数据
head(15)
显示描述性统计信息
describe
对数据集数据进行预处理,处理缺失值、重复值
删除包含缺失值,dropna
删除重复行,drop_duplicates
知识点
数据清洗与准备
data = read_csv('') #读取csv文件
data.info() #查看数据概况
data.describe() #描述性统计信息
data.shape() #数据规模
data.type() #各字段数据类型
data.head() #默认预览前5行数据,其他在括号中加参数
data.tail() #默认预览后5行数据,其他在括号中加参数
对缺失数据或者重复数据进行处理
data.isnull() #检测出缺失数据
data.dropna(0) #丢弃所有包含缺失值的数据
data.fillna(0) #对缺失值用0填充
data.duplicated() #查询是否存在重复值
data.drop_duplicates() #删除重复值
第二题17 (背)
算法测试
特征标签划分
特征单维
X = data[‘预估薪资’]
y = data[‘是否会购买’]
特征多维
X= data.drop(columns=[‘是否会购买’]) #删除标签剩余多维特征
y=data[‘是否会购买’]
划分训练集和测试集
from sklearn.model_selection import train_test_split
说明 train_test_split函数
注意 from sklearn.model_selection import train_test_split 要写
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=2020)
说明X_train,X_test,y_train,y_test = train_test_split(train_data,train_target,test_size,random_state,shuffle)
train_data是未划分的数据集,替换特征值,train_target是未划分的标签,替换 标签值,test_size是测试占总数据比例,random_state任意指定,shuffle不写默认打乱
定义逻辑回归模型
from sklearn.linear_model import LogisticRegression
这个一般考试会给出,注意要复制到答题区域,其他模型参照此做即可
model = LogisticRegression()
定义模型
model.fit(X_train,y_train)
训练集中训练模型,注意是括号,不是 =
输出测试集的准确度
acc = model.score(X_test,y_test)
注意,测试集是 test,训练是用train,背model.score
print(acc)
输出测试集的预测值
y_test_pred = model.predict(X_test)
print(y_test_pred)
智能系统设计 35(基本不用看)
第一题
设计图表
按题目进行配置即可
注意,配置了过滤筛选条件,记得推拽到对应的区域内
第二题
完善条件
这个看逻辑的,直接选
培训与指导 5(概类流质实)
编写培训大纲
一、数据标注的概述
了解数据标注的定义、行业发展趋势等。
二、数据的标注分类
包括文本标注、图像标注、视频标注、语音标注。
三、数据标注流程及管理
四、数据标注质量管理
五、数据标注实战
0 条评论
下一页