人工智能实操知识点梳理(三级)
2025-07-14 09:33:28 1 举报
AI智能生成
人工智能实操考试知识点梳理
作者其他创作
大纲/内容
考分分布
考试时长
2小时
模拟考试地址
https://study.inpei.cn/AiTrainerExamNgWeb/#/login
账号为手机号码,密码为身份证号后六位<br>
业务分析 25分(背一些语句)注意,as后双引号,in括号里面 单引,后面[]括号里也是单引号<br>
第一题(背)<br>
SQL语法
数据集名称<br>
直接复制名称到答题区域名称栏目中即可<br>
SQL语句所使用的数据表为:user_record,且将该表别名定义为:r<br>
SELECT * FROM user_record;<br>
1、查询所有字段
2、别名 在table_name 后面空格加上即可,注意与题目大小写保持一致<br>
根据表定义字段名和别名<br>
SELECT r.xm as "username",<br> r.lx as "type",<br> r.scrq as"data",<br> r.cs as"time"<br> FROM user_record r<br>
1、查找对应字段名
SELECT xm,lx,scrq,cs FROM :user_record r;<br>
2、定义别名,在原字段后面加 空格 加 as 加空格 加 “别名”,注意用英文双引号<br>
3、字段前加 别名. (可加可不加)<br>
所获取的数据范围:类型包括娱乐时事、政治时事、民生时事<br>
SELECT r.xm as "username",<br> r.lx as "type",<br> r.scrq as"data",<br> r.cs as"time"<br> FROM user_record r<br> WHERE r.lx IN('娱乐时事','政治时事','民生时事');<br>
1、包含某些值 使用 IN 语法<br>
SELECT {*|col_list} FROM table_name WHERE col_name IN(value1,value2,...)<br>
SELECT {*|col_list} FROM table_name WHERE col_name IN(value1,value2,...)<br>
2、col_name 为列名,因此 此内容为 lx(类型)<br>
3、注意in的值用<font color="#e74f4c">英文单引号</font>,多个值用英文逗号 隔开<br>
第二题(不管)<br>
设计维度和指标列
1、新增维度列分组<br>
直接答题区域点击 【新增层级】,并完成重命名
2、设置字段为维度列,设置分组为基本信息,编辑别名<br>
直接拖字段到对应分组中,注意要按照题目字段顺序进行拖拽,拖拽后进行重命名<br>
3与2一致,4 拖拽到 指标列即可
第三题(不管)
编写过滤条件
1、过滤条件命名
直接复制名称到答题区域名称栏目中即可
2、新增过滤条件
年龄 点击对应字段,并点击编辑,找到[a,b],设置内容即可<br>
访问次数<br>
智能训练 35分(背语句)<br>
第一题 (看)<br>
数据处理规范制定(python)<br>
读取“/studymnt/01/data.csv"的数据集
data = read_csv(‘D:/studymnt/01/data.csv’)<br>
显示前十五行数据<br>
head(15)<br>
显示描述性统计信息
describe
对数据集数据进行预处理,处理缺失值、重复值
删除包含缺失值,dropna<br>
删除重复行,drop_duplicates<br>
知识点
数据清洗与准备
data = read_csv('') #读取csv文件<br>
data.info() #查看数据概况<br>
data.describe() #描述性统计信息<br>
data.shape() #数据规模<br>
data.type() #各字段数据类型<br>
data.head() #默认预览前5行数据,其他在括号中加参数<br>
data.tail() #默认预览后5行数据,其他在括号中加参数<br>
对缺失数据或者重复数据进行处理<br>
data.isnull() #检测出缺失数据<br>
data.dropna(0) #丢弃所有包含缺失值的数据<br>
data.fillna(0) #对缺失值用0填充<br>
data.duplicated() #查询是否存在重复值<br>
data.drop_duplicates() #删除重复值<br>
第二题17 (背)<br>
算法测试
特征标签划分
特征单维<br>
X = data[‘预估薪资’]<br>
y = data[‘是否会购买’]
特征多维<br>
X= data.drop(columns=[‘是否会购买’]) #删除标签剩余多维特征<br>
y=data[‘是否会购买’]
划分训练集和测试集<br>
from sklearn.model_selection import train_test_split<br>
说明 train_test_split函数<br>
注意 from sklearn.model_selection import train_test_split 要写
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=2020)<br>
说明X_train,X_test,y_train,y_test = train_test_split(train_data,train_target,test_size,random_state,shuffle)<br>
train_data是未划分的数据集,替换特征值,train_target是未划分的标签,替换 标签值,test_size是测试占总数据比例,random_state任意指定,shuffle不写默认打乱<br>
定义逻辑回归模型
from sklearn.linear_model import LogisticRegression<br>
这个一般考试会给出,注意要复制到答题区域,其他模型参照此做即可
model = LogisticRegression()<br>
定义模型
model.fit(X_train,y_train)<br>
训练集中训练模型,注意是括号,不是 = <br>
输出测试集的准确度<br>
acc = model.score(X_test,y_test)<br>
注意,测试集是 test,训练是用train,背model.score<br>
print(acc)<br>
输出测试集的预测值<br>
y_test_pred = model.predict(X_test)<br>
print(y_test_pred)<br>
智能系统设计 35(基本不用看)<br>
第一题
设计图表
按题目进行配置即可
注意,配置了过滤筛选条件,记得推拽到对应的区域内
第二题
完善条件
这个看逻辑的,直接选
培训与指导 5(概类流质实)
编写培训大纲
一、数据标注的概述
了解数据标注的定义、行业发展趋势等。
二、数据的标注分类
包括文本标注、图像标注、视频标注、语音标注。
三、数据标注流程及管理
四、数据标注质量管理
五、数据标注实战
0 条评论
下一页
为你推荐
查看更多