数据分析培训
2021-11-19 11:32:23 7 举报
AI智能生成
登录查看完整内容
DP流程
作者其他创作
大纲/内容
5人
数据部门
市场调研数据结果汇总出表
根据研究部门要求修改
沟通
注意
工作内容
总览
数据要求
table spec xls文件
元数据 xls
问卷 doc
获取物料
info 项目资料
data 项目数据
qpgm quantum程序
intermd 命令行临时文件
report 输出结果数据
forspss(spssdata) spss数据
项目代码及项目名称
原始物料及STS放入info文件夹
data.dat文件放入data文件夹
新建项目文件夹
每条记录加入column号
根据weight列表
修改yum_bohOpsMarketName字段
修改yum_market_banner字段
修改数据表
按具体项目来
将需要的Main复制进入“题号”“file号”
将需要的Title填入“题目描述”
将需要的具体Base填入”Base题号“
按照spec和问卷填写
Q2 - 210-219
多选题集合在一体
填写starCol
E:\\share\\P0025749 黄金脆皮鸡Air BRS\\qpgm
在I列到J列填上输出地址
点击create files
根据spec编辑standard-spectop
只需填首行
question 填入 多选题题号
选项来自问卷
选项 从填写题号处开始,填入选项
单选题 按顺序填写
多选题 全部填1
码号
只需填写首行
按实际位数与宽度填写
位数与宽度
点击 writesub
根据问卷与spec 编辑standard-sub
将数据类型修改为数值
元数据导入spss
准备
write outfile='C:\\Users\\Administrator\\Desktop\\data.dat'
输出地址
table /
结构
字段名通过元数据表格表头转置获得
删除不需要的字段(根据spec的需要)
字段名(类似Q1Q2 id等等)
通过standard-starcol获得
注意拆分多选题col
数据位置
主结构
编辑sps文件
打开sav并运行对应的sps
对照sav及问卷修改sps的数据宽度
输出data.dat
单卡
表长拉满
sig代表加入显著性调查
使用A1表头,计数方式为百分比表,sheet名加(sig)
第一行
%代表没有显著性调查的百分比表
使用A2表头,计数方式为百分比表,sheet名加(%)
第二行
abs代表没有显著性调查的数值表
使用A2表头,计数方式为数值表,sheet名加(abs)
第三行
*include tabs.def;bkt=A1;op=2;sTTL=BanA(sig)*include tabs.def;bkt=A2;op=2;sTTL=BanA(%)*include tabs.def;bkt=A2;op=1;sTTL=BanA(ABS)
A1A2在tabs.def中区别
op全局已经为2时 ,不用设置
修改*include tabs.def
main.run
sub中有输入的将\"-\"后的删掉
col 152+None =1+Few spots =2+Some spots =3+Many spots =4
col 152 col选择
+None = 1 选项与col存放数值对应
sub中未定义的 删除这条
*include Q16.cn;col(a)=160-167
检查修改 约束条件
l Q16;c=c152'234';netsort
= 后不要加空格
注意格式
注意事项
题目附加参数添加'sort;'
rank的情况
在题目最后添加“”*include mean.cn“”
没有fac的情况
fac
;%fac=3n12
mean的情况
一种归类方式
形如 net1------------net2----netend2netend1
嵌套归类
net的情况
axes.def
表头名 lbkA1
tstat 请求一个T检验
&ttt 代表tstat引用
列比率和列均值T检验
propmean
&ttt propmean
为每个表头做标识
elms
显著性数值
Clevel
带有显著性设置的语句
n01Gender|Male \t\t\t;id=A;c=c110'1'
n01 计数显示
gender|male 一级表头gender 二级表头male
在一个表头中ID是唯一的
id elms中标识的id
c=c111'1' 表头col位的数值
表头
banners.def
为什么是第二行?
第二行添加ttl^&sTTL
Q1 代表 将这个字段加入sheet
bk&bkt 代表将bk&bkt这个表头加入 sheet
这样方便变换表头
&bkt是一个引用,在main.run中更改
tab Q1 bk&bkt
tabs.def
形如col ca00+Dark spots\t='1'+Dullness\t='1'+Not radiant\t='1'+Uneven skin tone\t='1'+None\t='1'
改为col ca00+Dark spots\t='1'col ca01+Dullness\t='1'col ca02+Not radiant\t='1'col ca03+Uneven skin tone\t='1'col ca04+None\t='1'
01格式需要分配每个col
数值前后‘’必须要加
多选题sub
修改 qpgm
call quantum -pd qpgm -td intermd -id txt main.run F.dat ..\eport\\total.txt
程序根目录
-pd qpgm
临时文件目录
-td intermd
生成格式
-id txt
主程序地址
调用数据地址
..\\data\\data.dat
不使用子程序,同样可以写成
F.dat
..\eport\\total.txt
运行qtrun.bat文件,产出txt类型结果
out1 存放运行错误日志
out2 存放数据错误日志
查看日志
查错程序(?)
示例
每条记录单行顺序记录
0
每条记录多卡
2
读取方式
read
1-6是column号
id的列位置
ser
表长度(默认100)
reclen
卡的列位置
Crd
必须要的卡位置
req
出现多次的卡位置
rep
卡的最大数量
max
数据结构定义
变量定义
ed(开头)
。。。
end(结尾)
程序编辑区
a;op=2;minbase=1;dp;topc;decp=0;nopc;notype;spechar=->+flush;indent=2;nopage;overlap;missingincs;netsort;smallbase=30+clevel=95+side=120;paglen=2000;pagwid=5000;colwid=60
“+”换行符
“:”分隔符
频数表
1
百分比表
计数类型
op
???
minbase
保留小数位数
decp
不显示输出数据类型
notype
大于等于0小于0.5
->
spechar
百分数右对齐
flush
百分数不带\"%\"
nopc
缩进2位
=2
换行时缩进几位
indent
不显示页码
nopage
同用户对不同产品问卷
overlap
缺省值使用n25命令时准确传送数据
合计但不显示
n25
missingincs
netsort
smallbase
显著性检测
clevel
行字符数目
side
每页行数
paglen
每页列数
pagwid
colwid
表参数
*include tabs.def;bkt=A1;vop=2;sTTL=BanA(%) with sig*include tabs.def;bkt=A2;vop=2;sTTL=BanA(%)*include tabs.def;bkt=A2;vop=1;sTTL=BanA(Abs)
组表程序放在tabs.def中
后接配置参数
组表
*include banners.def;ttt=tstat
l 名字
子主题
表头程序放在banners.def中
*include axes.def;ttt=tstat
轴程序放在banners.def中
轴程序(主体表内容)
main.run中包含主要运行程序
使用excel中DP工具 转置为excel 结果表
漏写约束
数据表是否存在缺损
notanwser
base是否正确
是否漏题
选项是否正确显示
所有数值类选项是否加mean
题目中的分类是否提供了net
行列互换去除notanwser的显示
检查
进入虚拟机
具体流程
根据选项多少选择编码长度为1或2
单选题
由于每条选项都为一个字段 编码长度总为1
多选题
规范
dp工具插件及quantum 需要32位环境
使用虚拟机
quantum多调用子程序
改变样本量
n00
基本计数,并显示数据
n01
文本输出(空行)
n03
基本计数,并显示数据(记录重复样本)
n04
子统计
n05
计算样本量,并显示数据
n10
计算样本量,但不显示数据
n11
求平均
n12
加权合计并显示
n13
基本计数,但不显示数据
n15
标准差
n17
标准误
n19
文本输出
n23
合计不显示
中位数
n30
文本输出(强制)
n33
标题居左中右显示
ttl\\ttr\\ttc
quantum命令与含义
c=c111'123'
c=c112n'23'
c=c112'2/4'
单位
11和12
11到14
多位
选取数字
lQ1n01 选项1 col(a)=123n01 选项2 col(a)=124siden10n23n03*include XX.cn(这里不用加col(a)=???)n01 sss ;c=ca00'1'
tab Q1 gird
gird
加sig
选项相同,需要拆分的一组题,使用grid
多选 c=c212'1'
单选 c=c210'3'
210的Q3题选3
base 错误
do 1 ()
123 不可重复
循环
错误
not anwser
表头 是否
样本有没有缺少
t1b
t2b
b2b
最下面加fld c220:1 +T1B =5 +T2B =4-5+B2B =1-2
集合
mean
绝对比例
rim 多题目 target 单题目
+wm=1;nswwm1 aaa_wt;rim;+12331;12312;312;123;
多题加权
按比例
+wm=1;nswwm1 time_wt;input;0.3;0.2;0.45;0.05
+wm=1;nsw wm1 user;TARGET;187.481;383.0589;
单题加权
加权
加权结果有偏差时,手动调整数值
对tabs的题目筛选
flt;c=c100'1'*include tabs.def;
在最后加全base约束,等于结束筛选
flt;c=c100'123'
tab 筛选
在每列上加%
topc
百分数显示时不显示%
m描述描述描述 ;ex=A*B;op=1;参数=0
ex参数输入公式并输出
m语句
if的条件下,输出lista后col的统计结果
保存在根目录的list文件
if (c107'23') lista c182
善于使用的spss的隐藏题
spss
补充
数据分析培训
0 条评论
回复 删除
下一页