数据分析培训
2021-11-19 11:32:23 7 举报
AI智能生成
DP流程
作者其他创作
大纲/内容
总览
数据部门
5人
工作内容
市场调研数据结果汇总出表
注意
沟通
根据研究部门要求修改
具体流程
获取物料
table spec xls文件
数据要求
元数据 xls
问卷 doc
准备
新建项目文件夹
项目代码及项目名称
info 项目资料
data 项目数据
qpgm quantum程序
intermd 命令行临时文件
report 输出结果数据
forspss(spssdata) spss数据
原始物料及STS放入info文件夹
sav,sps及输出日志放入spssdata文件夹
data.dat文件放入data文件夹
修改数据表
每条记录加入column号
修改yum_bohOpsMarketName字段
根据weight列表
修改yum_market_banner字段
根据weight列表
根据spec编辑standard-spectop
将需要的Main复制进入“题号”“file号”
将需要的Title填入“题目描述”
将需要的具体Base填入”Base题号“
填写starCol
按照spec和问卷填写
多选题集合在一体
Q2 - 210-219
在I列到J列填上输出地址
E:\share\P0025749 黄金脆皮鸡Air BRS\qpgm
点击create files
根据问卷与spec 编辑standard-sub
question 填入 多选题题号
只需填首行
选项 从填写题号处开始,填入选项
选项来自问卷
码号
单选题 按顺序填写
多选题 全部填1
位数与宽度
只需填写首行
按实际位数与宽度填写
点击 writesub
元数据导入spss
将数据类型修改为数值
编辑sps文件
输出地址
write outfile='C:\Users\Administrator\Desktop\data.dat'
结构
table /
主结构
字段名(类似Q1Q2 id等等)
字段名通过元数据表格表头转置获得
删除不需要的字段(根据spec的需要)
数据位置
通过standard-starcol获得
注意拆分多选题col
输出data.dat
打开sav并运行对应的sps
使用ultraedit打开data.dat,查找是否有"*"(数据位置溢出)
对照sav及问卷修改sps的数据宽度
修改 qpgm
main.run
结构式使用struct;ser=c(1,6);read=0;reclen=9999
单卡
表长拉满
修改*include tabs.def
*include tabs.def;bkt=A1;op=2;sTTL=BanA(sig)
*include tabs.def;bkt=A2;op=2;sTTL=BanA(%)
*include tabs.def;bkt=A2;op=1;sTTL=BanA(ABS)
*include tabs.def;bkt=A2;op=2;sTTL=BanA(%)
*include tabs.def;bkt=A2;op=1;sTTL=BanA(ABS)
第一行
使用A1表头,计数方式为百分比表,sheet名加(sig)
sig代表加入显著性调查
第二行
使用A2表头,计数方式为百分比表,sheet名加(%)
%代表没有显著性调查的百分比表
第三行
使用A2表头,计数方式为数值表,sheet名加(abs)
abs代表没有显著性调查的数值表
A1A2在tabs.def中区别
op全局已经为2时 ,不用设置
axes.def
*include Q16.cn;col(a)=160-167
sub中有输入的将"-"后的删掉
sub中未定义的 删除这条
col 152
+None =1
+Few spots =2
+Some spots =3
+Many spots =4
+None =1
+Few spots =2
+Some spots =3
+Many spots =4
col 152 col选择
+None = 1 选项与col存放数值对应
l Q16;c=c152'234';netsort
检查修改 约束条件
注意事项
= 后不要加空格
注意格式
rank的情况
题目附加参数添加'sort;'
mean的情况
在题目最后添加“”*include mean.cn“”
n25;inc=c(10,11)
n12mean;dec=2
n12mean;dec=2
没有fac的情况
;%fac=3
n12
n12
fac
net的情况
一种归类方式
形如
net1
------
------
net2
----
netend2
netend1
net1
------
------
net2
----
netend2
netend1
嵌套归类
banners.def
表头名 lbkA1
带有显著性设置的语句
&ttt propmean;elms=AB,CDEF;clevel=95
&ttt propmean
&ttt 代表tstat引用
tstat 请求一个T检验
propmean
列比率和列均值T检验
elms
为每个表头做标识
Clevel
显著性数值
表头
n01Gender|Male ;id=A;c=c110'1'
n01 计数显示
gender|male 一级表头gender 二级表头male
id elms中标识的id
在一个表头中ID是唯一的
c=c111'1' 表头col位的数值
tabs.def
第二行添加ttl^&sTTL
为什么是第二行?
tab Q1 bk&bkt
Q1 代表 将这个字段加入sheet
bk&bkt 代表将bk&bkt这个表头加入 sheet
&bkt是一个引用,在main.run中更改
这样方便变换表头
多选题sub
形如
col ca00
+Dark spots ='1'
+Dullness ='1'
+Not radiant ='1'
+Uneven skin tone ='1'
+None ='1'
col ca00
+Dark spots ='1'
+Dullness ='1'
+Not radiant ='1'
+Uneven skin tone ='1'
+None ='1'
改为
col ca00
+Dark spots ='1'
col ca01
+Dullness ='1'
col ca02
+Not radiant ='1'
col ca03
+Uneven skin tone ='1'
col ca04
+None ='1'
col ca00
+Dark spots ='1'
col ca01
+Dullness ='1'
col ca02
+Not radiant ='1'
col ca03
+Uneven skin tone ='1'
col ca04
+None ='1'
01格式需要分配每个col
数值前后‘’必须要加
进入虚拟机
运行qtrun.bat文件,产出txt类型结果
call quantum -pd qpgm -td intermd -id txt main.run F.dat ..\report\total.txt
-pd qpgm
程序根目录
-td intermd
临时文件目录
-id txt
生成格式
main.run
主程序地址
F.dat
调用数据地址
不使用子程序,同样可以写成
..\data\data.dat
..\report\total.txt
输出地址
查看日志
out1 存放运行错误日志
out2 存放数据错误日志
查错程序(?)
main.run中包含主要运行程序
数据结构定义
示例
struct;ser=c(1,6);read=0;reclen=9999
read
读取方式
0
每条记录单行顺序记录
2
每条记录多卡
ser
id的列位置
c(1,6)
1-6是column号
reclen
表长度(默认100)
Crd
卡的列位置
req
必须要的卡位置
rep
出现多次的卡位置
max
卡的最大数量
变量定义
程序编辑区
ed(开头)
。。。
end(结尾)
表参数
示例
a;op=2;minbase=1;dp;topc;decp=0;nopc;notype;spechar=->
+flush;indent=2;nopage;overlap;missingincs;netsort;smallbase=30
+clevel=95
+side=120;paglen=2000;pagwid=5000;colwid=60
+flush;indent=2;nopage;overlap;missingincs;netsort;smallbase=30
+clevel=95
+side=120;paglen=2000;pagwid=5000;colwid=60
“+”换行符
“:”分隔符
op
计数类型
1
频数表
2
百分比表
minbase
???
decp
保留小数位数
notype
不显示输出数据类型
spechar
???
->
大于等于0小于0.5
flush
百分数右对齐
nopc
百分数不带"%"
indent
换行时缩进几位
=2
缩进2位
nopage
不显示页码
overlap
同用户对不同产品问卷
missingincs
缺省值使用n25命令时准确传送数据
n25
合计但不显示
netsort
???
smallbase
???
clevel
显著性检测
side
行字符数目
paglen
每页行数
pagwid
每页列数
colwid
???
组表
示例
*include tabs.def;bkt=A1;vop=2;sTTL=BanA(%) with sig
*include tabs.def;bkt=A2;vop=2;sTTL=BanA(%)
*include tabs.def;bkt=A2;vop=1;sTTL=BanA(Abs)
*include tabs.def;bkt=A2;vop=2;sTTL=BanA(%)
*include tabs.def;bkt=A2;vop=1;sTTL=BanA(Abs)
组表程序放在tabs.def中
后接配置参数
表头
示例
*include banners.def;ttt=tstat
表头程序放在banners.def中
l 名字
子主题
后接配置参数
轴程序(主体表内容)
示例
*include axes.def;ttt=tstat
轴程序放在banners.def中
后接配置参数
使用excel中DP工具 转置为excel 结果表
检查
notanwser
漏写约束
数据表是否存在缺损
base是否正确
是否漏题
选项是否正确显示
所有数值类选项是否加mean
题目中的分类是否提供了net
行列互换去除notanwser的显示
补充
规范
单选题
根据选项多少选择编码长度为1或2
多选题
由于每条选项都为一个字段 编码长度总为1
使用虚拟机
dp工具插件及quantum 需要32位环境
quantum多调用子程序
quantum命令与含义
n00
改变样本量
n01
基本计数,并显示数据
n03
文本输出(空行)
n04
基本计数,并显示数据(记录重复样本)
n05
子统计
n10
计算样本量,并显示数据
n11
计算样本量,但不显示数据
n12
求平均
n13
加权合计并显示
n15
基本计数,但不显示数据
n17
标准差
n19
标准误
n23
文本输出
n25
合计不显示
n30
中位数
n33
文本输出(强制)
ttl\ttr\ttc
标题居左中右显示
选取数字
单位
c=c111'123'
c=c112n'23'
c=c112'2/4'
多位
c=c(111,112).in.(11)
c=c(111,112).in.(11,12)
11和12
c=c(111,112).in.(11:14)
11到14
gird
lQ1
n01 选项1 col(a)=123
n01 选项2 col(a)=124
side
n10
n23
n03
*include XX.cn(这里不用加col(a)=???)
n01 sss ;c=ca00'1'
n01 选项1 col(a)=123
n01 选项2 col(a)=124
side
n10
n23
n03
*include XX.cn(这里不用加col(a)=???)
n01 sss ;c=ca00'1'
tab Q1 gird
错误
base 错误
210的Q3题选3
多选 c=c212'1'
单选 c=c210'3'
循环
do 1 ()
123 不可重复
do 1 t1=160,183,1
if(c(t1)'1') c(9000,9001)=c(9000,9001)+c(t1)
1 continue
if(c(t1)'1') c(9000,9001)=c(9000,9001)+c(t1)
1 continue
检查
表头
样本有没有缺少
not anwser
表头 是否
集合
t1b
t2b
b2b
示例
最下面加
fld c220:1
+T1B =5
+T2B =4-5
+B2B =1-2
fld c220:1
+T1B =5
+T2B =4-5
+B2B =1-2
mean
n12 ddd ;inc(111,112)
加权
多题加权
+wm=1;nsw
wm1 aaa_wt;rim;
+12331;12312;312;123;
wm1 aaa_wt;rim;
+12331;12312;312;123;
绝对比例
rim 多题目 target 单题目
单题加权
+wm=1;nsw
wm1 time_wt;input;0.3;0.2;0.45;0.05
wm1 time_wt;input;0.3;0.2;0.45;0.05
按比例
+wm=1;nsw
wm1 user;TARGET;187.481;383.0589;
wm1 user;TARGET;187.481;383.0589;
绝对比例
tab 筛选
flt;c=c100'1'
*include tabs.def;
*include tabs.def;
对tabs的题目筛选
flt;c=c100'123'
在最后加全base约束,等于结束筛选
topc
在每列上加%
nopc
百分数显示时不显示%
m语句
m描述描述描述 ;ex=A*B;op=1;参数=0
ex参数输入公式并输出
检查
if (c107'23') lista c182
if的条件下,输出lista后col的统计结果
保存在根目录的list文件
spss
善于使用的spss的隐藏题
0 条评论
下一页