美食场景分析脑图
2020-09-15 10:06:51 0 举报
AI智能生成
登录查看完整内容
美食场景分析脑图
作者其他创作
大纲/内容
美食场景分析方法与计算
数据采集
高德地图poi爬取
美食点
酒店
商场
超市
城市边界
osm开源数据
osm道路图层
省公司反馈
沿街美食聚集区域
商业综合体
重点美食酒楼
不规则美食聚集区
数据汇聚
生成图层
图层合并
merge
生成buffer30m图层
merge_buffer
增加area字段并计算面积
生成点在面内的美食点
导入food_tagged表
复制美食点表并在后面增加父级字段
导入边界关联数据
计算点在面外的美食点
交集取反symdif,用来计算美食街
获取街道
获取城市边界
结合osm道路地图获取城市范围内的道路
按名称合并道路
增加长度字段,计算街道长度
删除无名道路
筛选长度小于0.1(十进制度decimal degrees,约10公里)
生成buffer40米图层
road_buffer
生成点在街里的美食点
街内美食点dbscan
100米8个
选美食街>20个点
如有交叉路口美食点,则在parent_address用“|”分隔记录
取food_tagged表父级为空
dbscan200米100个汇聚成不规则美食聚集区域
数据分级
重点城市
1、人均消费、评价、环境得分、评价人数去除噪
2、对归属于同一条沿街美食聚集区域的所有店铺,进行人均消费、评价、环境得分、评价人数4种因素的汇总,其中人均消费、评价、环境得分求平均值,评价人数求和
3、人均消费、评分、环境、评价人数,店铺数量5个因素得分进行归一化
4、按照人均消费、评分、环境、评价人数40%-- 20%--20%-- 20% 的比例计算出店铺档次分。并将店铺档次分进行归一
5、店铺数量、评价人数、店铺档次得分按照 20%--20%--60%的比例算出最终得分,存储在结果表score_final
6、对结果表score_final按照人均消费(cost)降序排序。将位于30%位置的人均消费数值,记录为cost_limit
7、取结果表里score_final的前30%,通过人均消费(cost)大于cost_limit,店铺数量(num_store)大于25、街道(length,通过area字段,由decimal degree单位转换为米,)长度大于300米同时满足的,得到列表1
8、按照评价人数(total)降序排序,取前30%,得到列表2
9、取列表1、列表2的并集并去重,得到沿街美食聚集区域最终列表,北京共得到50条沿街美食聚集区
不规则聚类美食场景
1、对属于不规则聚类美食场景的店铺的人均消费、评价、环境得分、评价人数去除噪,避免极值对结果的影响
2、对归属于同一不规则聚类美食场景的所有店铺,进行人均消费、评价、环境得分、评价人数4种因素的汇总,其中人均消费、评价、环境得分求平均值,评价人数求和
3、对每一不规则聚类美食场景的人均消费、评分、环境、评价人数,店铺数量5个因素得分进行归一化
6、输出不规则聚类美食场景详细得分列表
1-5步同不规则聚类美食场景
6、得到结果后将店铺数量小于等于6的商业综合体所包含的店铺从原始数据中清除,再次进行商业综合体分级,得到最终结果
7、重复1-5步骤
8、剔除商业综合体名称(对应结果表中parent_name)包含“装修”、“暂停”字段的数据,得到商业综合体列表
重点酒店
1、\t剔除没有轮廓的酒店
2、\t剔除包含“连锁酒店”字段的酒店
3、\t取最低消费及平均消费的两者最大值排序,取TOP20%得出分级结果
4、\t剔除酒店名称名称(对应结果表中name)包含“装修”、“暂停”字段的数据
重点美食餐厅
1、\t排除店铺名称、店铺地址、店铺归属的美食场景名称(parent_name字段)中包含“装修”、“暂定”等字样的店铺
2、\t排除评价人数低于100的店铺
3、\t取人均消费排名的TOP4%列表、评价人数排名TOP2%列表,取并集,并去重
二三线城市分级
1、按照店铺数量分三档,分界线分别为30000、10000,高于30000为一线城市,低于10000为三线城市,中间为二线城市;一线城市参数集合采用38重点城市集合
2、不规则美食聚集区场景,源数据中没有,则可以为零,如果源表里有,结果中至少包含一个
3、沿街美食聚集区参数
对应步骤6
cost_limit
一线:30%,二线:20%、三线:20%
江苏更新
一线:30%,二线:10%、三线:10%
对应步骤7
包含店铺数量(沿街聚集美食聚集区定义)
一线:25、二线:23、三线:20
二三线25个
街长度(沿街聚集美食聚集区定义)
一线:300、二线:270、三线:240
二三线300
取清单前百分比
一线:30%、二线:30%、三线:30%
一线:30%、二线:10%、三线:10%
对应步骤8
评价人数top百分比门限(步骤8)
4、不规则美食聚集区参数
最终提取TOP百分比
一线:30%、二线:20%、三线:20%
二三线
10%
5、重点美食餐厅参数
评价人数
一线:100、二线:90、三线:80
一线:100、二线:90、三线:90
一线:取人均消费排名的TOP4%列表、评价人数排名TOP2%列表。二、三线:取人均消费排名的TOP2%列表、评价人数排名TOP1%列表
通报KPI/MR计算方法
KPI计算方法
高负荷待扩容
1、高负荷待扩容小区:ishighload > 0.5
2、高负荷待扩容场景:包括高负荷待扩容小区
高负荷预警
1、高负荷预警小区:isgaofuheyujing > 0.5
2、高负荷预警场景:包括高负荷预警小区
计算方式
1、Sheet1:加入高负荷待扩容小区比例、高负荷预警小区比例,2、Sheet3:高负荷待扩容美食场景清单:后面加上这个场景对应的类型;3、Sheet5:高负荷预警美食场景清单:后面加上这个场景对应的类型;4、Sheet2、4、6:在小区后引入Indoor&outdoor,有站名也加上(补充)5、Sheet7:增加,原来说过的,高负荷待扩容及高负荷预警,只要出过的,进行一下标记记录,同时记录一下时间,后期原则上不允许删除;(补充)6、Sheet3、Sheet5:累计出现次数,本次全为1,下次如果再有再累加1;这样的话COUNT(name)代表本次是否有,新增的累计出现次数列代表历史出现过的月份数;(补充)7、统计数据中加入时间,加入全网;各Sheet中加入时间;
KPI通报字段
汇总指标
省名称
市名称
高负荷待扩容小区数量
高负荷待扩容小区比例
高负荷待扩容美食场景数量
高负荷待扩容美食场景比例
高负荷预警小区数量
高负荷预警小区比例
高负荷预警美食场景数量
高负荷预警美食场景比例
美食场景数量
服务小区数量
高负荷待扩容美食场景清单
高负荷待扩容美食场景名称
包含的服务小区数量
美食场景名称
最近出现时间
时间戳
出现次数
高负荷预警美食场景清单
全量数据
CGI
服务小区中文名
美食场景类型
美食场景类型代码
覆盖类型
高负荷待扩容小区
高负荷待扩容小区(1:是,0:不是)
高流量感知预警小区比例
高流量感知预警小区比例(1:是,0:不是)
MR计算方法
弱覆盖
1、重点美食酒楼,不计算MR覆盖相关内容
2、小区覆盖率(总MRO好样本/总MRO样本)
3、场景覆盖率(所有服务小区的总MRO好样本/所有服务小区的总MRO样本)
4、小区MRO覆盖率低于90%,记为弱覆盖小区
5、场景MRO覆盖率低于90%,记为弱覆盖场景
低于竞对
3、低于竞对美食场景清单(低于竞对小区比例高于50%)
MR通报指标
小区数
美食场景数
总MRO样本
总MRO好样本
覆盖率(总MRO好样本/总MRO样本)
弱覆盖小区(MRO覆盖率低于90%)数量
弱覆盖小区(MRO覆盖率低于90%)比例
弱覆盖美食场景数量
弱覆盖美食场景比例
低于竞对小区数量
低于竞对小区比例
低于竞对美食场景数量
低于竞对美食场景比例
弱覆盖美食场景清单(MRO覆盖率低于90%)
低于竞对美食场景清单(低于竞对小区比例高于50%)
服务小区识别
38重点城市
有轮廓边界的
商业综合体、星级酒店
宏蜂窝
范围内
进行关联
范围外
天线波瓣角
120%
按照扇形模拟
100米范围内
有交叉
200米范围内
交叉面积占覆盖面积超过30%
微蜂窝
轮廓范围内
全算
轮廓外扩
80米
美食街、不规则美食区域
暂不考虑
主要原因:该场景微蜂窝部署少,按照GIS规则填加后错的比正确的多太多
无轮廓边界
中心经纬度200米范围
方位角120度包住
二三线城市
省份提交、核验及数据入库
下发
文件及内容
场景服务小区表
POI_LTE_FOOD_日期
场景表
数据库同步更新
1、更新Sheet名称
2、更新字段
3、增加后面两列
修改原有
统计表
反馈结果更新到数据库
图层文件
关注美食街TOP文件的打开问题
省份可修改内容
可增加
不可删除
关店可以删
增加需要字段
经纬度
ID
写说明
省
城市
区
地址
备注
中心经纬度
边界
沿街美食聚集区
typecode
区域
不规则
不可增加
服务小区类
增加填写字段
李涛完善
需要与场景表对应填写
场景
可增加微蜂窝
宏蜂窝不动
不允许动
提交内容核验
核验内容
字段合规
服务小区表
相关字段
填报有效性
服务小区表中场景
在场景表中都在
ID&中文名
方式
工具发省里
确认无问题可反馈
反馈带截图
数据入库
入库条件
结果通报
0 条评论
回复 删除
下一页