美食场景分析方法与计算算法分享
2022-10-26 18:25:19 0 举报
AI智能生成
登录查看完整内容
美食场景分析方法与计算算法分享
作者其他创作
大纲/内容
美食点
酒店
商场
超市
城市边界
高德地图poi爬取
osm道路图层
osm开源数据
沿街美食聚集区域
商业综合体
重点美食酒楼
不规则美食聚集区
省公司反馈
数据采集
酒店lt;br
生成图层
merge
图层合并
merge_buffer
增加area字段并计算面积
生成buffer30m图层
生成点在面内的美食点
复制美食点表并在后面增加父级字段
导入边界关联数据
导入food_tagged表
交集取反symdif,用来计算美食街
计算点在面外的美食点
获取城市边界
结合osm道路地图获取城市范围内的道路
按名称合并道路
增加长度字段,计算街道长度
删除无名道路
筛选长度小于0.1(十进制度decimal degrees,约10公里)
获取街道
road_buffer
生成buffer40米图层
生成点在街里的美食点
100米8个
选美食街20个点
街内美食点dbscan
如有交叉路口美食点,则在parent_address用“|”分隔记录
取food_tagged表父级为空
dbscan200米100个汇聚成不规则美食聚集区域
数据汇聚
1、人均消费、评价、环境得分、评价人数去除噪
2、对归属于同一条沿街美食聚集区域的所有店铺,进行人均消费、评价、环境得分、评价人数4种因素的汇总,其中人均消费、评价、环境得分求平均值,评价人数求和
3、人均消费、评分、环境、评价人数,店铺数量5个因素得分进行归一化
4、按照人均消费、评分、环境、评价人数40%-- 20%--20%-- 20% 的比例计算出店铺档次分。并将店铺档次分进行归一
5、店铺数量、评价人数、店铺档次得分按照 20%--20%--60%的比例算出最终得分,存储在结果表score_final
6、对结果表score_final按照人均消费(cost)降序排序。将位于30%位置的人均消费数值,记录为cost_limit
7、取结果表里score_final的前30%,通过人均消费(cost)大于cost_limit,店铺数量(num_store)大于25、街道(length,通过area字段,由decimal degree单位转换为米,)长度大于300米同时满足的,得到列表1
8、按照评价人数(total)降序排序,取前30%,得到列表2
9、取列表1、列表2的并集并去重,得到沿街美食聚集区域最终列表,北京共得到50条沿街美食聚集区
1、对属于不规则聚类美食场景的店铺的人均消费、评价、环境得分、评价人数去除噪,避免极值对结果的影响
2、对归属于同一不规则聚类美食场景的所有店铺,进行人均消费、评价、环境得分、评价人数4种因素的汇总,其中人均消费、评价、环境得分求平均值,评价人数求和
3、对每一不规则聚类美食场景的人均消费、评分、环境、评价人数,店铺数量5个因素得分进行归一化
6、输出不规则聚类美食场景详细得分列表
不规则聚类美食场景
1-5步同不规则聚类美食场景
6、得到结果后将店铺数量小于等于6的商业综合体所包含的店铺从原始数据中清除,再次进行商业综合体分级,得到最终结果
7、重复1-5步骤
8、剔除商业综合体名称(对应结果表中parent_name)包含“装修”、“暂停”字段的数据,得到商业综合体列表
1、 剔除没有轮廓的酒店
2、 剔除包含“连锁酒店”字段的酒店
3、 取最低消费及平均消费的两者最大值排序,取TOP20%得出分级结果
4、 剔除酒店名称名称(对应结果表中name)包含“装修”、“暂停”字段的数据
重点酒店
1、 排除店铺名称、店铺地址、店铺归属的美食场景名称(parent_name字段)中包含“装修”、“暂定”等字样的店铺
2、 排除评价人数低于100的店铺
3、 取人均消费排名的TOP4%列表、评价人数排名TOP2%列表,取并集,并去重
重点美食餐厅
重点城市
1、按照店铺数量分三档,分界线分别为30000、10000,高于30000为一线城市,低于10000为三线城市,中间为二线城市;一线城市参数集合采用38重点城市集合
2、不规则美食聚集区场景,源数据中没有,则可以为零,如果源表里有,结果中至少包含一个
一线:30%,二线:10%、三线:10%
江苏更新
一线:30%,二线:20%、三线:20%
cost_limit
对应步骤6
二三线25个
一线:25、二线:23、三线:20
包含店铺数量(沿街聚集美食聚集区定义)
二三线300
一线:300、二线:270、三线:240
街长度(沿街聚集美食聚集区定义)
一线:30%、二线:10%、三线:10%
一线:30%、二线:30%、三线:30%
取清单前百分比
对应步骤7
评价人数top百分比门限(步骤8)
对应步骤8
3、沿街美食聚集区参数
10%
二三线
一线:30%、二线:20%、三线:20%
最终提取TOP百分比
4、不规则美食聚集区参数
一线:100、二线:90、三线:90
一线:取人均消费排名的TOP4%列表、评价人数排名TOP2%列表。二、三线:取人均消费排名的TOP2%列表、评价人数排名TOP1%列表
一线:100、二线:90、三线:80
评价人数
5、重点美食餐厅参数
二三线城市分级
数据分级
1、高负荷待扩容小区:ishighloadamp;nbsp; 0.5
2、高负荷待扩容场景:包括高负荷待扩容小区
高负荷待扩容
1、高负荷预警小区:isgaofuheyujingamp;nbsp; 0.5
2、高负荷预警场景:包括高负荷预警小区
高负荷预警
1、Sheet1:加入高负荷待扩容小区比例、高负荷预警小区比例,2、Sheet3:高负荷待扩容美食场景清单:后面加上这个场景对应的类型;3、Sheet5:高负荷预警美食场景清单:后面加上这个场景对应的类型;4、Sheet2、4、6:在小区后引入Indooramp;amp;outdoor,有站名也加上(补充)5、Sheet7:增加,原来说过的,高负荷待扩容及高负荷预警,只要出过的,进行一下标记记录,同时记录一下时间,后期原则上不允许删除;(补充)6、Sheet3、Sheet5:累计出现次数,本次全为1,下次如果再有再累加1;这样的话COUNT(name)代表本次是否有,新增的累计出现次数列代表历史出现过的月份数;(补充)7、统计数据中加入时间,加入全网;各Sheet中加入时间;
计算方式
KPI计算方法
省名称
市名称
高负荷待扩容小区数量
高负荷待扩容小区比例
高负荷待扩容美食场景数量
高负荷待扩容美食场景比例
高负荷预警小区数量
高负荷预警小区比例
高负荷预警美食场景数量
高负荷预警美食场景比例
美食场景数量
服务小区数量
汇总指标
高负荷待扩容美食场景名称
包含的服务小区数量
美食场景名称
最近出现时间
时间戳
出现次数
高负荷待扩容美食场景清单
高负荷预警美食场景清单
CGI
服务小区中文名
美食场景类型
美食场景类型代码
覆盖类型
高负荷待扩容小区
高负荷待扩容小区(1:是,0:不是)
高流量感知预警小区比例
高流量感知预警小区比例(1:是,0:不是)
全量数据
KPI通报字段
1、重点美食酒楼,不计算MR覆盖相关内容
2、小区覆盖率(总MRO好样本/总MRO样本)
3、场景覆盖率(所有服务小区的总MRO好样本/所有服务小区的总MRO样本)
4、小区MRO覆盖率低于90%,记为弱覆盖小区
5、场景MRO覆盖率低于90%,记为弱覆盖场景
弱覆盖
3、低于竞对美食场景清单(低于竞对小区比例高于50%)
低于竞对
MR计算方法
小区数
美食场景数
总MRO样本
总MRO好样本
覆盖率(总MRO好样本/总MRO样本)amp;nbsp;
弱覆盖小区(MRO覆盖率低于90%)数量amp;nbsp;
弱覆盖小区(MRO覆盖率低于90%)比例amp;nbsp;
弱覆盖美食场景数量amp;nbsp;
弱覆盖美食场景比例amp;nbsp;
低于竞对小区数量amp;nbsp;
低于竞对小区比例amp;nbsp;
低于竞对美食场景数量amp;nbsp;
低于竞对美食场景比例amp;nbsp;
弱覆盖美食场景清单(MRO覆盖率低于90%)
低于竞对美食场景清单(低于竞对小区比例高于50%)
MR通报指标
通报KPI/MR计算方法
进行关联
范围内
120%
按照扇形模拟
天线波瓣角
有交叉
100米范围内
交叉面积占覆盖面积超过30%
200米范围内
范围外
宏蜂窝
全算
轮廓范围内
80米
轮廓外扩
微蜂窝
商业综合体、星级酒店
主要原因:该场景微蜂窝部署少,按照GIS规则填加后错的比正确的多太多
暂不考虑
美食街、不规则美食区域
有轮廓边界的
中心经纬度200米范围
方位角120度包住
无轮廓边界
服务小区识别
38重点城市
二三线城市
POI_LTE_FOOD_日期
场景服务小区表
数据库同步更新
1、更新Sheet名称
2、更新字段
修改原有
3、增加后面两列
场景表
反馈结果更新到数据库
统计表
关注美食街TOP文件的打开问题
图层文件
文件及内容
下发
可增加
关店可以删
不可删除
经纬度
写说明
ID
区
城市
省
地址
备注
增加需要字段
中心经纬度
边界
typecode
沿街美食聚集区
区域
不可增加
不规则
李涛完善
增加填写字段
需要与场景表对应填写
可增加微蜂窝
宏蜂窝不动
不允许动
场景
服务小区类
省份可修改内容
相关字段
服务小区表
字段合规
在场景表中都在
IDamp;amp;中文名
服务小区表中场景
填报有效性
确认无问题可反馈
反馈带截图
工具发省里
方式
核验内容
提交内容核验
入库条件
数据入库
省份提交、核验及数据入库
结果通报
美食场景分析方法与计算算法分享
0 条评论
回复 删除
下一页