人群相似度的判断依据
1. 计算理论最大欧式距离:若有m个独立特征<span class="equation-text" contenteditable="false" data-index="0" data-equation="Dmax = \sqrt{2m}"><span></span><span></span></span>
2. 计算实际欧式距离:若m个独立特征共有n个类别,占比差值的平方和的平方根 <span class="equation-text" contenteditable="false" data-index="0" data-equation="d = \sqrt{\sum_{i=1}^n (q_i-p_i)^2}"><span></span><span></span></span>
3. 归一化处理:<span class="equation-text" contenteditable="false" data-index="0" data-equation="dnorm={d \over Dmax}"><span></span><span></span></span>
4. dnorm<0.1差异极小非常相似,0.1-0.3有细微差异较相似,0.3-0.5有一定差异需关注差异较大的特征,>0.5差异明显人群画像明显不同