轮廓系数

2015-11-27 10:32:12 2 举报
轮廓系数(Silhouette Coefficient)是一种用于评估聚类结果的指标,它通过计算每个样本到同簇其他样本的平均距离a(内距离)和最近簇其他样本的平均距离b(外距离),再求取两者比值的方式来度量样本之间的相似度。轮廓系数的值介于-1到1之间,值越接近1,表示样本之间的相似度越高;值越接近-1,表示样本之间的相似度越低。当轮廓系数为正数时,说明该样本位于两个簇的边界上,具有较好的分类效果;当轮廓系数为负数时,说明该样本可能位于噪声数据中或被错误地划分到了错误的簇中。因此,轮廓系数可以作为聚类结果好坏的一种参考标准。
作者其他创作
大纲/内容
评论
0 条评论
下一页