信息增益的问题
2017-03-21 22:36:01 0 举报
信息增益是决策树算法中用来衡量一个属性对于数据集分类的重要性。它表示了在给定一个属性的条件下,系统不确定性的减少程度。信息增益越大,说明该属性对分类结果的影响越大,因此在决策树中应该优先选择信息增益大的属性进行划分。然而,信息增益也有其局限性,它假设所有属性都是离散的且具有等距测度,这在实际应用中往往不成立。此外,信息增益偏向于选择取值较多的属性,这可能导致过拟合的问题。因此,在实际应用中,我们通常会结合其他指标如信息增益率、基尼指数等来选择最优的属性进行划分。