重要参数
criterion 是用来决定不纯度的计算方法的。
剪枝
max_depth
min_samples_leaf & min_samples_split
max_feature&min_impurity_decrease
max_feature限制分枝时考虑的特征个数,超过限制个数的特征都会被舍弃
min_impurity_derease限制信息增益的大小,设置信息增益小于设定值则分枝不会发生(0.19版本之前使用)
用超参数曲线来判断每个参数填写什么值,超参数用来衡量不同超参数取值下模型的表现的线
接口
fit <i>clf = clf.fit(Xtrain,Ytrain)</i><br><br>
score <i> score = clf.score(Xtest,Ytest)</i>
apply <i>clf.apply(Xtest)</i>
predict <i> clf.predict(Xtest))</i>