常用方法
Holdout cross validation<br>留出法<br>
对于一个整理好的数据集,随机选择一部分样本作为训练数据即训练集,用于训练模型,剩下的部分用于测试模型,作为测试集。 <br>在划分训练集和测试集的时候,须要遵循的原则之一是保持数据分布的一致性。<br>
LOO<br>Leave-One-Out<br>留一交叉验证<br>
LPO<br>Leave-P-Out<br>留P法<br>
k-fold cross validation<br>k折交叉验证<br>
划分
训练集<br>training set<br>
训练集<br>training set<br>
用于运行学习算法,训练模型。
开发验证集<br>development set<br>
用于调整超参数、选择特征等,以选择合适模型。
测试集<br>test set
只用于评估已选择模型的性能,但不会据此改变学习算法或参数。