one-hot
2017-03-03 20:42:50 0 举报
One-hot编码是一种常用的数据预处理方法,主要用于将类别型变量转换为机器学习算法可以处理的数值型变量。具体来说,假设我们有一个类别型变量,它有三个可能的值:A、B和C。在one-hot编码中,我们将这三个值分别转换为三个新的二进制变量,例如A变为[1,0,0],B变为[0,1,0],C变为[0,0,1]。这样,每个类别型变量都被转换为一个只有一个值为1的向量,其他值都为0。这种方法的优点是可以避免机器学习算法对类别型变量进行错误的数值解释,同时也可以减少类别型变量之间的相关性。