考虑下面的示例表,我试图对其进行预测
如您所见,我混合了数值(Num1&Num2)和分类特征(Cat1&Cat2)来预测一个值,我使用随机森林回归来预测
读入文件后,我使用LabelEncoder将分类特征转换为数字特征,如下所示category_col =['Cat1', 'Cat2']
labelEncoder = preprocessing.LabelEncoder()
# creating a map of all the numerical values of each categorical labels.
mapping_dict={}
for col in category_col:
df[col] = labelEncoder.fit_transform(df[col])
le_name_mapping = dict(zip(labelEncoder.classes_, labelEncoder.transform(labelEncoder.classes_)))
mapping_dict[col]=le_name_mapping
一旦转换,我就把我的数据帧分割成一个训练和测试集,并做出预测,就像这样
^{pr2}$
我的问题是,如何更改Cat1和Cat2的数字编号以再次显示原始类别,以便我可以将预测导出回原样
我明白我需要使用labelEncoder.inverse_变换然而,我似乎无法正确地获得语法,以获得与结果相匹配的类别文本。在
感谢任何帮助!在