数据预处理(数据净化常常指统计预处理对不对)
1、就是说,对数据进行检验,看数据是否有缺失值、错误值等等。
2、如果有错误值,要修正。
3、有缺失,视情况插补。
4、数据没有问题时,称为cleandata,即干净数据,然后才能进一步分析。
5、否则,如果数据有问题,称为dirtydata。
1、就是说,对数据进行检验,看数据是否有缺失值、错误值等等。
2、如果有错误值,要修正。
3、有缺失,视情况插补。
4、数据没有问题时,称为cleandata,即干净数据,然后才能进一步分析。
5、否则,如果数据有问题,称为dirtydata。