2,514 | 73 | 66 |
下载次数 | 被引频次 | 阅读次数 |
从初始数据源出发,总结了目前数据预处理的常规流程方法,提出应把源数据的获取作为数据预处理的一个步骤,并且创新性地把数据融合的方法引入到数据预处理的过程中,提出了数据的循环预处理模式,为提高数据质量提供了更好的分析方法,保证了预测结果的质量,为进一步研究挖掘提供了较好的参考模式.
Abstract:Beginning from the initial data source,data preprocess routine technological process method is summed up,and at the same time,it is put forward that,gaining source data should be as a step of data preprocess.Datafusion is brought into data preprocess,and the data circulation preprocess pattern is proposed;it is a fairly good reference pattern for further studies in data mining,and provides much better analysis method to raise the data mass,and gave an important guarantee to forecasting the result mass.
[1]Han,Micheline Kamber.Data Mining:Concepts and Tech-niques[M].USA:Morgan Kaufmann Publishers,2001.
[2]刘俊思,阐泽忠,秦华中,等.四川木里长枪弯隆石英流体包裹体特征及其地质意义[J].四川地质学报,2005,25(4):201-202.
[3]池天河.重大自然灾害遥感监测与评估集成系统[M].北京:中国科学技术出版社,1995.
[4]李军,庄大方.地学数据集成的理论基础与集成体系[J].地理科学进展,2001,20(2):137-145.
[5]章建国,施敏.利用高分子结构对数据集成的研究[J].石家庄职业技术学院学报,2005,17(2):45-50.
[6]邹逸江,吴金华.空间数据仓库的结构设计[J].长安大学学报(地球科学版),2003,25(1):66-69.
[7]吴新玲,毋国庆.基于数据变换的维数消减方法[J].武汉大学学报(理学版),2006,52(1):73-76.
[8]安淑芝.数据仓库与数据挖掘[M].北京:清华大学出版社,2005.
[9]David W Hosmer.Applied logistic regression[M].USA:Wiley-Interscience Publication,2000.
基本信息:
DOI:10.19760/j.ncwu.zk.2008.06.019
中图分类号:TP311.13
引用信息:
[1]彭高辉,王志良.数据挖掘中的数据预处理方法[J].华北水利水电学院学报,2008,29(06):61-63.DOI:10.19760/j.ncwu.zk.2008.06.019.
基金信息:
华北水利水电学院青年科研基金项目(HSQJ2005015);; 河南省高校新世纪优秀人才支持计划项目(2006HANCET-03);; 省社科联调研项目(SKL-2008-1041)