nav emailalert searchbtn searchbox tablepage yinyongbenwen piczone journalimg journalInfo searchdiv qikanlogo popupnotification paper paperNew
2008, 06, v.29;No.101 61-63
数据挖掘中的数据预处理方法
基金项目(Foundation): 华北水利水电学院青年科研基金项目(HSQJ2005015);; 河南省高校新世纪优秀人才支持计划项目(2006HANCET-03);; 省社科联调研项目(SKL-2008-1041)
邮箱(Email):
DOI: 10.19760/j.ncwu.zk.2008.06.019
摘要:

从初始数据源出发,总结了目前数据预处理的常规流程方法,提出应把源数据的获取作为数据预处理的一个步骤,并且创新性地把数据融合的方法引入到数据预处理的过程中,提出了数据的循环预处理模式,为提高数据质量提供了更好的分析方法,保证了预测结果的质量,为进一步研究挖掘提供了较好的参考模式.

Abstract:

Beginning from the initial data source,data preprocess routine technological process method is summed up,and at the same time,it is put forward that,gaining source data should be as a step of data preprocess.Datafusion is brought into data preprocess,and the data circulation preprocess pattern is proposed;it is a fairly good reference pattern for further studies in data mining,and provides much better analysis method to raise the data mass,and gave an important guarantee to forecasting the result mass.

参考文献

[1]Han,Micheline Kamber.Data Mining:Concepts and Tech-niques[M].USA:Morgan Kaufmann Publishers,2001.

[2]刘俊思,阐泽忠,秦华中,等.四川木里长枪弯隆石英流体包裹体特征及其地质意义[J].四川地质学报,2005,25(4):201-202.

[3]池天河.重大自然灾害遥感监测与评估集成系统[M].北京:中国科学技术出版社,1995.

[4]李军,庄大方.地学数据集成的理论基础与集成体系[J].地理科学进展,2001,20(2):137-145.

[5]章建国,施敏.利用高分子结构对数据集成的研究[J].石家庄职业技术学院学报,2005,17(2):45-50.

[6]邹逸江,吴金华.空间数据仓库的结构设计[J].长安大学学报(地球科学版),2003,25(1):66-69.

[7]吴新玲,毋国庆.基于数据变换的维数消减方法[J].武汉大学学报(理学版),2006,52(1):73-76.

[8]安淑芝.数据仓库与数据挖掘[M].北京:清华大学出版社,2005.

[9]David W Hosmer.Applied logistic regression[M].USA:Wiley-Interscience Publication,2000.

基本信息:

DOI:10.19760/j.ncwu.zk.2008.06.019

中图分类号:TP311.13

引用信息:

[1]彭高辉,王志良.数据挖掘中的数据预处理方法[J].华北水利水电学院学报,2008,29(06):61-63.DOI:10.19760/j.ncwu.zk.2008.06.019.

基金信息:

华北水利水电学院青年科研基金项目(HSQJ2005015);; 河南省高校新世纪优秀人才支持计划项目(2006HANCET-03);; 省社科联调研项目(SKL-2008-1041)

检 索 高级检索

引用

GB/T 7714-2015 格式引文
MLA格式引文
APA格式引文