社会的发展进入了网络信息时代,各种形式的数据海量产生,在这些数据的背后隐藏着许多重要的信息,如何从这些数据中找出某种规律,发现有用信息,越来越受到关注。为了适应信息处理新需求和社会发展各方面的迫切需要而发展起来一种新的信息分析技术,这种技术称为数据挖掘。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 一、数据挖掘的对象 数据挖掘可以在任何类型的数据上进行,即可以来自社会科学,又可以来自自然科学产生的数据,还可以是卫星观测得到的数据。数据形式和结构也各不相同,可以是传统的关系数据库,可以是面向对象的高级数据库系统,也可以是面向特殊应用的数据库,如空间数据库、时序数据库、文本数据库和多媒体数据库等,还可以是Web数据信息。 二、数据挖掘的任务 数据挖掘的目标是从海量数据中发现隐含的、有意义的知识。它的任务主要是分类、预测、时间序列模式、聚类分析、关联分析预测和偏差分析等。 1.分类。分类就是按照一定的标准把数据对象划归成不同类别的过程。 2.预测。预测就是通过对历史数据的分析找出规律,并建立模型,通过模型对未来数据的种类和特征进行分析。 3.时间序列模式。时间序列模式就是根据数据对象随时间变化的规律或趋势来预测将来的值。 4.聚类分析。聚类分析是在没有给定划分类的情况下,根据数据信息的相似度进行数据聚集的一种方法。 5.关联分析预测。关联分析就是对大量的数据进行分析,从中发现满足一定支持度和可信度的数据项之间的联系规则。 6.偏差分析。偏差分析就是通过对数据库中的孤立点数据进行分析,寻找有价值和意义的信息。 本文转自上海西线学院官/ 高薪等你来拿,快来报名吧! 全国免费电话:400-772-1689 咨询Q