关于数据挖掘技术在经济统计中的应用

  • 来源:时代金融
  • 关键字:数据挖掘技术,经济统计,应用
  • 发布时间:2015-09-10 14:16

  【摘要】数据挖掘技术是针对现代数据管理活动中存在的数量基数大、构成复杂和数据缺失现象严重等客观问题而研发的一种高效的数据深度加工技术,其应用于经济统计中有利于企业等确立正确的经济发展目标,获得更大的经济效益,因此进一步加强对其的研究非常有必要。基于此本文分析了数据挖掘技术在经济统计中的应用。

  【关键词】数据挖掘技术 经济统计 应用

  一、经济统计中数据挖掘技术应用的可行性

  (一)随着社会的发展,数据挖掘技术的研究与应用得到很大发展,已被广泛的应用,其具有很多优点,能够更好的提供服务于经济统计,因此进一步加强对其的研究非常有必要

  数据挖掘技术的发展是从二十世纪九十年代到现在,虽然时间不长,但是发展速度迅猛,因此也是越来越受到人们的重视。就目前的情况来看,国外对于其关注度非常高,致力于数据挖掘技术的开发和应用,例如IBM、微软等等。而其在我国也是得到很大的关注,我国对于该技术主要是体现在已经为其相继的建立了相应的工作实验室。

  (二)数据挖掘工具日益丰富,能够满足经济统计的各种需要

  为了更好的符合市场发展需求,数据挖掘的工具也是不断更新,呈现出不同的形式,就目前的情况,数据挖掘工具的市场主要由3个部分,包括通用型工具、综合工具和面向特定应用。

  1.通用型工具。在我们的现有市场中比较广泛的应用是通用型工具,其实用性非常广,就目前市场的这种类型工作主要包括:SGI Mineset、SAS Enterprise、SPSSClementine等软件。

  2.综合工具。综合工具的主要特点是能够满足商业活动的相关要求,其主要的目的是能够及时地提供相关数据情况以及管理报告等,就目前的情况来看,这种类型的工作市场中主要有Cognos Scenario、Business Objects等。

  (三)宏观经济数据库的建立,为数据挖掘技术的应用创造了良好的条件

  就目前的情况来看,我国的很多部门经济统计中都使用了数据挖掘技术,其主要工作内容是采集、处理。但是其还是存在着一些不足,主要是还没有完全的形成一个整体,从而进行数据的管理时候会有很多问题,因此,经济统计工作是需要开发新的技术。而宏观经济统计数据库刚好能解决好这一问题,其能够准确的确保经济统计信息,然后在对其进行整理,从而不断的扩充数据资源。

  二、数据挖掘技术在经济统计中的应用

  在社会经济管理活动中,管理主体对经济统计数据的要求主要有两个:一个是统计数据的真实性;一个是数据统计信息的实用性。单就这两个经济统计数据要求而言,数据挖掘技术能够很好地满足经济统计工作的需求,是适用性极强的一种经济数据统计技术,其在具体的经济数据统计活动中主要有以下四种应用方法。

  (一)预处理方法

  在经济数据统计活动中,最为基础的一种处理方式就是经济数据的预处理方法。因为数据挖掘本身是一种基于提供基础信息的智能分析技术,其本身是受基础经济信息限制的,不可能无中生有代替经济数据收集系统的功能,所以所有作为数据挖掘系统数据基础的经济统计数据信息都应该进行预处理。处理的内容主要包括:数据中不正确、不真实、不准确,以及不同经济统计数据信息之间差距较大等现象。

  对这些基础数据存在的问题进行处理的过程被称为数据清理,当前数据清理主要采用的方法有均值法、平滑法和预测法。其中均值法是现代分析技术中模糊理念的一种应用形式,当基础数据中的一个数据点是空值或者噪声数据的时候,可以采用均值法进行处理,即用数据库中所有该属性已知的属性均值来填补空缺,保证数据挖掘系统对基础数据的分析和整理能够正常进行,得出相对而言准确度较高的统计分析数据。

  (二)决策树方法

  就目前的情况来看,在数据挖掘技术应用过程中使用比较多的方法是决策树,因为其能够快速、直接的反映情况。对于该方法最主要的是要构建好决策树,通常情况下回分为2部:1)利用训练集建立并精简一棵决策树,同时建立一个模型,能够进行输出分析。2)将构建完的决策树充分利用,做好数据分类工作,这一分类是一个递归的过程,从决策树的根部开始进入到树干、枝丫,直到输入数据的分类满足了某种条件而停止。在具体的应用中停止分割的条件有两个:一个是当一个节点上的所有数据都属于同一个类别的时候;另一个是没有分类属性可以对输入数据进行再分割。

  在决策树构建完成后,还要根据使用者的具体要求对决策树进行“剪枝”,剪枝的主要目的是要降低因为使用训练集而对决策树本身数据输出产生的起伏影响。

  三、数据挖掘技术在某省经济统计中的具体应用举例

  本文主要是将序列模式和决策树进行结合的方法进行经济统计中的数据挖掘技术的分析,将其进行分类,从而能够确定出调查的对象。

  通过某地区企业历年上报的数据建立各个企业的序列模式,通过这个方法能够计算出一个企业的预测值,然后进行分析得到差别率,主要的对象是预测值和上报的数据,最后是将这个差别率进行第一次的分类。根据分类可以将其分为3种,A、B、C类,其分类的依据是差别率所占比率,顺序为大于等于百分之二十,百分之二十和百分之十之间以及百分之十以下。然后是进行建立决策树,其主要是从2个方面进行,即企业的规模变化率和企业是否发生了重大经营事件。

  如果企业的规模变化率非常大,就需要对其进行调查,如果变化率小,还需要进一步观察企业当年是否发生了重大经营事件,如果发生了就要进一步对其进行调查,如果没发生,就不需要再进行。

  总之,数据挖掘技术作为新型的经济统计方法,已经广泛的应用于经济统计中,采用数据挖掘技术能够使经济统计结果更加准确、清晰,同时期能够更好地满足社会需求,因此进一步加强对其的研究非常有必要,需要我们重视。

  参考文献

  [1]王康.关于数据挖掘技术在经济统计中的应用[J].财经界(学术版),2011,05:98.

  [2]辛金国,柯芳,李绍君,夏静波.数据挖掘技术在经济统计中的应用探索[J].统计与决策,2009,09:24-27.

  [3]李荣.关于数据挖掘技术在经济统计中的应用[J].中国商贸,2015,02:173-175.

  杨梅冰 梁思思

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: