在企业纷纷向数字化转型的今天,数据更应该被当成一种战略资产,因为数据能够给企业带来新的价值。在利用智能分析工具,深入挖掘数据的价值之前,企业应该对自己的数据有一个比较清楚的认知,比如数据的总量、数据来自哪里、哪些数据会被经常访问,而哪些数据已经多年不用,可以归档或删除……
2016年第一季度,VERITAS公司启动了一项名为数据基因的项目,目的在于探索企业数据的发展趋势。在该项目启动的同时,VERITAS发布了一份报告《数据基因指数》(Data Genomics Index),生动地展示了一幅由企业数据组成的精确视图。
VERITAS公司高级产品市场经理Christopher Talbott介绍说,《数据基因指数》是首个精确评估实际数据环境组成的研究报告。调查的内容主要包括文件类型组成、平均使用期限,以及单个文件的大小等,目的是帮助企业用户了解日常创建、存储和管理的非结构化数据的本质,帮助企业从容应对数据增长的难题。
《数据基因指数》是一套企业数据结构洞察分析指标体系。VERITAS通过一个网络社区将《数据基因指数》的内容与企业用户进行分享,以便让企业能够更好地管理其信息。“在与企业用户打交道的这么多年中,我们积累了数亿条元数据。通过将这些数据进行汇总和整合,形成了一个数据结构,从数据的使用年限、数据的所有权、数据的大小等维度对数据进行深入的研究。这就是所谓的数据基因指数。”Christopher Talbott介绍说,“我们将企业用户的数据上传到VERITAS的数据分析产品中进行整合和分析。这些数据都经过匿名处理,分析人员并不知道数据的来源。最终,我们只将分析的结果进行公布,并不会侵犯客户数据和业务的安全。”
《数据基因指数》有以下几项重大发现。第一,由开发者主导的文件和演示文稿文件已成为过去时。与其他类型的文件相比,演示文稿文件的数量在过去10年中减少了五分之四。
第二,秋季是存储的旺季。在这个季度,文本文件的增长率最高,达到91%。企业通常会在夏季或秋季录制视频,并将录制的内容保存在磁盘中。因此,在秋季,视频文件的总量增长很快,增长率达到68%。
第三,大量数据长期无人问津。报告显示,在企业中,41%的企业数据已经过期,或者连续3年没有任何用户对其进行修改操作。
第四,孤立数据成为企业的巨大负担。由于职位变更或员工离职,数据将失去其所有者,这类数据被称为孤立数据。孤立数据多为视频、图片和演示文稿等。如果企业不重视这类数据,可能会造成一定的安全隐患。
只有了解了数据产生、存放和使用的规律,才能更好地对数据进行处理、整合和精简。比如,企业所拥有的演示文稿、电子表格或文本文件所占用的空间已经超出了合理的范围,那么企业就应该考虑对这些数据进行归档、删除或迁移。这样做的直接好处是,可以极大地节约数据存储的空间和成本。Christopher Talbott表示:“我们通过一系列科学的研究方法,可以精确地呈现企业一般数据环境的真实情况。我们将自己对数据的洞察与企业进行分享,目的是帮助企业更好地应对数据爆炸带来的诸多挑战。”
“企业在转型升级的过程中会感到焦虑。”VERITAS公司大中华区技术支持部高级总监李刚向记者介绍了他的亲身经历,“在与一些大型企业客户接触的过程中,我发现,面对软件定义、混合云、大数据等新兴技术和应用,很多用户感到既兴奋又迷茫。兴奋的是,借助这些新技术可以提高企业的生产力,创造更多的价值;迷茫的是,很多企业不知道如何正确部署和使用这些技术,才能充分发挥其应有的能力。企业对IT的期待望值过高,但对IT的实际把控能力又太弱。这一落差正是让客户感到焦虑的主要原因所在。”
在帮助企业实现转型升级的同时,VERITAS公司自身也在积极调整和变化。“以前,无论是厂商还是用户,都非常关注基础架构。但是现在,人们应该更多地关注数据,而不是架构。数据是企业的资产,企业的领导首先要认同数据的价值。”李刚表示,“VERITAS可以帮用户实现对数据的洞察。这是企业实现数字化转变的第一步。这也是我们推出《数据基因指数》的重要原因。”
《数据基因指数》展示了企业数据的现状,以及问题所在。接下来,企业要做的就是解决这些问题。VERITAS提供了趁手的工具。VERITAS推出的全新解决方案——Enterprise Vault 12和Data Insight 5.1,具有高级分析、Box、自动化修补流程等功能,可以深入监控企业的非结构化数据,并可根据合规性、业务价值和发现等需求,评估哪些重要信息需要保留,哪些信息可以直接删除,从而帮助企业做出明智的商业决策。
举例来说,《数据基因指数》报告显示,41%的企业数据在过去3年中从未被用户执行过修改操作。这就意味着,企业有必要对这41%的数据进行归档或删除。VERITAS的Enterprise Vault 12采用高度灵活的集中式、高性能分类框架,在删除不必要信息的同时,可以简化识别有价值或需要监管信息的流程。Enterprise Vault 12正在申请专利的技术——兼容型分类引擎,可自动分类收集的内容,包括电子邮件、文件、SharePoint、即时消息、社交媒体内容等,并可对PB级的数据进行分类、归档。Data Insight 5.1是一个数据洞察工具,它全面支持Box,可以识别企业环境中的敏感信息,包括本地的信息和存储在云中的信息。
李刚表示:“我们可以为用户提供可视化的解决方案,不断提高企业对数据的洞察能力,正确判定哪些数据需要全面的保护,哪些数据可以删除,以降低成本,最终目标是为企业的商业决策提供更好的支持。”
■本报记者 郭涛
……