数据库新技术

  • 来源:环球市场信息导报
  • 关键字:数据库.XML数据库,数据仓库技术,知识数据库
  • 发布时间:2014-05-09 15:33

  随着计算机应用领域的不断拓展和多媒体技术的发展,数据库已经是计算机科学技术中发展最快、应用最广泛的重要分支之一,而数据库技术的研究也取得了重大突破,目前,它已成为计算机信息系统和计算机应用系统的核心技术和重要的基础。数据库技术仅仅40多年的历史,却已经历经了3代变化,造就了C.W.Bachman、E.F.Codd和James Gray三位图灵奖得主,发展了以数据建模和DBMS核心技术为主,内容丰富的一门学科,带动了一个巨大的软件产业--DBMS产品及其相关工具和解决方案。

  随着各类信息系统与数据库的建立,在过去若干年的时间里都积累了海量的、不同形式存储的各类数据。这些数据十分繁杂,仅仅依靠目前数据库的查询检索机制和数据处理方法,已经远远不能满足现实的需要。数据中隐藏的深层次的丰富资源没有得到充分地发掘和利用。人们迫切地需求把数据变成知识,把知识变成决策,把决策变成利润(财富)。使之有效地在管理和决策中发挥作用,是急需解决的问题。而且,随着信息化的不断深入发展,信息资源开发利用,已成为当前信息化的核心任务之一。然而,随着用户应用需求的提高、硬件技术的发展和Internet/Intranet提供的丰富多彩的多媒体交流方式,促进了XML数据库、数据仓库技术、联机分机处理技术和数据挖掘技术相互渗透,互相结合,成为当前数据库技术发展的主要特征,形成了数据库新技术。

  XML数据库

  XML数据库是一个能够在应用中管理XML数据和文档的集合的数据库系统。XML数据库是XML文档及其部件的集合,并通过一个具有能力管理和控制这个文档集合本身及其所表示信息的系统来维护。XML数据库不仅是结构化数据和半结构化数据的存储库,像管理其它数据一样,持久的XML数据管理包括数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。这些文档是持久的并且是可以操作的。XML数据库不仅是结构化数据和半结构化数据的存储库,像管理其它数据一样,持久的XML数据管理包括数据的独立性、集成性、访问权限、视图、完备性、冗余性、一致性以及数据恢复等。这些文档是持久的并且是可以操作的。

  与传统数据库相比,XML数据库能够对半结构化数据进行有效的存取和管理。如网页内容就是一种半结构化数据,而传统的关系数据库对于类似网页内容这类半结构化数据无法进行有效的管理。提供对标签和路径的操作。传统数据库语言允许对数据元素的值进行操作,不能对元素名称操作,半结构化数据库提供了对标签名称的操作,还包括了对路径的操作。当数据本身具有层次特征时,由于XML数据格式能够清晰表达数据的层次特征,因此XML数据库便于对层次化的数据进行操作。XML数据库适合管理复杂数据结构的数据集,如果己经以XML格式存储信息,则XML数据库利于文档存储和检索;可以用方便实用的方式检索文档,并能够提供高质量的全文搜索引擎。另外XML数据库能够存储和查询异种的文档结构,提供对异种信息存取的支持。

  数据仓库技术(DW)

  数据仓库(Data Warehouse,DW)是信息领域中近年来迅速发展起来的数据库新技术,是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库是一个过程而不是一个项目;是一个环境而不是一件产品。数据仓库提供用户用于决策支持的当前和历史数据,这些数据在传统的操作型数据库中很难或不能得到。数据仓库最根本的特点是物理地存放数据,而且这些数据并不是最新的、专有的,而是来源于其它数据库的。数据仓库的建立,能充分利用已有的数据资源,把数据转换为信息,从中挖掘出知识,提炼成智慧,最终创造出效益。所以,越来越多的企业开始认识到数据仓库应用所带来的好处。

  数据仓库是支持管理决策过程、面向主题、集成的、稳定的时变的数据集合。它将大量用于事务处理的传统数据库进行数据的清理、抽取和转换,并按决策主题的需要进行重新组织。数据仓库的逻辑结构可分为近期基本数据层、历史数据层和综合数据层,其中综合数据是为决策服务的。数据仓库是不可更新的,数据仓库主要是为决策分析提供数据,所涉及的操作主要是数据的查询;数据仓库是随时间而变化的,传统的关系数据库系统比较适合处理格式化的数据,能够较好的满足商业商务处理的需求。

  知识数据库

  知识数据库的功能是如何把由大量的事实、规则、概念组成的知识存储起来,进行管理,并向用户提供方便快速的检索、查询手段。因此,知识数据库可定义为:知识、经验、规则和事实的集合。知识数据库系统应具备对知识的表示方法;对知识系统化的组织管理;知识库的操作;库的查询与检索;知识的获取与学习;知识的编辑;库的管理等功能。知识数据库是人工智能技术与数据库技术的结合。

  并行数据库系统

  并行数据库系统是并行技术与数据库技术的结合,其发挥多处理机结构的优势,将数据库在多个磁盘上分布存储,利用多个处理机对磁盘数据进行并行处理,从而解决了磁盘“I/O”瓶颈问题,通过采用先进的并行查询技术,开发查询间并行、查询内并行以及操作内并行,大大提高查询效率。其目标是提供一个高性能、高可用性、高扩展性的数据库管理系统,而在性能价格比方面,较相应大型机上的DBMS高得多。并行数据库系统作为一个新兴的方向,需要深入研究的问题还很多,但可以预见,由于并行数据库系统可以充分地利用并行计算机强大的处理能力,必将成为并行计算机最重要的支撑软件之一。

  模糊数据库系统

  模糊数据库是指能够处理模糊数据的数据库。模糊性是客观世界的一个重要属性,传统的数据库系统描述和处理的是精确的或确定的客观事物,但不能描述和处理模糊性和不完全性等概念,这是一个很大的不足,为此,开展模糊数据库理论和实现技术的研究,其目标是能够存储以各种形式表示的模糊数据,数据结构和数据联系、数据上的运算和操作、对数据的约束(包括完整性和安全性)、用户使用的数据库窗口用户视图、数据的一致性和无冗余性的定义等都是模糊的,精确数据可以看成是模糊数据的特例;模糊数据库系统是模糊技术与数据库技术的结合,由于理论和实现技术上的困难,模糊数据库技术近年来发展不是很理想,但他已在模式识别、过程控制、案情侦破、医疗诊断、工程设计、营养咨询、公共服务以及专家系统等领域得到较好的应用,显示了广阔的应用前景。

  数据库系统发展到今天,其核心技术是依然是数据管理。随着新应用领域不断涌现,数据对象趋于多样化,数据库工作者也应该不断扩宽数据库的研究领域,在众多新领域中勇敢地承担起其中的数据管理研究开发任务。数据库工作者应该具有这样的意识,哪里有数据,哪里有数据管理的任务,哪里就有数据库研究和开发的课题。面对新的挑战,我们要继承数据库技术和其他技术相结合的优良传统,努力探索新的途径、新的方法、新的技术,来提高和改善对数据和信息的使用。

  (作者单位:石家庄工程职业学院)

  陈国林李景龙

关注读览天下微信, 100万篇深度好文, 等你来看……