信息管理的合理边界

　　在结构化信息应用阶段，信息与应用被紧密地捆绑在一起，彼此不可分离。

　　因此，当时最通常的做法是，把不同的具体应用作为确定被管理的信息集合的边界和信息之间关系的基础与依据。也就是说信息是按照应用来划定边界而被管理的。

　　如今，信息已经不再像结构化数据应用阶段那样与具体的应用与生俱来、不可分割地捆绑在一起；数字化信息（其中绝大多数是非结构化数据）的生成常常与具体的应用没有直接的关联。

　　所以，在这个阶段考虑信息管理的时候，就很难像结构化信息应用中所做的那样，以具体应用作为依据来做信息的管理。

　　受到承载信息分享功能的万维网成功的鼓舞，TimBerners-Lee于1998年提出了语义网的概念。之后，语义网就成为人们讨论与研究的一个热点。

　　这个领域内的一些研究，从信息的语义开始，直接跨到整个互联网的覆盖范围。它试图通过超链接等手段将整个互联网上的信息作为整体来实现对包括非结构化信息在内的管理与使用。

　　这个设想固然宏伟，但却与计算机的本质存在矛盾。因为，计算机能够处理的问题本身必须是受限的，除非是简单的信息传递分享。

　　把整个互联网作为对象，只能做一些相对比较简单初级的事情，或者从中找一些局部的事情来做。我们不太可能直接在整个互联网上，实现复杂信息管理的高级功能。

　　更为重要的是，语义还仅仅是信息显性含义的有限描述，它难以支撑复杂的信息管理功能。

　　语义网领域内的这种类型的研究看似宏大，实际上反映了西方注重细节而缺少在整体上对事物做完整把握的思维习惯。

　　这种漫无边界的宏大设想，很容易落入当年人工智能遭遇的尴尬境地。当然也会像人工智能那样，逐步产生出许多有价值的方法促进产业的发展。

　　在此，我们将从更为现实合理的角度来分析信息管理这一问题。

　　那么，在当今这一阶段，信息管理的合理基点和前提是什么？也就是说我们应该根据什么客观原则来确定被管理的信息集合的边界，以及找出这个集合中信息之间的关系，从而实现对这些信息的有效的管理？

　　为此，我们需要把目光从具体的应用，转到信息的生成过程上来。

　　不论信息的生成是否与具体的应用有不可分割的关系，信息都是由认识主体而产生并为一个或多个认识主体所利用的。失去了认识主体，信息事实上便失去了意义。

　　因此，虽然信息可以脱离具体的应用，但是却从来都不能离开认识主体。而认识主体与具体应用场景相比，也是一个更为稳定的存在。

　　所以，将一个认识主体作为信息管理的基点来确定被管理的信息集合的边界，进而构建信息管理的基本结构，既具有自然的合理性，也具有应用的必要性。

　　这种做法就是将一个认识主体所拥有的所有信息作为管理的范围，并通过对认识主体以及这些信息的理解，建立信息之间的复杂关系，从而站在认识主体的角度实现对这些信息的有效管理及应用。不同主体所拥有的信息之间的关系，则应该放在更高一个层面去处理。

　　事实上，我们所使用的个人电脑，就是将个人这个主题所拥有的大部分数字化信息集中在一起管理。虽然这种管理还远不能满足需求，还没有能够很好地支撑相关的应用。

　　下面，我们超越单个信息的具体内容含义，首先从一个主题所拥有的信息集合的整体的角度来分析这些信息存在的高层宏观意义。

　　进而理解以主题为基点做信息管理的价值所在，寻找并建立在整体上而非微观层面上有效管理信息的结构。将该结构与全信息微观结构相结合，最终实现对信息的全面管理，并期望能够支撑全新的IT应用模式。

　　谢耘

　　神州数码控股有限公司工程院院长

　　在消费电子、国防电子及IT行业中，先后从事过产品研发、技术管理、企业经营等不同工作。曾担任中国科学院计算技术研究所副所长、神州数码通用软件有限公司董事长兼CEO，现任神州数码首席科学家。

……

关注读览天下微信， 100万篇深度好文，等你来看……