“大规模”成传感网应用壁垒

  • 来源:计算机世界
  • 关键字:大规模,传感网,应用,壁垒
  • 发布时间:2010-05-13 15:45
  我们曾经设想的传感网,都是成千上万的点,存在的意义都是庞大规模下的系统。而简单残酷的事实是,且不论真实系统,连演示系统都停留在“百”这个量级上;网络存活的时间,更是短得看不到优势。大规模长期部署的无线传感网系统到底面临什么挑战?

  特约撰稿 刘云浩

  1998年,我参加工作时间不长,被作为临时翻译派到纽约,坐在卖烟草晋身的IBM总裁郭士纳一尺远的地方听他说理想中的E-service概念。那时我还不知道后来异常有名的“智慧尘埃”概念已经公之于众了,郭士纳先生也未必知道自己后来将因为所谓的15年周期定律被我们频频说起。大家抽空用中文悄悄交换着刚听到的传奇般的雅虎和免费的Email空间,真正在听郭士纳滔滔不绝的,其实只有我这个翻译。

  我在第一次走进五星饭店洗手间的时候,知道了传感器原来离我这么近。其实传感器的开发和使用有多很年了,但是给传感器附加通信功能,组成自组织、自我协同的智能化网络系统,是近十年内取得的巨大进步。在“智慧尘埃”之后,无线传感网的概念迅速拓展到民用当中。在一个无线传感网中,大量的传感器等微型化计算设备通过无线多跳网络自组织的联接在一起,完成持续环境监控和大规模数据采集的任务,填补计算世界里数据来源这个木桶短边。

  传感网怎么了?

  世界范围内都有无线传感网的应用,加州大学伯克利分校的大鸭岛动物监测与红木监测、哈佛的火山遥感、麻省理工的河流监控,进一步推动了自组织传感网领域研究的热潮。国内外研究取得了显著进展,无线传感网应用延伸至众多领域,包括军事、工业控制、环境观测、生态安全、数字生活、交通监控。但是,综观国际上比较有代表性的无线传感网系统(表1),不难看出,当前实际系统可达的规模和运转寿命,与当初无线传感网被提出时的目标相去甚远。我们曾经设想的传感网,都是成千上万的点,不论是面向路由的还是边界检测的,存在的意义都是庞大规模下的系统;而简单残酷的事实是,且不论真实系统,连演示系统都停留在“百”这个量级上;网络存活的时间,更是短得看不到优势。我们不得不思考一下,大规模长期部署的无线传感网系统到底面临什么挑战?

  系统名称

  研制单位

  系统规模

  部署时长

  部署方式

  电源类型

  VigilNet

  University of Virginia

  200

  3~6个月

  室外应用系统

  干电池

  Motelab

  Harvard University

  190

  常年运转

  室内实验平台

  有线电源

  SensorScope

  EPFL

  97

  6个月

  室外应用系统

  干电池

  Trio

  UC Berkeley

  557

  4个月

  室外应用系统

  太阳能电池

  表1:四个典型无线传感网系统

  说到这里,明眼的读者可能会立刻问我一个尖锐的问题:什么是大规模?因特网上亿节点,手机网也是上亿的节点,从广义上说都可算是传感网,到了你这里怎么“千”就成了大规模了?原来的方法就不好用了?

  这是个非常好的问题,也非常难以用几句话说到点子上,我用一个也许不大恰当的比喻试着说说。在自组织网络里,没有中心节点,通信又是多跳的,国际上认为几百个就是大规模了。这就好比国庆表演集体操,如果事先演练好了,大家按流程来,几万人跳整齐了也不算太大的事。如果事先没有演练,而是由某个人来指挥,而大家都能直接听得见他的号令(类似单跳无线网络如移动手机网的情形),跳整齐了也不是多难的事。然而,事先没有演练,而指挥人不能同时给所有人发出他们直接听得见的号令,只能发给身边的几个人再慢慢一个个传开,临时碰上各种情况大家还要商量着来,那么可以想象要保证几百人整齐操练是多么困难。

  “绿野千传”感知林业

  为了探寻大规模自组织网的挑战的根源和解决方案,我们发起了“绿野千传”项目。当时提出了3个1的决心,即在一个野外的真实环境,部署超过一千个节点的无线传感网系统,连续运转一年以上。

  为什么选择了林业为应用背景呢?一方面,林业在可持续发展战略中占据重要地位,在生态建设中居于首要地位,在西部大开发中也意义重大,在应对全球气候变化中,更是种战略选择。2007年9月8日,胡锦涛主席在悉尼APEC非正式会议上提出了“森林方案”,强调通过森林恢复和增长,增加碳汇,减缓气候变化;2009年9月22日在纽约G20气候变化峰会上,他提出用“森林碳汇”来减缓气候变化——发展林业是应对全球气候变化的战略选择。

  另一方面,林业应用是在森林这个复杂系统的背景下展开的,森林物种繁多、类型多样、分布地域广阔、生长周期长,林业应用在时间上要求同步、持续性,在空间上要求范围广、测点多,还要求维持较低的人力和设备成本;林学已有的技术和方法难以满足上述条件,遭遇精确描述刻画系统结构与功能的难度大的瓶颈。就拿碳汇来说,大家都知道森林能固碳,但到底什么样的森林固多少二氧化碳,都是大致的估算,世界范围内也不能算有非常准的测量。因此,探寻新技术新方法势在必行。无线传感网低功耗、智能化自组织、大规模持续同步监测、低成本的诸多特点,是一个有效的解决林业应用瓶颈的可行方案。

  无线传感网与林业应用相结合,林业给予无线传感网技术足够强大的应用驱动力,而无线传感网的先进技术能给林业学科在研究方法和思维方式层面带来变革。基于这两点考虑,我们选择了林业作为着眼点。

  绿野千传的系统研发工作始于2008年下半年。到今天为止,前后参与的单位和人员除了香港科技大学,还包括浙江农林大学周国模教授、西安交大赵季中教授、杭州电子科大戴国骏教授、美国IIT李向阳教授、清华大学顾明教授、北京邮电大学马华东教授、哈工大李建中教授、同济大学蒋昌骏教授等。此外,这个项目还得到了自然基金委、科技部、国家林业局等单位专家直接或者间接的指导。2009年5月,项目组成功部署了一个120个节点的原型系统,到2009年10月,原型系统扩充至330个点,至今已经运转超过11个月(http://greenorbs.org/)。2009年8月,项目组在浙江省天目山脉实现了一个超过200个节点的实用系统,该系统至今已经连续运转超过8个月。

  为什么我们不一下子推到1000个节点呢?实际上,算上我们在浙江农林大学其他几个实验点部署的小型系统,总的节点数早已经超过1000,通过Internet,它们之间的数据都是互联互通的;而我们前前后后制造和测试的节点,已经超过2000个。但这还不是我们心目中真正的“千传”。虽然通过Sink和Internet,它们之间可以交换数据,也可以被认为是一个系统,但是我们这里追求的,是要在一个sink控制范围内的1000节点。

  突破壁垒 直面三大挑战

  通过一年多以来的观察和对系统收集的大量传感网数据的分析,我们对当前无线传感网突破大规模应用壁垒面临的根本挑战有了一点认识。我们总结为3个主要方面。

  首先,无线传感网传输和感知两大功能不匹配。主要表现为两种形式:一方面,图像、声音、视频等数据可以利用对应的图像和声音传感器直接获取,但这类数据量大,且经常要求实时传输,要通过带宽非常有限的无线多跳网络传送,难度很高。另一方面,不同应用需要各种各样的传感器数据,比如在林业应用中,二氧化碳含量和光谱数据具有广泛用途,地震波强度数据在防灾减灾中意义重大。这类数据量小,较易于传输,但现实的难题是,可以提供这些数据且适用于大规模部署的低成本传感器尚未成熟。直白地说:就是易感不易传、易传不易感。这个根本矛盾,直接导致无线传感网无法满足真实应用领域的感知需求。要解决这个矛盾,有若干关键问题亟待研究,包括设计高性能低功耗传感器以突破网络传输带宽瓶颈、设计与优化路由协议以提升可靠性和网络吞吐率,以及多模态数据融合和非确定性数据处理、异构传感网的体系结构和数据管理等等。我们把这个壁垒,称作“传感失谐”。

  其次,是网络管理方面的困难。与传统企业网络和因特网的节点多数在室内的环境相比,无线传感器节点经常在恶劣环境当中,风吹日晒、雪打雨淋。同时传感器节点的通信和计算资源极端有限,传统网络上类似SNMP类型的Agent汇报机制无法有效支持。更为严峻的是,传统网络即使断了,也比较容易判断是物理上断了,还是物理上仍然连接而是软件或者系统出了故障;而在传感网这里,断了就是断了,很难找到问题根源,给修复带来巨大困扰。我们把这个困难称为“诊判失据”。

  第三,大多数现有研究工作都基于理想化的模型假设,比如UDG或者quasi-UDG模型,忽略了无线传感网运行过程中伴随的各种不确定物理因素和可能的环境动态性。例如,定位算法大多基于规则的信号强度到物理距离的映射模型,覆盖算法设计很多是采用各向同性的确定性的感知模型,拓扑控制对传输半径及其可控性做了很多假设,但实际上连拓扑边的存在与否都要依赖于对link评估方式的定义。由此产生的研究成果,当系统规模小的时候还不明显,一旦规模大了,立刻显现出巨大的反差,无法直接应用于指导和仿真实用系统。我们称为“模型失用”。

  面临这些困难,我们当然有足够的理由怀疑传感网的实际应用到底还有多远。但是,不要紧,我们拍拍脑门想一想,如果把时间轴稍微拉得宽一点,很容易想到在不太远的未来,大多数日常物体都被连在网络上了,物理的Instrumented、互联的Interconnected、智能的Intellectual,应该就是这样的吧,有什么可以怀疑的呢?这样说来,我们今天做的探索,无论离正确还有多远,都在朝着未来走去。

  1970年,我爷爷60岁,早晨出门碰上大队书记,听见他口袋里竟然有人唱戏,惊讶而好奇,莫名其妙地跟了一路,忘了自己是捡粪来的;1990年,我20岁,拿到人生第一个可以录放的随身听,在没有暖气的初冬攒缩在学生宿舍被窝里手舞足蹈,任凭音乐响到凌晨断电,捂着吵得半聋的耳朵奔去食堂;2010年,我女儿5岁,在家里画画,顺手拿过桌上的iTouch, 在Internet上搜到No Body But You,唱着画着,怡然自得。

  图1 红色标记表示选定的传感器节点的一跳邻居最新的资料。在地图上显示的数据是原始数据,尚未经过校准。

  链接

  “绿野千传”简介

  森林作为陆地生态系统主体,在调节全球碳平衡、减缓大气CO2浓度上升,以及调节全球气候方面具有不可替代的作用。为了给林业生态监测提供可靠的原型系统,“绿野千传”应运而生。该系统能够为实现大规模林业监控提供技术支持和实践经验。

  系统的主要任务包括:一方面,“绿野千传”用于森林生态环境的全年监测,通过传感器收集包括温度、湿度、光照和二氧化碳浓度等多种数据。采集的信息为多种重要应用提供支持,如森林监测、森林观测和研究、火灾风险评估、野外救援等。另一方面,“绿野千传”是无线传感器网络研究领域就建立长期大规模无线传感器网络系统而进行的前瞻研究与探索。

  从宏观上看, “绿野千传”在搭建长时间千位级别的无线传感器网络的过程中,还面临很多具有研究意义的挑战。

  1. 轻量级网络诊断和管理;

  2. 在线故障检测、宽容和改正;

  3. 同步和调度;

  4. 硬件和软件的可靠性;

  5. 大规模低duty-cycle传感器网络中的数据收集。

  作者简介

  刘云浩毕业于清华大学自动化系,获工学学士学位;在北京外国语大学获文学硕士学位;在美国密歇根州立大学计算机系获得硕士和博士学位。目前刘云浩是香港科技大学计算机科学与工程系副教授、系研究生部主任(Post-Graduate Director),清华大学国家信息实验室特别研究员。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: