鼠标终结者?

  2009年末,印度小子普拉纳夫.米斯特利(PranavMistry)戴着简单的投影设备,仅通过身体手势就可以打电话和收发邮件的视频在互联网上受到了热捧。这个名为“第六感”的新设备在视频录制现场的TED(Technology,Entertainment,Design)大会上展示,主办者——见多识广的《连线》杂志主编克里斯.安德森将该发明称作“当今世界上最顶尖的两到三个发明之一”。目前“第六感”的设计难称精巧,甚至有些粗陋,但其对于长期困扰着人们的人机对话技术却产生了巨大影响,甚至意味着某天人们真的可以将鼠标扔进垃圾桶来实现与电脑真正的人机对话。

  人机对话的“第三只眼”

  在这段视频中,来自人机互动技术创新重镇——麻省理工学院媒体实验室的印度籍博士生普拉纳夫. 米斯特利 ( Pranav Mistry)展示了他的发明。展示中既没有复杂的电子设备,也没有炫酷的大幅显示屏,米斯特利就像在表演徒手魔术,用一双套有不同颜色指套的手展示着曾经只有在科幻电影中才能见到的人机交流场景:用手凭空比做取景框的样子,就能够将框中景物拍成数码照片;用手指在手臂上虚画个圈,上面便会投射出表盘图像,供人读取时间;想打个网络电话,摊开手掌,点击上面显示出的拨号盘,就真的可以以手为机打电话了;用手指在空中画出一个@,系统立刻打开邮箱查收邮件;读报纸或者书籍时想了解更多延伸信息,可以把纸面当作触摸屏,直接在纸上指指戳戳便可以点开相关视频或网页;觉得作者某段文字写得不错,想留作参考?用手指抓取纸上这段话,抛在你电脑屏幕上的空白文档里就好了。

  不用在电脑菜单里找来找去,不必学习软件的功能键在哪里,做个人人都懂的手势,电脑立刻心领神会并进行操作。不需要键盘鼠标、昂贵的触摸板,任何平面——白纸、桌子、报纸、手臂甚至空气都能拿来作为“触媒”。更酷的是,这套设备看起来既简单又便宜——一个摄像头(和一面镜子)、一台微型投影仪和一个可实现高速无线上网的智能手机,经过后续改进,连指套都已经被省略掉,仅凭摄像头便能识别各种手势。

  虽然还未商用成型,但是它的便携性是无可置疑的。米斯特利携带这套设备的方式是:用一根绳子将三种便携设备串起来挂在脖子上。最初,他干脆称它为WUW (Wear Ur World,“戴上你的世界”)。最终这款设备被称为“第六感”,原因在于,在米斯特利看来,与目前占据统治地位的“鼠标+ 键盘”的人机互动方式相比较,该设备如同人类的视觉、听觉等五种感官一样可随时随地应用,如同获得了第三只眼睛或者被加强的脑神经系统,它的效用近似于赋予人类第六种感官,使获取网络信息如同隔空取物一般自然。

  “第六感”的技术原理并不复杂。首先,它通过摄像机跟踪手势信息并采集外部图像数据,然后传输给连接高速无线网络的智能手机;智能手机利用基于云计算和本地运算的强大运算平台对手势信息进行识别和分析后,将分析结果传输给微型投影仪;在此之后,微型投影仪便可以在任何平面上(墙面、桌面甚至手掌和别人的衣服)上以图像方式输出信息。

  简单的结构使得“第六感”的成本颇具竞争力。成长于印度的发明者将这款设备的成本控制在350 美元以内,这使其潜在的商用前景显得极为诱人。目前,米斯特利正和三星公司合作开发一款带有投影仪的手机产品。谈及这款产品,米斯特利认为它实现了程序简化和功能提升,与一般智能手机相比,它增加了手势识别和投影成像的功能,使人机互动界面更丰富和自然。

  “廉价对话”的开端

  “第六感”既非第一个人机互动方面的技术创新,技术也不是最深奥前卫的,但它的可实现性和使用的人性化程度使得它成为最被看好的“鼠标终结者”。它使得人机互动更为简易自由,摆脱了鼠标和键盘的生硬界面和笨重的显示设备(尽管已经越来越轻薄和便携),更重要的是,它逐渐接近“人性化交互设计”的倡导者阿兰. 库珀所谓的“最好的人机互动界面的标准”——自然贴合人类行为习惯,甚至在使用中都让人浑然不觉。

  长久以来,人们端坐在电脑前,眼睛直视前方的屏幕,检视着手指在键盘敲出的字符和鼠标的光标移动。与之前通过复杂编程方能实现人机互动相比,鼠标的发明无疑是一个巨大的进步。

  它更形象化、直观化,更符合人体工学的使用方式,使得电脑的操作者不再仅限于程序员,而扩大到掌握简单操作技能的普罗大众。它的简易化操作和低廉的价格使得个人电脑在全球的普及成为了现实。这些因素也使得它从20世纪60年代以来一直占据着人机互动设备绝对的霸主地位,几乎无人可以撼动。

  正因为如此,发展遭遇瓶颈的人机互动设备也成为创新的热点区域。麻省理工学院媒体实验室的创始人尼葛洛庞帝在互联网兴起时代名动世界的著作《数字化生存》中就呼吁:创建更好的人机互动界面,开发更符合人类行为习惯的互动方式。尼葛洛庞帝本人早在30年前就提出了“交谈式计算机”的理念,并且领导媒体实验室在新一代多通道用户界面进行了大量研究工作。

  2008年比尔. 盖茨也提出“自然用户界面”(natural user interface)设想。他预言,5年之内,键盘和鼠标的霸权时代将终止,人机互动模式将得到显著的丰富和改观。可以肯定的是,该领域并不缺乏令人眼前一亮的创新成果。多点触控、语音识别、触觉交互、身势识别、眼动跟踪等层出不穷的新方式正呈现出接手未来的气象。然而,现实的残酷在于,创新并不意味着大规模应用的未来。

  本世纪初几大电脑硬件厂商集中关注的触屏电脑即为一例。用全触控方式与电脑交流无疑实现了交互方式上的极大创新,但其数千美金的造价使其商用前景遭遇冰山。与华丽的全触控功能相比,更多用户倾向于继续使用鼠标。在他们看来,售价仅为几美金到几十美金的鼠标显然性价比更高。两者之间的使用便捷度之差还不足以驱使他们多耗费几千美金。超薄、超轻、可以随意折叠卷曲的柔性显示屏也因为价格上的巨大落差至今未能进入市场。

  与它们相比,“第六感”设备所引发的关注热潮不仅表明设计理念本身的革新,更令人们激动的是其构造的简易及其所代表的低廉造价。人类对人机互动体验的需求正在进入全新的时代,但同时,人类并未放弃一直以来对于更佳便携度和更低价格的追求。在未来移动终端数量远远超越个人电脑的时代,只需在智能手机等移动终端上接入一个摄像头和一个微型投影仪,用350 美元(大规模投入商用之后价格更低)实现全触控电脑等几千美元设备所无法实现的功能,这无法不让硬件制造商和用户欢欣鼓舞。

  因此,“第六感”不仅在极短时间内就获得商用重视,也被考虑用于改善其他领域的人机互动界面。米斯特利已经得到印度非政府组织的邀请,为印度残障人士开发“第六感”相关产品,尤其是为无法应用语言进行沟通的聋哑人士设计带有语音转换和发声功能的交互设备。相比较“第六感”的商用前景,米斯特利更看重的是其应用前景,他希望世界上每一个角落的人,不分职业、民族和年龄,都可以应用“第六感”设备改善生活:医生更便捷地找到出诊地点,更方便地调用病灶信息和进行会诊;老师进行更灵活的教学,随时采撷教学素材对学生进行沟通和辅导。

  目前看来,“第六感”技术因为采用手势控制的输入系统,可能会出现错误率比使用鼠标高、操作精细度有限等问题。因此,目前,“第六感”的应用更主要集中在对视图、旋转、缩放操作以及游戏和各种短时间休闲应用上(长时间举着手臂的难度比较大),而文件处理、数据处理等较为精细的任务则仍需技术改良。

  实际上,这并不是米斯特利第一次对改进人机互动方式所作的努力。早在2001年,他就对键盘和鼠标动起了心思:为什么人们不能像现实生活中使用手势一样对电脑发号施令,为什么人机互动需要通过并不直观的方式实现呢?

  他的最早尝试是直接对鼠标的构造开刀:他拆下四个鼠标的滚轴,将其制成了一个名为DATAG的“动能感应装置”,可以完整地将现实中的手势复制到电脑中;之后他又设计出能把笔写下的信息转换为短信和数字备忘录的“智能便利贴”,以及能在电脑中直接画出三维图像的“三维成像笔”(inktuitive)。在此之后,他又陆感反馈。

  在2009年E3大展上,微软和索尼公司均正式推出了体感游戏装置。其中微软的Kinect通过彩色摄像机、红外线发射器和3D深度传感器以及多点列阵麦克风和可处理专用软件的处理器组成的集成装备全面监测玩家的全身动作,并将捕捉到的影像与内置的人体模型相对照。每一个符合人体模型的动作会构建相关的骨骼模型,通过系统转换为虚拟角色。

  该角色通过识别人体骨骼模型的关键部位,进行动作触发。Kinect可以同时获取彩色影像、3D深度影像和经过降噪处理的声音讯号,虽然其精准度在和Play Station Move产品对比时遭到质疑,但Kinect的全身体感优势比Wii和PlayStation Move更能实现酣畅的运动娱乐。

  与只能通过手柄操作的Wii相比,Kinect可让玩家全身每一个部位均可充当手柄,不仅如此,它可实现人脸和语音识别。更令人激动的是,Kinect将内置一款名为VideoKinect的即时通讯工具,无需耳机、无需手动调整镜头,只要你在Kinect摄像头的捕捉范围之内,便可在随意移动中与好友实时聊天。

  微软公司在该装置3D侦测技术上的技术合作商PrimeSense的全球销售及CMO——UziBreier表示,该公司与微软的合作只是起点(该技术将在今年11月发布的Xbox360和Kinect中得到全面应用),PrimeSense的技术也将在日后逐渐用于医药、汽车以及电视、电脑等众多消费品上。

  《快公司》杂志的撰稿人乔万尼. 卡拉布罗(Giovanni Calabro) 展现了对Kinect同款技术的全面畅想——这几乎可被看作是人性化人机互动方式的一次集中演练:下班之后向车库走去,汽车会自动进行人脸识别,无需钥匙便可自动开门;坐进车内,车身会迅速丈量他的体重和身高并据此调整安全气囊的设置;在驾车过程中点一下头,车内便会自动播放自己喜爱的歌曲;到家之后,通过手势便可启动家庭娱乐系统,通过人脸识别打开他的通讯名录,用手指进行滑动和选择即可开始电话会议……尽管目前这仍是无法确定日期的幻想,但是谁都无法否认,这场变革已经在急速酝酿。

  在这场变革中,人机互动将从过去倾向于人类对计算机的适应和学习,发展成为改善计算机的用户体验,以更移动化、随身化、智能化、嵌入化的操作系统去迁就人类行为习惯的趋势。

  未来的计算设备需要读懂、看懂甚至感应到人类的思维。随着相应技术的不断发展,人们可以期待在并不遥远的未来,手指的轻微动作,眼珠、嘴巴、舌头或者耳朵的转动,甚至大脑中的一丝闪念都可以启动人机互动的进程,而那时的计算机也将以更符合人类需求的方式无所不在地隐藏在我们身居环境的各个角落中,就如同微软在《2019》的概念宣传片中所描绘的场景一样令人神往。更重要的是,它通过少量花费便可获取,在极为便捷的操作中,来自印度或非洲的平民使用它们改善自己的生活。这一切将不再是关于世界大同的幻梦。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: