手机识人术

  “微软”二字已经不单单代表着一个软件公司,它更像是一个技术和人才交相辉映的时代的象征。从2009年1月5日起,《互联网周刊》将连续推出针对微软亚洲研究院的系列报道,带领读者领略微软的技术创新,寻找微软的企业文化,挖掘微软亚洲研究院背后的故事。

  谁说人机对话不能在物理维度与数字世界两个不同的介质间实现?Throw-to-Share是微软对移动设备使用体验的又一次颠覆。

  本刊记者 马荟

  “把两个手机放在一起的时候,所有的资源都将翻倍。两个屏幕可以变成一个大的屏幕看更高分辨率的视频;把手机带宽叠加,两路带宽下载速度可以快一倍;甚至手机键盘也可以扩充一倍。”微软亚洲研究院无线与网络组项目负责人沈国斌一边和记者说话的时候,一边还把玩着手里的两个手机,脸上不时地表现出兴奋和思考状。

  在这个让手机“合二为一”的想法上,沈国斌和他的研究团队开发出了“情侣手机”,并在2007年,由美国计算机协会(ACM)与高等计算机系统协会(USENIX)合办的、在移动计算和移动网络领域内讨论系统研究问题而最富盛名的顶级国际学术会议MobiSys上,发表论文,并获得了最佳演示奖。

  2008年的MobiSys会议,沈国斌研究员和他的团队凭借“Throw-to-Share”,再次获得最佳演示奖。这项用于移动设备间文件分享的创新技术是对移动设备使用体验的又一次颠覆:只要拿着手机朝着朋友的手机作势“扔”一下,“哔哔”两声,手机就可以轻而易举地和对方的手机无线相连;随手一“指”,手机刚刚拍下的照片就会显示在笔记本电脑上。

  这一指的动作好像把信息“甩了出去”,实际上它体现的是一种新的以服务为中心的移动网络范例:用户只需关心他们想要的服务,系统会负责所有建网的细节。Throw-to-Share印证了在采访过程中沈国斌多次提及的两个做研究的准则:酷和实用。而把信息一“甩”这个充满神奇和潇洒帅气感觉过程的诞生,却源于沈国斌求学时期的“尴尬”经历。

  来自食堂的灵感

  和微软亚洲研究院许多其他的创新成果一样,Throw-to-Share的价值和意义来源于生活中的实用主义。

  沈国斌在香港读书的时候,每次到食堂点菜都要“指手画脚”一番,因为他不会说粤语,食堂阿姨也不会普通话,他发现,当语言沟通出现障碍的时候,用“指”这种直观的方法最有效。还有一次,沈国斌和朋友在酒店大厅里用蓝牙传照片。从选择文件、选择对方的设备、到确认传输,整个过程两个人花了将近十分钟的时间。回想起这些类似的“麻烦”经历,在食堂点菜的方法给了他灵感。

  “用传统的方式比如蓝牙、WiFi传输文件的时候,因为周围可能有很多其他的手机,所以关键的第一步是找到对方的手机并建立网络连接。每个设备都有一个唯一的识别号,但是,人很难去理解和区分。常用的方法是通过设备名称。这种方法也不靠谱,因为没有一个统一的大家都遵守的给设备命名的准则。如果你随便搜索一下周边的蓝牙设备,你就会发现各种各样奇奇怪怪的名字。如果手机分享文件也像在食堂点菜那样一指,就不用这么麻烦了。”沈国斌对记者说道。

  Throw-to-Share的技术利用对于用户而言非常易于获得的设备位置来选择目标设备,而非那些难以理解或对应的设备名字或者网络地址,并且自动进行设备连接和身份认证。Throw-to-Share就是一个简单直观的移动设备文件共享的解决方案,尤其适用于没有技术背景的普通用户。

  平时游戏时产生天马行空的奇异想法、在生活中对每一个小细节的体验和改观、和朋友聊天时突然的灵感撞击,这些看起来充满高科技和未来感的创新,都是微软亚洲研究院的研究员们对生活细致观察和思考。

  创新极简主义

  要成为一个能够“识别”对方身份的手机,门槛并不高:有扬声器、有蓝牙等无线传输设备,再安装上Throw-to-Share软件就可以自由共享文件了。不过,这个看似简单的技术原理,实现起来并没有想象中那么容易。

  研究员彭春翌在给记者演示中可以看到,把刚刚拍好照片的手机对着另外一部手机往前一指,同时,手机发出两声“哔哔”的声音,在对面的手机就像听到了同伴的召唤,屏幕开始闪动,通过闪屏来告诉机主有另一台手机要与其分享文件,同时,手机界面会出现一个对话框,询问机主是否接受对方传输的文件,接受之后就可以传输文件了。整个过程不需要选择手机的型号也不用分辨机主的设置。

  但是,这个“一指”的动作是怎么让手机知道对方就是所要选择的对象呢?

  “技术难点就在于手机怎么知道是选它。”沈国斌说,人未必知道对方手机的名字,但看一眼就知道哪个手机是哪个人的。反之,手机虽然知道周围的每个设备,但却不能把设备和他的主人对应起来。仔细想想,你会发现人其实是通过看到手机与人的位置关系(手机握在手里)做出判断的。因此如果手机也能通过位置信息来做判断,那么这种利用物理的方式来识别是最好的方式,因为它最直观。

  如果对面有两个手机,你把你的手机指向其中的一个。那么利用三角不等式的关系,相对距离变化大的就是要选择的对象,因为对于另外的“干扰”手机来说,移动的手机与它之间的距离变化只是和真正要选择的手机之间距离变化的一个投影,这个距离变化并不是最大,所以手机会直接把这个对象排除掉。“而通过音频采样,机器‘听’到声音的时刻的些微不同就可以区分相对位置变化,进而区分身份。我们觉得比较酷的是,用声音这样一个简单的办法来做一个很实用的事情。”

  手机大开发

  Throw-to-Share的核心是一种基于自然手势的、安全的设备连接技术。这个仅有30+KB大小的软件,未来很可能会“摆”上微软新开的移动应用程序商店陈列架,或者直接成为Windows Mobile上的一个小功能。

  微软亚洲研究院让科幻电影里的高科技场景在现实中一个又一个实现,就有科技迷在看过Throw-to-Share的演示后评论道:看过电影《通缉令》的朋友,很容易因想象那一“甩”而兴奋起来。没错,到了2012年,信息就将以这样的方式传递。若把这项技术进一步延伸,跟智能家居相结合就会衍生出很多有用的功能,比如只需用手机一指某个柜子,柜子里装了什么就会转移到手机上供浏览,将来,用户找东西就再也不用翻箱倒柜。

  “作为研究人员,我们非常希望这个技术能够为大家所用,因为它真的方便了人们的生活。”沈国斌对记者说。研究院一直鼓励做系统研究,其中一个准则叫“Keep it Simple and Stupid”。一个好的系统一定是原理上简单,用起来方便,尽管可能在技术细节上非常地复杂。系统研究的关键是要有一个足够可行的核心想法,然后在技术细节上不断地完善,进而开发出许多既酷,又实用的应用。

  可以想象,微软基础研究覆盖在移动设备时,未来与苹果和谷歌正面交锋的是充满“个性”的微软式创新。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: