搜出未来——G世代的搜索技术

  • 来源:新潮电子
  • 关键字:
  • 发布时间:2009-07-20 14:26
  毫无疑问,我们目前正生活在一个以G字母开头的时代,每天上网使用Google,电脑里存储了GB级数的照片和影音文件,手机也进入了3G时代。不知道我们的读者有多少曾经看过那本《数字化生存》?在这本书里,张朝阳的老师尼葛洛庞帝开宗明义地是出:“计算不再只和计算机有关,它决定我们的生存。”或许我们现在可以用同样的话来表示搜索技术对于我们的影响:“搜索不再只和互联网有关,它决定我们的生活。”

  事实上,随着Google、百度的业务线逐渐扩散到传统互联网、移动互联网乃至“单机”数码设备和消费电子产品上,搜索这一互联网最为基础的应用开始成为我们生活中不可缺少的一部分。而垂直搜索等直接帮助我们获取相关信息的搜索技术则让我们体验到了“搜索无处不在”的快感和直指人心的便捷。或许用不了多久,搜索引擎将成为人类思想的解读者,深入到我们每一分每一秒的生活当中。

  搜索至上

  有人说,这是一个搜索崇拜的时代,搜索可以迅速从大量的信息中快速准确地获取到需要的部分,而这正是面临信息泛滥的我们所急需的技能。我们的头脑注定了不可能实现简单快速的信息筛选,而搜索技术恰好能帮助我们解决这一问题。互联网的发展史体现了人类在庞大信息的控制能力上的进步,大量的信息在通过互联网传递时,其最本质的、最有价值的信息经常被冗余的、重叠的、失真的信息所掩盖,而这正是搜索可以解决的问题。随着信息量的飞速增长,搜索将变得越来越重要。

  事实上,把目光放得更广阔一点,我们就会发现,在每天的日常生活中,我们都会受到信息过剩的影响。一方面-我们所急需和必需的信息要付出一定的成本费用才能得到;另-方面,大量的无用而重复信息却充斥着我们的生活。

  如何利用互联网提供的海量信息成为了互联网诞生以来最重要的问题之一。我们对信息的控制能力因为互联网的出现而变得空前强大,同时也因此变得更加困难。如何更好地使用互联网上的海量信息?搜索给了我们最好的方式。借助于搜索,搜索引擎的出现整合了众多网站的海量信息,同时简单方便的使用方式和将复杂的技术屏蔽在后台的实现方式为我们起到了信息导航与路灯的作用。

  从信息检索的需求来看,我们对搜索的需求有三种:对信息的需求、对导航的需求和对实体产品的需求。这三种需求对于不同的使用者来说,都有其不同的定位。对信息的需求是搜索的基础功能,通用搜索引擎可以很方便地满足这一需求,但不能满足用户的更深层次的需求;对导航的需求则体现在对于信息的垂直获取上,目前已经有相当多的垂直搜索引擎可以实现这一功能;而对于实体产品的需求-则是我们正在追求的搜索技术的未来方向之一,其中既包括了对于交易、买卖等线下行为的需求,也有对于在诸如笔记本、手机、数码相机、MP3等实体数码产品中使用搜索技术的需求。

  从现在来看,对信息的需求已经基本解决,对导航的需求正在逐步被解决,而对实体产品的需求还需要搜索技术的进一步发展。对于搜索技术的未来,我们希望借助搜索技术不仅是简单地获取信息,而是更进一步地成为信息消费的主人,让搜索引擎以“我”为中心。

  最完美的搜索应该基于用户而不是基于互联网,在理想的情况下,用户应该可以从任何一个终端发起请求,其搜索的范围也应该是全领域的。所以我们现在要解决的问题是如何将搜索技术移植到其他的平台上。而另-方面,我们对于搜索内容的需求越多,我们所需要的搜索方式也就越丰富,如何解决作为线上平台的搜索技术与线下实体产品的有效互动沟通和信息处理交互,是搜索技术向更广阔空间发展的关键所在。

  与此同时,搜索技术对于我们查找某一终端内部的海量信息也有很大的帮助。特别是在目前手机,掌上影音设备的容量飞速增长的同时,搜索核心技术以及多种表现和使用形式就变得格外引人关注。

  用自己的方式搜索

  说到搜索,大多数人第一个想到的就是Google和百度。搜索引擎的鼻祖Google最初想法是对网页进行搜索,其PageRank也是基于网页的特点进行设计的。毫无疑问,现在的搜索已经不再局限于搜索引擎诞生时的构想了。随着技术和用户的需求,搜索的范围开始扩展到图片、视频、音频的搜索。从另-方面来说,搜索范围的扩展使得搜索技术可以被应用在除互联网之外的其他实体产品上。不过,我们还是先来看看目前搜索技术可以帮助我们搜索什么样的信息。

  目前我们所接触到的信息,大部分都集中在文字、图片、音频和视频信息。文字信息就不用说了,目前关于文字信息的搜索已经比较成熟。GoogIe推出的Chrome浏览器,其不少功能都是基于文字搜索技术的,包括在地址栏输入访问地址的一部分即可搜索之前访问过的网址和已经加入书签的网址、保存文件时会自动搜索当前文件夹下是否存在同名文件、可以直接搜索访问过和下载过的历史文件等等。另外,GooqIe的Android手机操作系统中,在桌面也放置了一个搜索框,可以方便我们查找手机内的联系人、备忘录等信息,当然也可以直接搜索网上的信息。

  图片搜索技术的发展就远远比不上文字搜索技术了。目前Google的图片搜索还是集中在以文字关键词进行搜索,但是已经可以按照照片风格对搜索结果进行过滤,比如只搜索入脸、剪贴画或者线条画等等。同时,互联网上也已经出现了一些可以用图片搜索图片的搜索引擎,这种功能主要是通过对图片的颜色进行分析识别从而给出搜索结果。但由于使用图片幔索图片的搜索技术依赖于图片数据库的丰富程度,因此目前的应用并不广泛。

  另一个常用的搜索技术是对声音的搜索。目前在国内有不少研究机构致力于通过对声音的频率分析来进行搜索,不过似乎部还没有什么成功的商业产品。国外有一家名为midomi的音乐搜索引擎,可以通过提供音乐片段甚至于对着麦克风哼上一段音乐来搜索音乐。而另-方面,谷歌最新上线的音乐搜索也推出了一项名为“挑歌”的服务,可以通过设定的特征点来搜索相应的歌曲,从音乐自身几个维度来区分歌曲,并根据不同的维度组合获得相对应的歌曲。总的来说,声音的搜索技术目前应该比图片搜索技术的发展相对领先。

  而最为艰难的视频搜索目前就可以说仅仅是停留在概念上的研究了,从技术上来说并没有太大的发展,其主要原因恐怕是因为视频内容本身就是多重内容的综合体,首先要把这些内容按层级剥离开,然后再对各个层级进行搜索,其工作量和计算量都相对较大,而且匹配度需要考虑的因素也更多。

  其实,不管是文字搜索也好,图像、视频和音频搜索也罢,搜索技术的核心都是一个,也就是为用户在海量的信息中找到所需要的内容。从这一点上来看-搜索技术可以有更大的应用空间。

  2008年到2009年,互联网上先后出现了三个被称为“Google杀手”的搜索引擎.包括2008年7月底的cuil、2009年5月的Wolfram Alpha和微软刚刚推出的Bing。

  微软Bing新搜索引擎的主要特性是在搜索结果页面拥有“搜索结果分类显示”功能,这一基于语义分析的搜索技术能够帮助用户更方便地找到相关度更高的结果,但这一技术目前的优势都是基于基础运算法则的,其文字搜索相对于Google来说并不具备决定性优势。

  相比Google来说,CuiI或许能够提供更多数量的网页索引.检索速度也更快。而且Cuil会对每个网页的具体内容及每位网民的查询习惯进行分析。但这样的先进技术带来的就是服务器流量超载,由此造成返回的结果并不理想。

  而Wolfram AIDha与Google最大的不同在于它并不索引网页内容,而是根据指令返回知识,这一搜索结果也是通过自然语义搜索来实现的。Wolfram Alpha将搜索出来的结果进行归类和整理,并将其以标准化、结构化的方式展示出来。

  这三款搜索引擎的出现,在短时间内甚至是我们可以预想的未来里恐怕并不能撼动Gooqle的霸主地位。但从另一个角度来看,这三款搜索引擎给我们带来了新的搜索技术和方向。其中最关键的一点,就是让搜索开始从简单的“检索”向更复杂的“检索并整理”转变,也就是从目前的非结构化数据向结构化数据过渡。

  消费电子的搜索转身

  其实,搜索技术一直都在我们日常生活的左右,只是我们没有察觉到而已。

  举个最简单的例子,我们经常需要在手机里查找某条短信,这就是搜索,只不过是最简单的搜索而已。而不少智能手机现在都配备了智能拨号技术,也就是只要输入电话号码中的几个连续数字,手机就可以自动显示出具有相同组合的联系人及完整电话号码-这是当下搜索技术应用在手机设备上的简单体现。而在可以预见的未来-我们可以想象-在同样输入几个连续数字的时候,手机不仅会显示出联系人及完整电话号码,还会显示出矣于这个好友目前的公司、邮箱里与他的往来邮件、好友在开心网或是Twitter上的最新动向等等。

  由于声音搜索和图片搜索技术的逐渐成熟,消费电子的发展也可以开始借助搜索的力量。2006年,Google合伙创始人佩奇和雅虎首席执行官席梅尔在CES2006上发表主题演讲,这在CES的历史上还是第一次。佩奇和席梅尔的演讲将搜索引擎的发展导向了消费电子产品中。根据GoogIe和雅虎的说法.搜索技术将是在包括PC、电视机、机顶盒PDA、手机在内的任何设备上发布和访问数字媒体的关键,另一方面消费电子产品不管是否连接到互联网上都可以使用搜索技术,其区别就在于搜索的范围。

  我们现在可以想象一下,当搜索技术被全面地应用到消费电子产品之后,将会对我们使用消费电子产品带来什么样的改变。

  还是从手机说起吧。现在手机上网已经成为趋势,在我们到达一个之前没有去过的地方时,我们可以直接用手机登录搜索引擎的页面,搜索引擎会自动判别出所在的位置,并提供相应的地区服务信息,搜索的内容也都限制在特定地区中。这就是近几年炒得相当热的垂直搜索和本地搜索的概念。而就在此前不久的2009年5月4日,百度宣布与三星电子、联想、天宇等多家手机厂商合作,在手机菜单中预置百度图标,方便用户接入无线网。百度CTO李一男表示,用户通过百度无线搜索访问互联网网站,将比直接用手机访问这些网站节省90%的流量。

  我们的音乐播放器将可以通过我们念出的歌名甚至哼出的音乐自动检索到相应的歌曲并进行播放,如果播放器上没有这首歌曲的话,则可以将其记录下来,当播放器获得条件连接到互联网上时,就可以将需要的歌曲搜索并自动下载到播放器上,并同时搜索到匹配的歌词。而这一切完全无需人工干预,用户只需检查更新播放器内容即可。在苹果刚刚发布的iPhone 3GS上,这一功能已经部分被实现。

  而图片搜索的应用将更加广泛。在2~3年前,已经有不少数码相机的厂商开始在相机上装备Wi-Fi功能,同时也有厂商提供Wi-Fi的扩展附件。虽然Wi-F,网络的传输速度比较慢,要想通过相机的Wi-Fi接口来传输拍摄的照片特别是大尺寸的原片并不现实,不过Wi-Fi给我们在数码相机上使用搜索功能提供了更多的可能。比如我们来到巴黎的埃菲尔铁塔,就可以拍下一张埃菲尔铁塔的照片,然后将其缩略图通过Wi-Fi传输到互联网上进行搜索,同时可以将关于埃菲尔铁塔的相关介绍、周边环境、行车路线等等详尽资料传输到相机或者是事先绑定的手机甚至笔记本电脑上,同时还可以即时和周边的服务提供商进行互动。

  图片搜索的另外一个应用是可以帮助我们从数码相机里拍摄到的海量图片中搜索所需要的内容,比如我们可以将需要查找的某个特定人物的照片拍摄下来,并使用相机内置的搜索功能在相机内保存的照片里进行搜索,将所需要的特定人物的照片及相关拍摄参数全部展现出来。

  搜索就是未来

  2008年初,微软、Gooal、雅虎三大搜索引擎厂商对未来数年内搜索引擎技术的发展方向表达了自己的看法。MSN认为搜索引擎的用户界面将出现重大变化,用户将无需在一个文本框中输入搜索关键字,而是可以提供更多详细的搜索内容。GooaIe则主张基础性技术的变化才是最重要的-技术的进步意味着用户无需再提供更多的信息-因为搜索技术能够更好地理解用户的需求。而雅虎则认为新的突破将是社会搜索,影响搜索结果排名的应当是用户而不是网站管理员。社会搜索能够实现信息相关度的民主化,使普通用户能够决定对于他们和其他用户而言什么是重要的。

  IBM搜索技术负责人DavidKonopnicki表示,搜索引擎有两种使用方法,分别是发现和获得。通常在需要“发现”网络上可用的资源时,在开始进行搜索之前我们并不清楚可能存在什么样的资源:另-方面,当我们在相机里搜索照片的时候.我们知道有这么一张照片存在,只是不知道他在哪里,也就是说,我们在试图“获得”某项已经存在的信息。换句话说一寻找关于某个特定主题所存在的内容与寻找某项已经知道的特定信息,这两种搜索是不相同的。

  对于搜索在消费电子上的应用来说,不管未来搜索技术会向哪个方向发展,搜索对于消费电子的渗透都是注定的,因为消费电子的使用者也将面临如同互联网使用者一样的信息越来越庞杂的问题。而发现和获得这两种搜索的使用方式将会在消费电子的搜索使用界面上出现统一。搜索对于消费电子产品来说只是一项附加服务,虽然必需但是并不是最重要的服务。

  另外,当我们在消费电子产品上进行搜索时,我们只有一个入口,但我们希望能够通过多个来源进行搜索,这就类似于目前互联网上层出不穷的诸如“百谷虎”、“百Google度”这样的整合搜索网站。在这种情况下,消费电子产品的搜索技术可能更多会需要采用联合和聚合这两种方式。联合是使用特定工具注册所有可用的搜索引擎,搜索请求转发给所有这些搜索引擎然后检索结果,并在单个列表中显示经过组合的结果。而聚合则是通过中央搜索引擎汇总所有的搜索内容,对某个位置进行搜索并从所有的来源返回统一的结果。

  在这样的情况下,如何提供简单有效而且有一定分类排列的搜索结果就显得尤为重要。所以说,在消费电子产品上使用的搜索引擎恐怕比传统互联网的搜索引擎更需要整合和结构化,消费电子产品的用户在使用搜索引擎时,恐怕没有太多的耐心一页页翻看冗长的搜索结果。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: