2010年春晚,牛莉、郭冬临的小品《一句话的事》反响平平,但播出后一位网友在时尚论坛发出了《牛莉的大衣什么牌子?真好看!》的帖子,却在网络上掀起了一阵人肉大潮,搜遍各大品牌官网与秀场图片,第二天网友终于找出了这件大衣的品牌:Prada。
这样的情形不少人应该都经历过:看到明星穿着自己喜欢的衣服,想买同款或相似款,但又不知其品牌;看到一张喜欢的图片,想设为壁纸,却因为像素太低或水印很大用不了;逛街时看上了某位路人穿的衣服,不好意思上前询问,但又不知道怎么找到相似款式;想在购物网站上搜索一件衣服、一双鞋,但又不知道用什么关键词最贴切;看到美丽的景点、建筑,却不知其名,所在何处……
不再需要为关键词冥思苦想,不再需要进行大规模人肉搜索,以上这种种问题,未来都可能通过图像搜索,用“以图搜图”的方式来解决。
以图搜图,顾名思义,用户可以通过上传本地图片或输入网络图片的URL地址来搜索相同或相似的图形图像,是搜索引擎的一种细分。
图像搜索在互联网领域早已不是什么新鲜事,国内外各大搜索引擎谷歌、百度、搜狗等,都推出了自己的图像搜索,还有一些独立的图像搜索引擎,如Tineye等。通过这些图像搜索引擎,用户可以发现图片的来源与相关信息,寻找更高分辨率版本的图片,搜索相似风格或色调的图片,还可以用来追踪图片(如自己的照片)在互联网的传播等。
以图搜图是如何运作的?以谷歌的图像搜索引擎为例,其并非通过文件名、所在域名或是被嵌入页面的关键字来识别。当用户启动图片搜索,谷歌在后台通过复杂的算法分析该图片,将其分离成不同的特征(features)小块,捕捉到图片的颜色、纹理和图形等特征。然后后台服务器会将这些信息与来自互联网的几百亿张图片进行特征匹配,将查询结果反馈给用户。
相对于这一类单纯图像搜索,图片购物搜索引擎,例如今年7月上线的淘宝图想(http://imagine.taobao.com/),则将图像搜索与电子商务紧密地结合了起来。
打开图想,通过上传图片或粘贴图片地址进行搜索,结果会以环状云图的方式呈现,最内圈商品相似度最高,向外依次递减。每个搜索出的商品都显示了价格,用户可以直接点击进入购物页面。
图像搜索由于需要海量数据库、先进的图像特征识别技术以及超大规模实时计算能力,所以门槛很高,且目前技术也还不够完善。而淘宝图片导购组负责人认为,淘宝做图像搜索有着先天的优势:“淘宝的网页都是统一化的,每个商品图片已经打上了相应的标签(tag),这些标签有助于图片的识别,不会是漫无目的地去搜索。”
图想将物品分成两类:一类为刚体物品,刚体物品是不变形的,例如电脑、茶杯等;而非刚体的外形则很易变,如衣服。就搜索来说,刚体搜索较为简单,非刚体搜索对技术的要求更高。
从另一个维度,物品可以被分为标品和非标品。电子商务网站都会为商品打上SKU(最小存货单位)标签,这类为标品;而也有很多商品,比如衣服,由于厂家、品牌太多,更新换代太快,尺寸类型太多等原因,很难打上标签,这类则为非标品。图想认为非标类商品超过了电子商务零售50%的市场份额,由于难以用关键词准确描述,是图像搜索的主要搜索对象。
淘宝图想的尝试,是因为其看到了图像搜索在商业化应用方面的广阔前景。上述负责人认为,图像搜索的市场巨大,“凡是电子商务零售市场,都可以成为图像搜索市场,标品、非标品,刚体、非刚体都可以成为搜索对象”。另外,据图想粗略估算,互联网上大概有20%的图片都是具有导购功能的,即搜索起来能够给电子商务带来成交可能性。举例来说,一些山水图片可能较难带来成交,但很多人物图片、社会新闻类图片等,是具有一定导购功能的。图想认为,来自电子商务网站的图片只是最基础、最少的一部分,在电商网站以外的海量具有导购功能的图片价值可能更大。
而对于大规模的商业化运作,上述负责人坦言,淘宝的图像搜索“就像是刚生下来的孩子,先活好再说,我们现在不太会考虑商业化方面的东西,目前把用户体验做好是第一位的。只要用户喜欢的东西,一定有商业价值”。
对于图像搜索用户体验的提升,可以从三个维度进行衡量:精确度、反应速度与广度。精确度对于搜索是最重要的,在未来图想可能将图像搜索与文本搜索做结合,进一步提高搜索精确度,例如以图搜索的同时加上一个或几个关键词。反应速度方面,图想希望做到能在3秒内呈现搜索结果。广度方面,目前每次搜索都需要用户选择对应类目,图想希望以后能够不限类目进行搜索,用户操作更简便,但同时对后台的计算能力要求也更高。
图像搜索作为革命性的应用,各大互联网巨头在该领域的探索体现了它的巨大价值,在未来几年内,图像搜索技术将会不断完善,而对图像搜索商业价值的想象与挖掘亦在不断进行中,前景令人期待。
……
关注读览天下微信,
100万篇深度好文,
等你来看……