互联网如何懂你?

  • 来源:计算机世界
  • 关键字:互联网,谷歌,Facebook,Pandora
  • 发布时间:2011-10-28 11:01
  谷歌帮助我们思考,Facebook帮助我们交友,Pandora播放属于我们自己的个性化音乐..很难说这些用来预测大众需求的互联网服务是在把我们变成玩偶还是变成天才,但是它们的确对我们的消费爱好、购买习惯和数字生活方面的决定带来了巨大影响。

  早在20世纪互联网还没有流行开来的时候,我们的生活简单得多,当然也困难得多:我们不知道哪些商品最好卖;我们也不知道当天最“重要”的新闻是什么;在决定接下来租哪部DVD电影时根本得不到帮助。而今天,搜索引擎帮助了我们,只要在谷歌上输入几个简单的关键字,谷歌就可以提供给我们这些问题的答案。

  互联网的功能越来越强大并不仅限于帮助消费者寻求信息或产品,很多公司和政府部门也在利用这些互联网服务背后的技术提高处理库存控制的效率。而另一方面,互联网也让我们陷于尴尬境地:广告商和政府部门结合行为数据和数据模型,预测和操纵我们接下来的行为或购买。

  对于互联网技术迷而言,互联网好比数据的乐园,可以用来建立模型、预测行为,也可以用来跟踪网上的IP地址,了解人们在访问什么网站、何时访问、计算横幅广告点击次数以及从社交网络采集数据,这一切要比成天带着写字夹板围在人家身边容易得多。那么,这一切是怎么做到的?

  向你推荐新闻

  谈到互联网服务,最为我们熟知的恐怕是搜索了,坐拥高达1930亿美元市值的谷歌雄霸搜索引擎市场,其独特的搜索算法功不可没。

  实际上,除了搜索引擎以外,谷歌还在很多领域进行探索,新闻推荐就是其中之一。这项服务基于其新闻算法,用来支撑GoogleNews(谷歌新闻)这类大受欢迎的服务。有了该服务后,如果你很想知道当日的头条新闻是什么,没必要请教《纽约时报》的编辑大人们,而是只要访问谷歌新闻或雅虎新闻,就能知道谷歌的算法评选出来的当下头条新闻。

  谷歌新闻根据一长串的文章属性(包括关键字、原创性、时效性、质量和资料来源的权威性等)来评估什么是重要新闻。当然,其算法的具体实现并不为人所熟知,人们对其结果也有疑问。比如,注重调查性和解释性的新闻报道会不会被一贯青睐最新颖、最抢眼内容的新闻所压倒?但不可否认的是,新闻服务的确可以为我们提供一定的帮助。

  帮你交朋友

  当然,Facebook的社交算法可以帮你找到中学时代的老朋友和以前的同事,不过它的作用不仅仅是查找朋友、确定谁的Facebook更新信息出现在你的Facebook“头条新闻”(TopNews)新闻源。该算法名为EdgeRank,EdgeRank综合使用了诸多因素,比如你与某人的熟悉程度、消息的类型(喜欢、留言还是标签)以及帖子的发布时间。

  最近,Facebook加大了其在社交算法方面的力度:把社交算法与面部识别软件联系起来,分析上传至该服务商的每张照片,比如你上个周末在海边搞派对时拍摄的照片,Facebook的7.5亿个用户总共上传了大约200亿张照片。在你把照片上传到Facebook后,该服务商使用面部识别软件,并动用你的直接和间接社交圈,识别照片中的人是谁;然后它会问你想不想给照片中的人添加标签(标注身份)。虽然加不加标签由你来选择,但这一点也引发了隐私权保护主义者的担忧。

  帮你恋爱

  彼此“来电”也许是人类恋爱现象的决定性因素,而互联网技术就为许多使用eHarmony和Match.com等在线约会服务的人提供了相识的机会。替一对对潜在的情侣们找到妙不可言的情愫对接点,要求交友网站对用户的个人魅力测试进行运算,而不仅仅着眼于一些基本状况,比如某人是“犹太人,不抽烟,喜欢跳摇摆舞”。

  eHarmony服务网站把你对该网站提出的258道问题的性格测试答案作为到这家公司的最高商业机密——恋爱算法的数据源。eHarmony在2008年刊于《纽约时报》上的一篇文章中表示,先后有1900万人参加了其性格测试。委托第三方进行的调查得出了这样一个结论:在2007年的美国结婚总数当中,有2%是通过它促成的。

  向你推荐广告

  在线广告网站是互联网技术的最积极推动者,其目的是在合适的时段向合适的人显示合适的广告,而能否成功完成这个使命关系到能不能做成买卖。

  为了加大成交的可能性,广告商们运用各种复杂的算法对复杂的数据组合进行交叉分析。不过,这些算法实在太错综复杂了,要掌握它们实属不易。简而言之,精明的在线广告商综合运用了关于你的传统人口统计数据和你的上网浏览习惯,目的就是让针对性的在线广告能吸引你。

  一些观察人士认为,有些广告可以分析你的个人情况,并根据你的上网习惯提供相关的内容,它们可以帮助网络内容所有者维持经营、提供高质量的内容。另一些人士则表示,把录有用户个人资料的庞大数据库交给私人公司保管好比是让狐狸来看管鸡舍。

  向你推荐商品

  亚马逊的推荐引擎是否摸透了你的心思?也许吧!

  亚马逊的算法可以客观地分析数百万顾客的购买模式。比如,你购买了AnnPatchett所著的《神奇的国度》一书,亚马逊会根据购买了《神奇的国度》的其他人购买的书来推荐其他书。因而,亚马逊也许能够将你原本没有打算购买的别的书卖给你。

  推荐服务让亚马逊等网络商家能够额外销售数十亿美元的商品,因为可以帮助顾客找到所需的商品,并且促进即兴购买。亚马逊的发言人在接受媒体采访时曾说过:“算法是我们网站的经营之道,并让我们成为独一无二的购物乐园。”

  2009年,Netflix向一群统计人员发放了100万美元的奖金,原因是他们成功地提高了这家电影租赁公司在预测顾客会喜欢租哪些电影上的正确性。为了争夺这笔奖金,他们不仅考虑了人口统计数据和行为数据,另外还要考虑邮政编码、电影类型分级和1亿则电影评论。

  知道你的音乐爱好

  音乐服务商Pandora单凭一首歌曲就能异常准确地知道音乐爱好者的偏好——算法在这里再次发挥了作用。据Pandora的音乐基因组计划(MusicGenomeProject)发起人兼Pandora联合创始人TimWestergren声称,这项计划旨在“从根本层面抓住音乐的本质”。

  Pandora表示,它使用了400个属性来描述一首歌曲。据Pandora在Facebook上的页面显示,接下来,该服务商的算法会分析来自一首歌曲的这些数据,然后选择“播放与你原先选播的歌曲在‘声学上相似’,但未必总是‘听起来相似’的一系列歌曲”。

  尽管与之竞争的其他在线音乐服务商近些年步履维艰,但Pandora却声称其用户群在不断扩大,注册用户多达1亿个,其中3600个是活跃用户。

  链接

  互联网技术的尴尬

  毫无疑问,互联网给我们带来很多方便,但是,互联网技术是一把双刃剑,有人利用这些技术达成自己的私利。比如,许多公司的商业模式就是创建一些内容质量不高的网页和网站,这些网页或者网站针对搜索引擎进行了专门优化从而能在谷歌新闻或谷歌的主搜索结果排名靠前,这些公司通过在这样的网页发布广告来赚钱。这种所谓的内容农场(contentfarm)在提升谷歌搜索结果中的排名方面颇有成效。今年2月谷歌调整了其搜索算法,从而使得这些低质量网站在其搜索结果中的排名下降。

  最近,《纽约时报》揭露了连锁百货商店JCPenney人为抬高在谷歌页面排名的作法,即建立成千上万个第三方链接和网站,它们旨在提升这家公司在谷歌搜索结果中的知名度。JCPenney矢口否认知道有任何欺骗行为,但谷歌最后开出了罚单:下调了这家公司在搜索结果中的排名。

  如今,谷歌搜索算法一时的变动就可能决定着小公司的成败。2006年,总部设在加利福尼亚州的KinderStart.com将谷歌告到了联邦法院,指控谷歌改变算法,导致其网站在搜索结果中排名很低,导致这家公司蒙受了重大的经济损失。最终,KinderStart.com输掉了这场官司,对谷歌提出类似诉讼的其他公司同样打输了。

  互联网技术的第二尴尬就是人们对自身隐私权的担忧,大量的互联网技术应用是否意味着我们再也不会有自由选择权和隐私权?这场争论将会持续好多年。隐私专家们提醒,随着我们快速步入到拥有庞大数据库的超级计算机时代,越来越需要隐私保护,以免被政府、反社会的黑客和各种不良公司利用。遗憾的是,鲜有法律在这方面跟得上技术的步伐。

  目前,美国做出了一些尝试,美国禁止跟踪的立法正在提交国会审批,地方州政府提出的其他倡议也附带着解决公司如何收集和使用数据的问题。不过到目前为止,隐私问题仍是人们对这些互联网技术最主要的担心之一。

  清水 编译
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: