情感分析器

  • 来源:21世纪商业评论
  • 关键字:情感分析器,Twitter,卡夫
  • 发布时间:2011-10-12 13:12
  2011年8月,卡夫食品旗下的果冻品牌Jell-O在纽约市的街角树立了一块大型布丁脸情绪指数牌。这个牌子将搜索分析Twitter用户的笑脸符和苦瓜脸符,通过统计在任何时刻表现开心或悲伤情绪的人数百分比,从而令指数牌上的布丁脸呈现出灿烂笑容或悲伤失落的脸谱形象。不仅如此,不久之前,世界首家基于社交媒体的对冲基金Derwent Capital Markets在屡次跳票后终于上线。基金创始人保罗.郝汀(PaulHawtin)在发布会上表示:“长期以来,投资者已经广泛地认可金融市场由恐惧和贪婪驱使,但我们从未拥有一种技术或数据来量化人们的情感。Derwent就是要通过即时关注Twitter中的公众情绪指导投资。”如今,Twitter已经不再是一个简单的SNS社交工具,而是可以判别你心情的晴雨娃娃。

  2006年,在AlanMislove博士的带领下,研究人员曾对美国所有的Twitter内容进行持续监控,通过一个系统捕捉其中所有表达情绪和喜好的关键词。例如,凡是出现钻石、爱、天堂等词,都被归为高兴一类,在地图中用绿色表示;而涉及自杀、强奸、葬礼等词则代表不高兴,用红色标注。在红绿色之间,研究人员通过颜色渐变设置了9个等级,以此对感情程度进行细分。

  研究人员在一个抽象的美国版图上模拟了人们一天24小时的心情变化,在每天的下午4点左右,地图上几乎全部变成了偏红的颜色,而到了晚上10点左右,大片的绿色开始出现。这恰好与人体的生物钟相吻合,人在下午这个时间段的确表现出更多的易怒倾向;而到了晚上临睡前,心情比较放松、愉悦。研究报告还显示,美国人通常在周日最开心,而到了周四晚上,心情则降到谷底。

  事实上,这些实验的基础都是根据2010年印第安那大学的约翰.博伦(JohanBollen)和曼彻斯特大学的三位学者的研究,博伦曾利用两种不同的情绪跟踪工具来分析Twitter上将近1000万条微博的文本。第一个工具叫OpinionFinder,是由匹兹堡大学所开发的一个开源软件包。第二个工具是由三位学者开发的基于“情绪状态量表”(POMS)的算法。POMS原本是心理医生用来检测疗法改变或药物摄取对病人情绪状态影响的手段。通过利用谷歌分析所有公开网页中25亿个短语序列的“字词重复率”,三位学者将标准POMS问卷中的72种描述扩充至964种之多。最后,研究者们再将扩充之后的词汇归为6种情绪类别:冷静、警惕、确信、重要、和善、快乐。他们的重大发现是:在这个基于谷歌的POMS测量法中,只有“冷静”具有预测价值。不过令人震惊的是,单靠这一情绪指标就能预测未来3-4天道琼斯工业平均指数的每日收盘涨跌,准确率高达87.6%。

  紧随着博伦的研究,慕尼黑工业大学的两位学者又对Twitter进行了更为细致的分析。他们筛选出提到标准普尔100指数中的公司的推文,分为“买入”、“持有”或“卖出”三类,并算出每支股票的看涨程度。结果同样鼓舞人心。例如,推文的总数和交易量,看涨程度和标准普尔100指数之间,都有密切相关。更具操作意义的是,如果投资者采取“买入”看涨程度最高的3支股票,“卖出”最低3支的策略,半年便有高达15%的收益。

  美国佩斯大学的博士生亚瑟.奥康纳(ArthurO’Connor),则采用了另外一种思路。他追踪了星巴克、可口可乐和耐克三家公司在社交媒体上的受欢迎程度,同时比较它们的股价。他发现,Facebook上的粉丝数、Twitter上的听众数和Youtude上的观看人数,都和股价密切相关。品牌的受欢迎程度,还能预测股价在10天、30天之后的上涨情况。

  这些研究虽然激动人心,但是也招来了众多反对。特许财务分析师协会创新与新兴媒体主管莱恩. 科斯塔(Len Costa)就不赞成Twitter情绪指数的滥用:“对于严肃的专业投资者来说,在作出投资决定时,没有什么可以替代合理的、审慎独立的专业判断和由适当的研究与调查支持的基础。”美国圣母大学的研究者则对情绪分析的基础提出质疑。他们发现,在语义分析中广泛使用的哈佛心理社会学词典中,近3/4 被归为“负面”的词汇,在金融领域中并无情感判断。事实上,用Twitter 来量化人类的感情并非是无根之源,以Twitter 为代表的众多现代通信工具其实与人类的众多感官神经有着难以分割的关系。华盛顿州立大学的神经科学家Jaak Panksepp 花了很多年来研究大脑中的情绪系统,他相信这是哺乳动物所共有的。“它是激发哺乳动物每天醒来离开床或洞穴探索这个世界的动力引擎。”正如动物学家Temple Grandin 在Animals Make Us Human中写的,它解释了为什么关在笼中的动物更倾向于寻找自己的食物而不是投喂给它们的食物。

  对人类来说,寻找的欲望不仅仅是为了满足身体需求。Panksepp说,人类会因抽象的奖励而感到兴奋,就像获得有形的物质奖励一样。在Panksepp看来,“当我们搜索出什么的时候,那感觉非常好,我们会让这个系统保持运转——就像可卡因、安非他命这些毒品带来的刺激一样”。

  正是基于这种刺激,让人类对Twitter这样的即时通信工具产生了难以摆脱的依赖效果。因此,人类在使用这些工具时也往往会透露出自己内心的一些真实情感,这也最终影响到了人们的行事过程。然而,正像一只猫会疯狂地抓取一个乱晃的光点一样,过分地去追逐一些散漫的信息碎片,反而会造成情感系统的泛滥和失控。毕竟在大部分时间里,人们还是需要冷静下来,运用理性进行思考的。
……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: