随着数据时代的来临,社交平台的用户产生的最大价值在于其行为所反映的个性特征,这为企业进行用户行为、心理、类别等方面的分析提供了相当关键的可参考依据。于是,以分析社交用户信息的大数据应用应运而生。
无论是互联网巨头或是初创公司,无论团队规模是大是小,都视社交大数据为宝藏。同时,这股热潮也受到VC资本的追捧。随着大数据技术的爆发,社交领域也展现出未来有无限可能。接下来,就要看社交平台及其他数据公司如何做了。
近日,记者采访了一家专注于社交媒体大数据的初创公司——成都睿码科技有限责任公司(以下简称“睿码科技”),该公司针对微博、Instagram、Facebook、Twitter、大众点评、QQ空间等社交平台进行大数据采集、分析,为客户提供解决方案。
目标,挖掘社交大数据
据了解,睿码科技是全球化的数字媒体Remark Media公司在国内的独资子公司,总部位于美国拉斯维加斯。睿码科技通过Remark Media的全球化社交媒体资源,汇集了全球最广最全的社交媒体数据内容,包括微博、Instagram、Facebook、Twitter、大众点评、Yelp、QQ空间等社交数据和用户信息。
RemarkMedia中国区执行董事王海婷表示:“睿码科技的目标就是构建全球社交媒体数据的采集、存储、分析和应用于一体的大数据综合服务平台,打造基于社交大数据的基础服务和应用生态圈,为各类客户提供社交数据领域咨询服务、软件产品和行业解决方案。”
王海婷介绍,睿码科技已经通过签约获取了包括QQ空间(2亿用户)、微博(3亿用户)、Instagram(3亿用户)、Facebook(22亿用户)、Twitter(5亿用户)在内的所有社交数据,现有数据存储量已经超过100TB,每天还在随时更新数据。
社交数据产自于用户,那么对用户隐私的触及便不可避免,这也是从事用户数据挖掘不可规避的风险。睿码科技运营总监曾敏表示,睿码科技展示给大家的数据都是积极美好、健康向上的优质内容,比如旅游、人文、美食等数据。
核心,通用图像识别平台
大数据公司的核心竞争力首先体现在处理大数据的能力。曾敏表示:“目前,睿码科技拥有一支30人的核心研发团队,具备大数据挖掘和分析能力,通过睿码科技社交大数据系统后台不断地优化与调整,已经可以实现承载海量的数据存储与分析,方便地进行数据中心扩展,实现在全球进行布点与数据快速交换,目前集群由500多台服务器组成,预计达到设计目标时需要上千台服务器提供支持。”
曾敏认为,睿码科技的优势在于:一方面,打造通用图像识别平台,包括人脸识别、身份证识别、驾照识别、图片分类、VR增强现实应用等,识别率在项目范围内(需要识别的人)已经非常准确,满足项目需求,但要精确识别项目外的人,在人脸的数据量和特征值优化上还需要时间积累,通过优化系统和算法才能不断纠错,提高识别度;另一方面,在模式上也有自己的独特特点,把训练结果作为离线模式调用,方便第三方使用和封装。
产品,探趣App
睿码科技通过图像识别平台也行成了自己的产品——探趣App。近日,睿码科技旗下产品探趣2.0已经在App Store上架公测,这是一款集结全球图片的生活社交类应用,专注于为快节奏人群打造全新的生活方式,涵盖热点、美食、旅行、运动、家居、时尚……在这里,可搜罗最实时的热点,发现最精致的美食,加入最有范儿的组织,结交最有趣的伙伴。目前,探趣App的模块包括:热图、发现、地图、圈子、我。
曾敏表示:“利用大数据算法针对探趣App加大分类力度,在下一次探趣大版本升级后,地图上的图片可以进行分类查看。探趣App可以作为展示后台能力的窗口,想看美食就全是美食,想看明星就全是明星。”
关键,业务上下功夫
初创公司除了具备核心的技术能力,在业务上下功夫,依据核心的业务形态,深入挖掘自身数据也是关键。
大数据公司的价值,关键在于预测能力。睿码科技在社交数据的研究上,预测能力有多强呢?
王海婷介绍,目前针对热门旅游城市进行预测,比如与四川旅游局进行旅游合作;能够对评级进行语义识别,对社交内容进行聚合与分类;目前能够得到比较大的兴趣标签,还在进一步的细化过程中。相信假以时间和优化算法,可能做到更精确的人物画像与预测分析。
王海婷认为,大数据公司在资本市场目前还是很热的,大家都在多方面考察和评审,同时国家也在开发各个职能部门的数据,社交数据可以和政府的数据结合产生更大的价值,睿码科技也会把握住机遇,努力前行。
■本报记者 邓晓蕾
……
关注读览天下微信,
100万篇深度好文,
等你来看……