金融业大数据应用(上)

  互联网金融的快速崛起,在给传统金融业带来挑战的同时,也带来了新的契机。尤其是大数据的出现,使得传统金融业在对客户行为分析、差异化营销、差别定价,以及产品设计、风险实时监测和预警等各领域的能力都可以产生飞跃,毫不夸张地说,大数据重塑金融业在不远的将来也许会变成现实。

  让我们看一个例子。网友“詹姆斯”来到了银行营业厅,他刚进入大门,就收到了短信推荐,正好是他最近“心仪“了很久的一款商品,银行可以提供了零手续费的分期信用卡服务。网点的客户经理也及时迎上来,在他等待办理业务的时候,拿着iPad推荐另一款流动性很强的理财产品,正好符合“詹姆斯”的理财需求。借助大数据,银行是如何深入了解“詹姆斯”的,又是如何第一时间就识别了他,并且精准地推荐了他想要的产品呢?

  技术上依托的是在银行数据中心部署的大数据平台。这个平台首先要有一个很强大的数据集成层,能从各个渠道和数据源,运用多种方式获取数据,并对数据进行分析清理,抽取有效信息并进行部分整合处理,最终归档为有效信息供后续分析处理。

  换句话说,只要你在物理世界或数字世界留下触点,这个数据集成层都有可能获取到,无论是结构化的数据,还是非结构化的数据。

  依托数据集成层,大数据的数据量和数据类型多样性决定了保存这些数据需要不同于原有体系架构,需要采用多种组织方式的、支持多种类型、多种存储方式的系统结构,例如图片、音频、视频、文本、网页、社交媒体信息、日志记录、传统的交易记录等,这就需要数据存储层。

  由于数据量的增大,单纯的集中式存储不能满足容量和扩充的需求,需要采用分布式存储结构,利用集群保证数据完整性、可靠性的同时,利用集群节点的扩充实现存储容量的线性扩充,以相对低廉的成本,存储海量的数据。

  再往上是数据计算层,基于存储层的支持,实现更快的、吞吐量更大、可线性扩展的计算能力。基于数据的分布式存储可将计算任务分布到不同的计算单元进行运算,再将计算结果聚合成最终结果。与此同时部分场景下数据会源源不断的产生,数据的价值仅在很短的时间内有效,大数据体系需要流式计算功能发现和利用这些数据的价值。

  依靠数据集成层、存储层和计算层,按照数据的类型、用途和时效性,银行就有机会勾勒“詹姆斯”的全貌了,术语叫做客户360视图。这里一部分是“詹姆斯”的金融信息,即姓名、地址、财务状况、风险分类等,这些在前大数据时代银行也有,但是来源很单一。

  另一部分是非金融信息,包括兴趣爱好、发表评论、地理位置、浏览行为、购买行为等,这在前大数据时代基本上很难获得。但通过大数据平台,银行有机会整合社交媒体、支付记录、呼叫中心记录等线上信息,人行支付、现金管理、刷卡记录等线下信息,医疗机构、电商等第三方机构信息,甚至是征信报告、工商记录等政府公共信息;描绘出“詹姆斯”各种维度的画像,比如资产负债画像、现金流画像、情感情绪画像、投资画像、客户偏好画像等,形成所谓的客户洞察,甚至会出现“比你更懂你”的情况。

  基于客户360视图,大数据平台之上的智慧层就可发挥作用。利用人工智能和数据挖掘技术,实现信息的分解和提炼,找出对客户、对产品、对业务流程等一系列目标对象有价值的信息点,用于支持后续的营销、管理、优化等场景,主要包括实时决策、机器学习、数据沙箱等。这样“詹姆斯”最近想要买什么,理财偏好是什么就都被分析出来了。

  最后出场的是大数据平台的信息消费层。在保证数据安全的情况下,将这些信息通过各种渠道,比如手机、客户经理的iPad,包括实时非实时的、单条的记录或者是批量处理等方式提供给行内、行外的各个需要使用该信息的各种业务环节。这样,“詹姆斯”在迈入银行营业厅,被自动人脸识别出来后,后面的一切就变得顺理成章了。

  芮祥麟

  大数据分析和工业互联网专家

  精研数据科学和大数据发展,以价值为导向开拓大数据行业应用。曾就职于Pactera和SAP20余年,拥有杰出的执行力和丰富的行业经验。

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: