互联网金融“技术控”

来源:IT经理世界
关键字:互联网金融
发布时间:2015-07-24 13:15

　　网贷平台除了风控透明之外，如何甄别非正常交易也是门技术活，爱钱进自建IT架构打好反欺诈之战。

　　如果说互联网时代可以追踪一个人当下的信息，那么大数据时代，可以通过技术“预知”一个人未来的行为方式。具体到P2P网贷平台，则可以通过对数据的抓取和挖掘分析，根据借款人以往的各种商业信息作参考，判断他们的风险系数，欺诈和预期的可能性。

　　传统P2P贷款审批业务主要基于审贷人员的主观判断，初步的定性分析以及政策制度来实现。由于目前征信及监管环境的限制，P2P平台很难获得充裕的数据、信用记录用于信贷管理环节，一定程度上推高了行业的信贷风险。如今，风险控制能力和作业效率将成为未来的核心竞争力。

　　然而，对于P2P平台来讲，数据量化风控体系不是简单的数据堆积，而是一种发现有效数据、数据间的相互关系以及挖掘数据背后隐藏的信息的能力，从而更好地对个人信用风险进行评估。

　　从创立初期，互联网金融平台爱钱进希望，能在贷款审批阶段引入申请评分和决策引擎工具对信用风险进行科学的量化和控制，并基于量化的风险模型设计审批准入策略。爱钱进的创始团队认为，P2P中间的“2”指代的是技术，技术背后的服务连接人的两端。只有在开始就下本钱建立数据挖掘和建模分析团队，同时通过线下开发自己的债权资产并掌握与之相关的第一手信息，才能做好这些数据积累和筛选的基础工作。在此基础上建立的以数据为驱动的量化风控体系，也将会成为应对市场竞争的杀手锏。

　　爱钱进2014年5月上线，累计注册投资人数近60万，累计撮合交易金额超10亿元。其母公司普惠金融2013年7月成立，并于2014年12月获得高榕资本5000万美元的A轮融资。最近，“技术控”爱钱进推出国内P2P网贷行业首个动态反欺诈模型体系，据其创始合伙人张辉预测，这将减少约30%欺诈的可能性。

　　大数据模型发现“好人”

　　现在，低廉的线上造假成本和层出不穷的信用诈骗手段，大大降低了网贷申请过程中诈骗难度，给P2P平台风险识别带来了很大的挑战。

　　据爱钱进的信审数据统计，每100个拒贷案件中大约有16起涉及不同程度的蓄意造假或欺骗。网贷行业存在严重造假行为的原因包括：线上造假成本低廉、诈骗技术不断更新，包装代办公司迅速崛起，社会个人征信体系不完善，大量平台对风控的重视程度低等。

　　近来，许多P2P平台纷纷开设线下门店，开发线下借款需求和为网站导流。爱钱进认为，P2P平台主动开发线下借款需求会间接导致造假和欺诈的发生，因为线下门店职员在背负资产开发任务时，有可能帮助贷款人进行信息包装，从而完成自身业绩指标。一些熟悉P2P审核流程的人或公司专门帮助蓄意骗贷者进行信息包装，比如，了解哪家平台风控能力薄弱，伪装成申请人的亲人、单位同事、资产证明人配合证明假资料，伪造审核所需的各种盖章证明、资产流水、征信报告等。

　　另外，爱钱进创始合伙人张辉认为，在中国，信用借款坏账大致分为两类：一类是借款人在借款时主观上就不想还款，这被称之为欺诈；另一类是借款后，还款能力出现了问题而还不起款。由于国内个人征信体系尚不完善，中国欺诈违约比例明显高于国外。

　　为了有效保护投资者的资金安全，爱钱进自主研发了动态反欺诈模型体系。该模型体系可以根据信审过程中每个环节的独特性和前一阶段的审核结果，进行自我实时调整，从而实现对各类虚假信息和诈骗行为进行甄别。

　　张辉说，爱钱进一直把自己当作一家技术公司，通过技术驱动业务的创新和发展。全新的反欺诈模型理论上的准备工作从去年10月开始，研发团队广泛关注金融和互联网行业主流的挖掘方法，比如常用的随机森林、支持向量机等。该模型从年初开始测试，年后正式上线。

　　为了分析、清洗建立反欺诈模型所需的数据，爱钱进建立了自己的数据库。反欺诈模型的数据基础主要来自于：母公司普惠金融几年来积累的较高质量的自有客户借贷数据；芝麻信用、上海资信等第三方的征信机构提供的个人征信数据；网贷行业共享征信数据；以及互联网平台上的开源数据，比如微博，微信等社交类信息，百度，360，58同城等搜索引擎垂直抓取的数据。

　　这些数据包括借贷人群的自然属性、家庭信息、房产、工资、银行信息、网上交易信息、手机通话记录、网上行为数据等多维度多层次数据类型。对搜集到信息，技术团队会做初步分析，例如识别哪些变量有缺失、哪些数据在不正常范围，并根据统计规则对这些数据进行精细筛选、审核、填补，通过系统化的科学手段提高数据质量。

　　在高质量数据的基础上，运用关联、分类、聚类、异常挖掘等方法构建了多层、多维、多结构反欺诈和量化风控模型，将传统银行信贷中的欺诈规则融入到数学模型体系中，并对模型进行集成，通过数以百计的人群行为变量重现借款人的社会特征，实现对欺诈行为更为准确地识别。

　　爱钱进会根据历史数据，分析“坏人”（逾期借款人）有哪些共同特征，“好人”（优质借款人）又有哪些共同特征，将这些数据做成评分卡，用统计学建立模型，预测一个借款人未来可能做出的行为，把这个模型套用到新进来的客户上，“好人”甚至可以当天获批贷款，而“坏人”会被标黑，有些数据存疑的借款人会被标灰，留待再进行人工审核。

　　“跟踪”专业人才

　　提到建立这套反欺诈模型的初衷，张辉表示，由于P2P目标人群属于社会信用领域的次级人群，具有信用行为的特殊性和复杂性，无法参考传统银行的基于抵押为核心的贷款模式，在进行反欺诈甄别过程中，需要考虑的变量数量更多，各变量之间的关联性更为复杂。“在我们的模型中，每个客户至少有300多个变量。未来还会增加更多的变量，以便更立体、细致地还原出贷款人的信用‘画像’。”张辉说，用户如果向爱钱进授权自己的数个网络行为数据，爱钱进可以做到数秒内判断是否可以借款，以及借款金额、利息和还款期限。

　　反欺诈模型贯穿贷前、贷中及贷后整个业务流程。在测试程中，爱钱进也逐渐挖掘出一些更有趣的数据点，例如月收入1万元的客户，可能比月收入3000元~4000元的客户具有更高信贷风险等。

　　除了上千万元的资金投入，复杂先进的数据模型同时也对人才提出了一定的要求，需要精通统计学、数学建模等相关专业的人才。

　　自成立之日起，爱钱进组建了在人工智能、模式识别、数据挖掘领域具有丰富理论与实践经验的国内外专家团队，并与普林斯顿大学的专家学者开展联合研究，发展适合中国P2P目标借贷人群的反欺诈模型。

　　张辉透露，爱钱进IT团队目前约200人，还拥有很多数据挖掘方面的专家，一些甚至是要“跟踪”半年才挖来的专业人士。风控人员中约100人负责信审中核对信息等；另一部分是30多人的政策制定部门，负责模型优化、政策设计、决策引擎等。

　　张辉本人曾先后就职于普华永道、德勤，之后加入中信证券投行企业并购部任高级副总裁， 2009年加入中信产业投资基金担任副总裁，任职期间投资过包括银行、小贷公司、担保公司在内的很多传统金融机构。

　　在私募股权投资行业从业多年，他发现国内的金融市场，特别是传统的金融机构很少有覆盖到个人层面的金融服务，尤其是个人的小额信用贷款领域更是市场需求巨大。

　　“在中国，很多金融机构只愿意做大企业、高端的金融服务，个人如果没有汽车、房产的话很难在银行拿到贷款。爱钱进就是要提供门槛更低的贷款和理财服务，并让这些服务更加方便、快捷地被获得。”张辉说。

　　在爱钱进的平台上有“零钱通”和“整存宝”两个产品。“零钱通”对接的是一个个具体的借款标的，而“整存宝”则是通过自动投标工具分散投资到多个项目。下一步，这些产品将根据市场需求和爱钱进对品牌的远景规划进行进一步创新整合。

　　而在借款端除了现有的贷款业务，爱钱进也会尝试将个人信用贷款的应用场景进一步拓宽。意图打造一个纯线上的金融流动闭环。“目前国内整个信用卡市场用户为1亿人，仍存在超过10亿的市场需求。”张辉说，“我们的愿景是能成为中国的虚拟信用卡。”

　　2015年第一季度，爱钱进撮合交易复合增长率124.81%。未来，爱钱进希望能在数据源以及数据质量上进一步拓展，同时将非结构化数据也集成到反欺诈模型中，以进一步提升对欺诈行为的识别能力。

　　文/董莉

……

关注读览天下微信， 100万篇深度好文，等你来看……

立即购买本期杂志

查看本期更多内容