数据挖掘技术在识别可疑金融交易中的应用

  • 来源:中文信息
  • 关键字:数据挖掘技术,金融交易
  • 发布时间:2015-01-06 15:35

  摘 要: 随着企业数量不断增多,经济水平日益提高,各种金融交易活动也日渐频繁。在一系列金融交易活动中,最容易出现的一种犯罪就是洗钱。本文主要介绍了数据挖掘技术及其算法,以及如何利用数据挖掘技术识别可疑的金融交易。

  关键词:数据挖掘 可疑交易 反洗钱

  中图分类号:F832 文献标识码:A 文章编号:1003-9082(2015)01-0073-01

  一、前言

  随着我国经济的发展,各种金融交易活动也逐渐增多,与之伴随的就是洗钱活动的频繁发生,我国的反洗钱工作正在不断地深入开展。依靠传统的手工处理或简单数据库处理系统来识别金融交易当中的犯罪已变得无法胜任,充分利用数据挖掘技术来识别可疑交易在全球迅速推广应用。由于我国的国情以及技术水平,该项技术的应用和普及情况仍不尽人意。如何从海量的混合类型的金融数据中挖掘出与洗钱活动相关的交易数据,为发现可疑交易提供数据支持,需要我们在方法上进行探索,在应用上进行实践。

  二、数据挖掘技术概述

  从广义的角度来说,数据挖掘就是从存放于数据库、数据仓库或其信息库中的大量数据“挖掘”出有趣知识程的过程。数据挖掘所研究的领域很广,涉及到识别模式、数据库、机器学习、人工智能还有分布式计算、可视化技术等等,是不同学科结合的产物,这是一个新兴的技术,但是其又有很大的发展空间。数据挖掘技术根据其主要任务的不同,可以划分成为如下几类。第一、关联规则挖掘,它是从大量数据中发现项集之间关联或相关联系,可用于商业决策制定上;第二、分类以及预测,分类是通过分类函数将数据集当中的某个样本映射到某一个已知分类上面。分类方法主要包括决策树、贝叶斯、人工神经网络等等,可用于部分监测模型建立;第三,聚类分析,与分类的不同之处在于它所划分的簇是未知的,按照的规则是“物以类聚”,将条件相似的对象划分在一个簇里面,通过聚类分析将相似行为的客户划分到同类组中,可以用来监测可疑行为。第四、孤立点分析,即数据集中可能包含的与其它数据的一般行为或特征不一致的数据对象,用孤立点技术可以识别出极个别偏离正常业务的行为;第五、时序分析,数据演变分析描述行为随时间而变化的对象的发展规律或趋势,并对其建模,可以用于预测股票走向。

  三、可疑金融交易的特征分析

  可疑金融交易是指金融交易当中的频率、流向、来源以及金钱的用途出现了异常的行为。从反洗钱的监督实践来看,可疑的金融交易通常有如下的几个特征。

  1.交易的频率以及交易金额异常

  通常来说,有着真实背景的企业其日常的金融交易是具有一定规律性的。洗钱交易与之相比较,因为真实交易背景的缺乏,其交易的频率往往没有周期性且交易的方式也没有固定性。在洗钱犯罪当中,洗钱者所面临的最大问题就是如何将非法所得的大量现金变成可以携带或者隐藏的形式,洗钱者为了避免被发现,经常采取快进快出的方法,导致其交易的频率以及交易金额都会与正常的交易不一样,具体表现为和背景资料不一致的大量现金的频繁交易。在洗钱交易的初期,其最大的特征就是入账的金额是巨大的,流动的次数是频繁的。

  2.交易的流向或者来源异常

  洗钱交易和正常金融交易的目的是不一样的,所以其交易的地点和洗钱的热点地区都会有很密切的联系。

  3.交易的用途或交易性质异常

  该项特征是指在交易过程中,交易者的交易用途与所申报的背景资料不相匹配,违背了实际经营情况。

  四、数据挖掘技术在识别可疑金融交易当中的研究

  数据挖掘算法的适应性直接影响所发现知识的价值。在反洗钱领域中,回归分析、分类分析和聚类分析、决策树算法、神经元网络、遗传算法等都具有较强的适应性,具有广阔的应用前景。目前应用在可疑金融交易识别中的数据挖掘过程主要包括:数据采集、数据预处理、属性过滤、数据清理、数据特征化、数据分析等。

  以聚类分析来说,为了达到期望的聚类的结果,属性选择是很重要的,错误的选择可能导致聚类结果是无效的。举个例子:我们知道账户中交易是有“借”和“贷”两个方向的,可以统计出一个账号在当日前有限日内的贷记交易次数与借记交易次数,计算两者的比值,然后将此比值的聚类结果与阈值进行比较,区分是否为分散转入集中转出还是集中转入分散转出或是正常资金周转。这里的借贷交易次数比值就是能够参与分析的有效属性。而像客户名称、客户地址等之类的信息在聚类过程中就属于可剔除的属性。

  另外,在进行数据分析时选取的算法也很关键,并不是说使用某一种算法就可以识别出来大部分类型的可疑交易。不同的算法是具有针对性的。以聚类分析为例来说明:由于洗钱行为在整个金融活动中只占极少部份,而且洗钱的模式也多种多样。可疑账户不可能聚集在一起成为一个聚类中心,只有大部份正常经营的企业账户或是按正常模式存取的私人账户是占了大多数。这些账户经过预处理之后的各种交易特点是比较接近的。因此,可疑账户是比较离散的分布在属性空间中,正常账户是聚集在空间的某个区域。因此我们可以通过采用不同的聚类方法,并根据期望结果选择不同的聚类属性,将交易行为相似的归纳为一类。在聚类的结果之上,选择包含对象数量少的簇再进行孤立点分析,进而识别那些极少数异常的、偏离正常业务的行为。但是聚类分析也有局限性,它在判断大额交易、集中转入分散转出、分散转入集中转出方面比较有优势。但当数据量大,需要分析的特征变量过多时识别有一定的难度。

  五、数据挖掘技术在反洗钱工作中的应用现状

  1.国外的应用情况

  发达国家对数据挖掘技术的应用程度很高,不仅建立了专门分析和收集情报的金融情报中心(FIU),而且建立了功能强大的反洗钱系统:美国金融犯罪执法网络的FAIS系统综合使用了人工智能技术和基于案例的推理、黑板等分析技术,将数据分析视角从交易导向转为对象(如人或者组织)导向,对每一笔交易、对象、账户都用336条规则逐一进行测试,相应每条规则给出是否为合法或非法的判定结果,再用贝叶思推理对每个项目的可疑性进行评定;澳大利亚交易分析和报告中心所开发的Screen IT系统使用数据挖掘技术实现了对可疑交易报告的自动筛选。

  2.中国的应用情况

  数据挖掘技术在我国应用的范围还不是很广,正处于起步阶段,信息技术水平也相对比较低。但是,数据挖掘技术的应用和研究已经逐渐引起监管部门及理论界的重视,技术水平和理论知识明显提高。不过应用手法上主要停留在对各种不同分析技术的简单应用,缺乏综合系统性地应用。

  六、结束语

  无论是从经济发展角度考虑还是从社会稳定角度考虑,反洗钱已成为国家重点关注的课题,也是维护国家经济安全、打击犯罪、遏制腐败的重要手段。数据挖掘技术对多数据类型、关系复杂、动态性、海量数据等信息的分析具有很好的适用性,并且其高度程序化的特征决定数据分析具有客观性、可以排除人为干扰因素,使数据挖掘技术能在反洗钱工作中迅速推广应用。

  参考文献

  [1]苏辉贵.基于数据挖掘的反洗钱系统应用研究[J].华南金融电脑,2009,(3).

  [2]张成虎,赵小虎.基于贝叶斯分类的可疑金融交易识别研究[J].财经研究,2009,(10).

  [3]杨胜刚.中国反洗钱数据挖掘系统设计.中国科技论文在线(www.paper.edu.cn).2005。

  [4]陈敏.数据挖掘技术在商业银行中的应用.中国管理信息化,2011,(5).

  [5]高增安.基于交易的可疑洗钱行为模式与反洗钱对策研究.博士论文

  文/张璐

……
关注读览天下微信, 100万篇深度好文, 等你来看……
阅读完整内容请先登录:
帐户:
密码: