与Kaggle彻底划清界限 DF要做自己想做的事
- 来源:中国计算机报 smarty:if $article.tag?>
- 关键字: smarty:/if?>
- 发布时间:2018-02-28 15:30
CCF第五届“大数据与计算智能大赛”(Big Data & Computing Intelligence Contest,BDCI)于2017年12月底在江苏常熟落下帷幕,来自6675支队伍的近15000人参加了本届大赛,获奖团队分享了超过100万元的奖金,从参赛规模、比赛质量、品牌影响力等各方面衡量,CCF BDCI堪称国内大数据赛事第一品牌。DF数据竞赛平台(DataFountain)作为BDCI的承办单位及赛事平台,提供了全方位的策划运营和支撑运维,它也是国内最具规模和影响力的大数据和人工智能竞赛平台。
随着大数据、人工智能等新技术在全球范围内的快速崛起,数据竞赛平台也跃入了人们的眼帘。记者注意到DF数据竞赛平台,是因为2017年10月数联众创进行过一次高薪招聘。为大数据和人工智能产业发展做嫁衣,为大数据和人工智能领域的专业人才提供服务的数联众创及其DF数据竞赛平台究竟有何与众不同之处?
就像很多人第一次接触数据竞赛平台一样,记者也是满怀好奇与期待,与北京数联众创科技有限公司联合创始人陈娟进行了一次长谈。
头三年挺过来了
通常来说,一家创业公司成立的头三年可以说是一道“生死关”,三年中很可能因为市场、战略决策、团队、资金等方面情况的变化,而导致公司从市场上黯然消失。2015年6月成立的数联众创正处在这样一个关键的发展阶段。但是从与陈娟的对话中,记者感到的是沉稳、冷静和坚定的信心,看不到一丝浮躁或焦虑。
陈娟是那种典型的学者型创业者,基于对大数据、人工智能行业的深刻洞察和未来发展方向的把握,以及对技术本身的信赖,她对公司的发展,以及DF数据竞赛平台的前景充满信心。
从最早在中科院计算所从事教育和研究工作,到带领几名研究生和博士生封闭开发DF数据竞赛平台,再到创办公司,陈娟的创业起步总体来说比较顺利。从2个人到4个人再到现在的16个人,公司规模虽然不大,但是在数据竞赛平台这一领域却声誉鹊起。很难相信,公司成立近三年,一直没有考虑过融资,全凭以DF数据竞赛平台为依托的大大小小的竞赛项目推动公司的发展。
在两年多的时间里,数联众创已经举办了近70场竞赛,是同行中举办竞赛次数最多的。比如,连续3年为百度、腾讯、京东、国家电网等近70余家国内知名企业集团提供定制化竞赛服务和人才培养计划,同时联合政府、产业、学术界在大数据领域创建了一种全新的三方融合、协作的赛事生态模式,间接连接和影响着数万名数据工作爱好者。“我们与平安科技和蚂蚁金服合作的最新一届大赛马上将启动。”陈娟兴致勃勃地介绍,“京东、蚂蚁金服、国双科技、AdMaster、明略数据等都是我们亲密的合作伙伴。大家非常相信我们举办竞赛的能力。公司目前运作的项目很多,举办的竞赛质量高,参赛选手众多,客户稳定。”
数联众创所做的更多工作其实也是在赛后。比如,向企业推荐优秀的大数据人才,以及为企业提供定制化的赛事服务。这是数联众创在为未来的业务模式创新“试水”。目前已经可以看出一些好的苗头,数联众创为IBM、平安科技等大型企业客户提供定制的竞赛服务,根据这些客户的特点和独特的需求,比如针对精算师这一特定人群或针对金融风控这样的特殊应用,提供创新的竞赛模式,帮助企业找到对口的人才,同时也为企业的业务创新提供支持和帮助。
陈娟补充介绍说:“京东和我们合作时已经十分明确地提出,未来20年京东的战略方向当属人工智能。所以,他们对人工智能领域的人才储备进行了大量投入,在举办数据竞赛的同时也做了很多品牌宣传和推广工作,我们也参与其中。另外,像蚂蚁金服、平安银行这些对数据敏感度高的企业客户,他们一方面对数据的安全和隐私高度重视,另一方面希望吸引更多优质、高端的人才参赛。为他们提供定制化的服务也是我们的一项主要业务。”
商业模式不再是困扰
21世纪最重要的是什么?人才!这句话现在说起来似乎有点老套,却是不争的事实。在大数据和人工智能领域,人才短缺的情况十分明显。
“据我们粗略估算,中国目前的大数据和人工智能专业人才总共不超过15万人。综合各大招聘网站的信息,目前国际市场大数据和人工智能从业者的需求量在3000多万,国内市场也在百万级,缺口非常大,尤其是高端人才。”虽然在说话时陈娟的语气很平和,但也听得出她的一些忧虑,“从数量上看,目前中国的IT从业者中,大数据和人工智能从业者所占的比例是很低的。从质量上看,现有的从业者大多是从数据库、高性能计算等领域转过来的,算法功底比较薄弱,中高端人才稀少。”
她接着补充说:“数据科学家的知识结构非常复杂,需要具备多种能力,培养起来比较困难。一名出色的数据科学家至少要有10年专业工作的背景。”
从2012年开始,国内关于大数据的实践已经开始起步,但是直到现在,很多企业和组织并没有积累下来有效的大数据。曾经有一些客户主动找上门来要与数联众创合作,但是经陈娟她们仔细了解,这些客户根本没有数据可用。这种情况在某些传统行业中还比较普遍。
“通过竞赛和相关的线上线下活动,我们可以了解参赛者的工作、学习状况和水平,以及在圈子里的影响力和口碑。这样可以为接下来的人才招聘和培养做好准备。”陈娟表示。
现在正是大数据、人工智能的高潮,政府、企业对相关的数据竞赛的热情颇高,也舍得投入,这是DF数据竞赛平台能够在短短两三年时间内便迅速崛起的原因。对此,陈娟有冷静的判断:“一项新技术从兴起到落地,再到普及推广,中间会经历波峰波谷。大数据、人工智能的热潮再过几年也许会退去,那时人们对数据竞赛平台的关注度可能会降低。从目前情况看,数据竞赛是一种培养和锻炼大数据专业人才的有效方式和试金石,可以验证参赛者过去所学,推动他们在大数据领域继续深入钻研,同时也有助于促进就业。人才招聘和培养是刚需,是大有可为的新商业模式。”
在人才招聘方面,数联众创早就开始了酝酿和布局,并持续推进。截至目前,数联众创已经完成了对相关企业的回访,并得到了积极的反馈,人才招聘业务近期即将启动。陈娟向记者表示:“一开始,我们不会将战线拉得太长,会先为少数几家有迫切需求的企业提供猎头服务,在运行几个月后,视业务进展情况,再将服务放到线上平台上。我们要为企业提供更精准、快速的人才招聘服务。”
谈到人才培养,陈娟出言谨慎,因为前期投入巨大,需要做更多准备。据她介绍,CCF大数据专家委员会正在制作12本大数据的专业教材,目的是培养更多优秀的大数据教育工作者,这是人才培养的第一步。
另外,发展基于大数据项目的众包平台也是一个可能的选项。不过,陈娟表示,当前产业和行业的发展还没有达到所需的高度,人才、项目也不成熟,还不具备提供众包服务的条件。未来,当大数据和人工智能产业真正成熟,各方面的人才都具备了,很多新型业务也就自然而然产生了。
数联众创要跑起来
全球最知名的数据竞赛平台非Kaggle莫属,国内的一些数据竞赛平台就是从模仿Kaggle起家的。陈娟回忆说,数联众创刚成立时,为了让客户和合作伙伴能够快速了解公司的业务,也曾经提出过“中国版的Kaggle”、“数据科学届的‘猪八戒’”等口号。通过这些形象的比喻,能够让人快速记住数联众创及其DF数据竞赛平台。但是现在,前期的市场教育工作已经基本完成,公司定位和商业模式逐渐清晰,数联众创现在有必要与Kaggle划清界限,做自己真正想做的事。
数联众创正处于快速发展阶段,在扩张业务的同时也在探索新的商业模式,比如做人才招聘。因此,数联众创的定位也处于动态发展之中。陈娟这样概括数联众创当前的定位:一个开放的数据平台、一个孕育和挖掘数据科学家的平台,采用竞赛这种新兴的形态帮助企业解决业务问题。
在头三年的生死存亡期过后,陈娟考虑的重点是如何让公司的发展提速,从蹒跚学步到走得稳健,再到奔跑起来。陈娟向记者透露,公司已经建立了合伙人制度,第一轮融资也在顺利运作当中。
从一名学者到企业家,陈娟感觉这三年学到了很多东西,公司就像她成长的一面镜子。她现在的状态是“痛并快乐着”,虽然每天都要解决棘手的问题,但是公司的发展、团队的成长让她很有成就感。
郭涛