会员登录关闭
用户名:
密 码:

微信公众号
行业研究

大数据驱动下的互联网金融

发布时间:2017-03-06

协会会刊《中国支付清算》2016年第4期

\ 唐彬 易宝支付CEO

 

麦肯锡全球研究院在其发布的《大数据: 创新、竞争和生产力的下一个新领域》报告中(Big Data: The next frontier for innovation, competition, and productivity)指出,大数据之“大”,通常是指数据量大到超过传统数据处理工具的处理能力,是相对和动态的概念。此外,大数据又被引申为解决问题的方法,即通过收集、分析海量数据获得有价值信息,进而通过实验、算法和模型,从而发现规律、收集有价值的见解和帮助形成新的商业模式。

金融是资金的融通,其本质是价值的跨时空流转。互联网金融虽然并没有改变金融的本质,但依托互联网技术,从参与人群、流转方式、速度、时间和空间几个维度深刻改变了价值的流转,创造了新的商业模式,催生了新的产品、服务和功能,金融体系也因此发生了巨大的变革。互联网金融,尤其是第三方支付,是大数据的重要产生者,反过来,大数据技术又利用这些海量数据,通过客观的分析,发现数据之间的内在规律,推动互联网金融的进一步发展。

无论是B2CC2CB2B,还是近几年开始火热但2016年以来遽然转冷的P2P,任何形式的交易都会产生大量的用户行为数据、订单数据、商品数据、支付数据和物流数据。这些数据在交易后沉淀在电商、支付和物流平台上。这些平台收集各种数据,并利用大数据技术对数据进行清洗、过滤、分类、人工智能分析和可视化数据表达,从而实现精准营销、客户服务、风险防控、产品优化,甚至产生信用报告,为客户提供更具个性化和智能化的服务(见图1)。

 

1.大数据驱动下的交易服务平台

美国作为互联网的发源地,其互联网的基础技术、应用技术和创新能力代表着世界的最高水平。美国发达的金融服务几乎满足了所有美国人的金融需要,所以在美国,人们对互联网金融发展的热情与拥抱程度远赶不上中国。尽管如此,还是能够看到作为互联网核心技术的大数据对美国互联网金融的驱动案例,这些案例都遵循着类似的逻辑:基于海量的数据,寻找不同数据元素的关联性,让历史告诉未来。

通常认为,新的相关信息的出现是股票价格变动的原因,而不是依据过去的股价趋势通过外推可以预测的。但股票市场上新信息的出现又是不可预测的,由此可以得出结论:股票价格是不可以预测的。然而,近年来,有许多的研究都表明,股票市场可能并不完全随机,也许存在着一定的可预测性。例如,虽然无法准确地预料股票市场中新的信息何时出现,但是我们却可以从类似TwitterFacebook这样的社交媒体上捕捉到一些征兆,利用这些征兆就可以在一定程度上预测在经济与社会中未来公众的情绪和信息的变化。尽管我们知道新信息对股票价格变化有着很大的影响,但实际上公众情绪可能在股票价格的变动中扮演更为重要的角色。印第安纳州立大学和曼切斯特大学的研究人员利用用户在Twitter上发表的推文内容,通过两种情绪分析模型来抓取和分析公众的情绪变化。利用格兰哲因果检验模型(Granger causality test),研究人员发现公众的情绪和道琼斯平均指数(DJIA)之间存在着明显的相关性(见图2)。从某种程度上讲,公众情绪的某些指标可有效地预测未来股价的变动。研究人员为此建立了一个自组织模糊神经网络模型,可以有效地预测道琼斯工业指数的收盘价涨和跌的方向,其准确率高达86.7%,而预测失误的平均百分比下降了6%。虽然离用它来预测证券市场的行为还不现实,至少为这样的预测提供了一种可能性。

 

2.公众情绪中的冷静指数和道琼斯工业指数的匹配度

第二个例子是美国国内最大的商业视频流供应商Netflix,一直从互联网收集用户的数据,包括用户在看什么、喜欢在什么时段观看、在哪里观看、使用哪些设备观看等,甚至记录用户在视频的什么时间点前进、后退、暂停或者看到哪里直接将视频关掉等信息。基于这样的大数据分析,Netflix能够预判用户对视频内容的潜在需求,并利用大数据说服了BBC重新翻拍这两年曾引起巨大反响的《纸牌屋》。同样是基于大数据分析,他们还成功地分析出演员Kevin Spacey和导演DavidFincher的支持者与原剧粉丝的关联性,确定了新剧拍摄的最佳人选。

第三个案例是来自美国的ZestFinance。这是一家应用大数据进行征信的互联网金融公司。该公司最初的服务对象是那些在大型金融机构没有征信记录,只能使用高利贷的人群。通过大数据挖掘这些人的信用信息,帮助这些人尽可能享受到正常的金融服务。除了传统的信贷数据,ZestFinance大数据征信的数据来源还包括了消费者的还款能力、还款意愿等相关风险特征,如个人的纳税情况、在网络上的访问行为甚至是搬家次数。这些数据和消费者的信用状况相关性较弱,需要用大数据技术搜集更多数据来加强这些弱相关数据的描述能力,使得大数据征信可对传统征信无法服务的人群提供征信服务。目前,共有超过400万美国人直接通过ZestFinance申请信用评分,另外银行等金融机构通过ZestFinance的模型获得信用背书的人数远远大过该数字。ZestFinance还有另外一个重要的组成部分,即ZestCash贷款平台,直接给信用记录不太好的人提供小额贷款。

中国人口基数庞大,社交软件发达,经济发展快,传统金融服务质量差,广大群众对优质的金融服务需求迫切。在这种形势下,互联网金融特别是以P2P为代表的民间借贷,在中国的发展远比美国迅速。例如P2P企业,现在中国有2 000多家公司,2015年的行业成交额达到9 750亿元,是美国主流P2P公司LendingClubProsper总和的数倍。快速发展的同时,也带来了不少问题,比如卷款跑路、恶意诈骗、资金链断裂、非法融资、庞式诈骗等问题层出不穷。这些发展中的问题暴露出中国的互联网金融企业在意识、策略与风险管理手段方面的落后,特别是大数据应用技术的落后,需要我们奋起直追。借鉴美国互联网金融的发展案例,结合中国互联网金融的特点,可以在如下四个方面发力:一是基于互联网的大数据征信体系,快速而且准确地刻画人物和企业;二是利用大数据技术提高风险控制的实时性和有效性;三是通过大数据技术手段为客户提供更加个性化的服务;四是依靠大数据和互联网技术手段及思维方式,创新互联网金融产品,为社会提供更多更好的互联网金融服务。总之,以大数据技术来驱动互联网金融的良性和快速发展。

一是利用大数据技术完善基于互联网的征信。在移动互联时代,要准确地刻画一个人或者公司的形象,不仅需要传统的以信贷数据为基础的征信数据,更需要从互联网和其他公开渠道收集的其他相关信息,包括政府机构,如税务、工商、社保等方面的信息,公共事业缴费,像水电煤气,互联网人力招聘广告,公司在互联网上的目录等等(见图3)。这种基于互联网的大数据征信依靠的是抓取、分词、建模、表达等大数据技术。目前国内比较成熟的平台有蚂蚁芝麻征信和易宝天创云征信等。

 

3.大数据驱动下的互联网征信

二是利用大数据技术解决好P2P、网络贷款、消费信贷的风险控制问题。2014年,全年共有122P2P平台跑路,201561个月就超过了上年一年的跑路数字(见图4)。其中注册资本金在5 000万以上的问题平台有112家之多。这些问题P2P平台,有一部分是纯粹以诈骗为目的,但是更多的是因为缺少金融风险管理经验或技术手段不完善,在资金耗尽、坏账高筑的情况下被迫跑路。如果能够采用大数据技术,在贷前,基于数据模型和海量数据,包括黑名单、交易流水等,针对借款人和项目进行合理的风险评估,做出科学的决策。贷后,基于借款人的还款情况和经营状况,密切关注和跟踪贷款人的活动,及时预警,严密追踪,从而有效地避免坏账。目前包括天创云征信、芝麻信用等新型的互联网征信企业,基于海量的网络交易及行为数据分析,形成用户信用评估,对用户的还款能力及意愿出评价。

 

4.问题P2P平台统计

三是利用大数据技术分析海量的用户数据,掌握用户的行为特点,有针对性地制定营销方案,提供个性化的服务。

四是利用大数据等互联网技术创新产品和业务模式。余额宝就是一个例子,其他如众筹、网上银行、网上保险、网上理财都是利用互联网的连接、分享、减少中间环节等来构建的新型服务。另外,广泛结合传统产业,利用大数据技术改造现有的管理体制、生产组织、销售渠道和营销策略也是一个重要的方向。像大北农的猪联网,以传统的生猪养殖为基础,利用大数据和互联网,打通养猪链条上的各个环节,整合信息流、资金流、货物流,形成了规模超过每年千万头猪的能力。这里不仅有养殖、饲料,还需要供应链金融服务。

与传统金融相比,互联网金融面临更多的挑战性,如交易范围广、交易速度快、交易时间无限制、交易国界模糊化、交易者身份虚拟化等。同时,由于互联网技术的发展,瞬时高频交易甚至无人控制的自动化智能交易正在实现或已经成为现实。所有这些因素都是互联网金融所必须面对的挑战。幸运的是,云计算和大数据技术带来了解决这些问题的技术手段。未来的互联网金融发展,必定是在大数据技术的驱动下,通过不断进步的数据采集、存储、过滤、清洗、分析、建模、人工智能和可视化表达手段,更好地掌握互联网金融各类业务的发展规律,不断促进传统金融服务的转型,为人们提供更多更好的金融服务,实现2013年诺贝尔经济奖得主席勒教授在《金融与好的社会》中所说到的美好金融。

 


专题报道Special Report>