邓明森:超大规模的数据和信息的缺失,是一对尖锐的矛盾

来源:财经网科技  2017-05-28 0
分享到:
导语

与传统的工业国家相比,发展中国家金融服务行业的渗透性更差,在一些新兴的经济体里面,贷款面临困难。对中小企业、低收入群体来讲缺乏足够的抵押物,征信过程的成本比较大,可持续性并不好。现在,随着计算技术以及电信技术的进步,戏剧性地激活了低收入家庭及小企业的经济活动在金融版图中的视角,有望能够解决这个问题。

2017年5月28日上午,在贵阳举行的“2017中国国际大数据产业博览会“大数据+金融”分论坛”上,贵州财经大学大数据金融学院院长邓明森发表 “面向低收入群体的金融服务中的数据驱动” 主题演讲时谈到:与传统的工业国家相比,发展中国家金融服务行业的渗透性更差,在一些新兴的经济体里面,贷款面临困难。对中小企业、低收入群体来讲缺乏足够的抵押物,征信过程的成本比较大,可持续性并不好。现在,随着计算技术以及电信技术的进步,戏剧性地激活了低收入家庭及小企业的经济活动在金融版图中的视角,有望能够解决这个问题。在演讲对最后,他对于超大规模数据加在一起进行征信带来的问题进行了前瞻性探讨。

3

以下是邓明森演讲全文:

大家好!前面几位嘉宾讲得非常好,我感觉到压力非常大,我简要地向大家汇报一下我们的想法和一些工作。我说的题目是面向低收入群体的金融服务中的数据驱动。

我是1982年出生的,我第一次进银行的时候发现了一个很有意思的现象,菲利普·科特勒说主管贷款的银行高级职员,面无笑容地把借款人安排在大写字台前比自己低得多的凳子上居高临下,颐指气使,阳光透过窗子照在孤立无援的客户上,该人正努力诉说着他借款的理由,而冰冷的银行大楼而宛如希腊神殿。金融的本质为有钱人理财,为缺钱人融资,金融的本质就是实体产业投射在天上的影像而已,金融必须踩着实体的节奏,与传统的工业国家相比,发展中国家金融服务行业的渗透性更差,特别在一些新兴的经济体里面,贷款可能更加困难。

对于大多数银行来讲,贷款是最大、最封建的信用风险来源,这种风险既有传统贷款、债权投资等表内业务中,又存在于信用担保、贷款承诺以及衍生品产品交易等表外业务中。在中国的金融市场上面,根据世界银行的数据,在中国的金融市场里面存在一个很有意思的现象,也就是说贷款规模和强大的经济规模及国有企业的规模是不相适应的,贡献了70%的GDP的中小企业只能获得20%的金融资源。前面两位嘉宾也讲到对于这些企业来讲或者中小企业来讲缺乏足够的抵押物。

通常面临的问题有两个:一是传统银行面对这些针对低收入人群及小企业的小额贷款的交易手续费及过程繁琐性降低了服务发生的意愿;二是低收入人群对小企业对金融产品的信息了解不够,存在信息不透明的情况。因此,一些专门的征信机构出现是解决交易双方信息不对称而带来的信用风险。在这里面我们也存在一些问题,特别是对低收入群体面临的困难,我们觉得在这里面,征信过程的成本比较大,可持续性并不好,比如在贵阳市的一个低收入的人群,对这些人来讲银行也好或者各种各样能够发生的有形、无形的数据本来就少,怎么对他发生征信,这是一个很困难的问题。在信用市场上,跟大企业相比,他们面临的问题是,对他们的财务状况了解,各种透明性的了解比较少,加剧了他们的困难。最明显的一些外国银行和本国银行相比具有更低的贷款意愿。

在2005年联合国提出了普惠金融的概念,希望能够解决这个问题,比较幸运的是现在各种各样的计算技术以及电信技术的进步,戏剧性地激活了低收入家庭及小企业的经济活动在金融版图中的视角,前面提到的信用问题可以利用更强大的计算能力及新的数据源及信息建立新的风险模型。在这里面,不管是数据源也好,还是各种各样的东西也好,这是在铜的表面上面,在我小的时候,我们家里面烧水的水壶是铜的,我们现在建一个模型就能看到它的表面是什么样子的但我们要看得清楚,要用原子力显微镜只为看到固体的表面,在人类历史上最早的,像地契、大清宝钞上面都有各种各样的信息。更重要的是随着信息化、网络化的推进,以及移动互联网等等各种行业的兴起,导致每个人或多或少都有各种各样的数据被记录下来,比如移动电话,我们出行,或者水费、电费等等各种各样的数据被记录下来。我们也需要强大的计算能力,去年计算机大会的主题语是计算改变未来,这是第一台计算机,这是我用的笔记本电脑何寿基,彼此之间的差别是非常显著的。

通过前面的各种各样的数据引入更大规模、更多种类的数据,通过重新评估借贷者的信用并降低各种手续成本,比如移动电话用户、社交媒体用户、移动电话的使用方式及其他途径的支付历史,使得我们可以研究人本身的活动规律。在2005年的时候美国有一个教授研究了达尔文和爱因斯坦两个人一辈子收到一封信,放到桌子上,然后再回复这封信的间隔,发现了一个规律,从我们的主观猜测来看,对爱因斯坦而言,他收到一封信,放在桌子上,想起来回这封信的时候这应该是一个随机的现象,对个体而言,数据本身或者每个人的个体活动本身是有规律的。对于很多社会经济或者技术现象,包括贷款也好是由个人的行为驱动的,因此定量研究人的行为也是我们现在面临的问题。

这是我们去年到今年研究的数据,前面黄老师讲到我们更多的是80后、90后在使用互联网或者金融平台。我们研究了纯技术驱动的CSDN的网站,我们把他们从2001年到2017年相当于接近17年的数据把它爬下来,看了一下,基本上对里面的每一个用户而言都符合图上的情况。

对移动电话数据而言,对于科学与应用问题的界限正在日益模糊,因此移动电话的问题,我们研究了移动轨迹特征、人群移动规律,社会活动模式,通过这些来研究人的征信问题。

移动电话也好、电子商务也好、互联网用户也好,数据规模越来越大,这是我们国家截止到不同时期的规模,电信也好,还是移动支付以及活跃的互联网用户等等,这些数据量都非常庞大,特别是对于每一个个人而言,比如对我的个体而言,我们可以从自己的移动电话帐户里面可以查到过去6个月的移动电话通讯记录,这对我来讲这个记录非常庞大,但对整个电信行业也好还是对我们征信也好,这些数据的规模已经庞大到了一定程度,这是电子商务的数据,阿里巴巴、腾讯和京东的数据,这些数据已经大到了我们无法想象的地步。

因此我们利用这种办法来进行征信,应该说对于我们整个行业的促进作用非常大。在2015年2月份的时候,腾讯公司开始向经过筛选的QQ用户提供额度不超过500块钱的贷款,特别是一些银行也注意到它的高质量数据,在未来金融市场的作用,它开始把这些数据提供给一些大的数据公司,比如在2012年的时候不管结构化、非结构化数据已经超过100个TB,在2014年3月工商银行有4.9个PB的数据,这说明一个什么情况,也就是说这几年整个金融行业的数据,本身银行的数据的增长速度超过了以往的任何时候。这是我们刚才回过头来看移动电话的数据,通过移动电话通讯构建了这样一个网络。

不管是微博、微信还是QQ等各种各样的东西,每个人有一些好友,微信有一些朋友圈,通过个人的东西把人连接在一起,我们就可以看到他比较糟糕的财务状况。如果我们把这些东西,针对其中一个东西拿出来,比如face book背后隐藏的庞大的社会关系网络,如果我们对个体的征信和对整个网络里面的信息结合起来,我们就可以得到一个更好的征信模式。我们现在在国内的一些行业,比如量化派、闪银科技,他们分别利用支付及电信和一些互联网消费行为的大数据进行整合、匹配和交叉验证,量化评估普惠金融服务人群的信用风险。但从技术角度来讲,存在的问题依然很明显,比如人与人之间构建庞大的关系网络之后,跟我有发生过移动电话的通讯,可能有网上支付的关系,连接起来网络非常大,最后形成一个非常巨大的网络,但是可能对一些更少的低收入群体的人际关系网络可能更小,小到就那么几组数据,也就是说我们超大规模的数据和信息缺失的矛盾,这是一对非常尖锐的矛盾,同时由于这些数据和我们这些超大规模的数据构成了这样一个巨大规模的关联矩阵预算以及深邃的路径搜索,应该说这是我们面临的巨大问题。这个问题从应用上怎么理解呢?比如我们对某一个人进行征信,结果我们在这个矩阵里面找到相应的信息,从A到B之间可能大约要经过很多条路径,这些路径最后算起来形成一个庞大的矩阵,对求解这个巨大的任何一个信息,是我们超大及或者关联矩阵运算的问题,对这样一个操作,理论上来讲,是我们现在很多互联网企业也好,还是我们的一些小的征信机构或者提供金融服务的企业难以承受的东西。

最后我还想提出一个问题,就是征信的方式真的是安全的吗?在经济学里面有一个很重要的问题就是人们通常会对各种各样的机密作出一些相应的反应,打个日常生活中最简单的比方就是安全带,我们开车的时候要系上安全带,它真的安全吗?或者它真的能降低交通事故吗?有经济学家对这个事情做一个统计,其实并没有降低交通事故,原因很简单,系上安全带以后,开车的人会随意一点,随意一点,对路上的行人就危险一点,同时还有一些制造坚固的汽车,或者质量很好的汽车在十字路口更容易违章,各种各样的经历或者各种各样的保险导致人在做事情的时候更有胆量。

在2008年的金融危机,恰恰是各种各样金融创新、很多保险工具带来的,比如征信对普惠金融也好还是互联网金融也好,让大家觉得这个人更放心、更安全,让大家更大胆或者更放心去做事情,但可能会带来更大的泡沫或者更大的风险。而且大数据本身大家也不太会忘记这个事情,2008年的时候谷歌预测流感的爆发,在美国的政府发现这个事情之前先发现了这个事情,引起了大数据的热潮。2014年的谷歌流感的预测再次上了新闻,原因很简单它对流感的预测规模和深度和广度都比实际发生的规模更大,也就是说数据本身就有一个自我推断的能力,也就是自己把自己得到过高的一些估计或者更过程高的一些预期,我们把所有的数据加在一起进行征信,会不会带来同样的问题,我想这可能也是在未来这个行业里面,不管是具体在做学问也好还是具体的业务部门也好需要大家关注的问题。 谢谢大家!

编辑:zhaoxiaofei
缺失 数据 信息 邓明森
分享到:

财经网微评论0人参与)

查看更多>>
匿名评论
  • 全部评论(0条)
查看更多>>
  • 热门排行
  • 大家喜欢
  • 站在资本风口,如何飞得更高是每个公司的梦想。在当下的政策寒流中,如何走得更远是每个互联网中介公司面临的新课题。

  • 生鲜电商领域最早的试水者沱沱工社换帅一事再一次搅动生鲜电商一池春水。这片深不见底的池水下面,是创业者对它又爱又恨的复杂情绪。在这个被视为下一个千亿级的电商市场中,不断传出的倒闭消息时刻拷问着每一位从业者:怎样才能玩转生鲜电商?

  • 不少苹果用户最近几周在苹果官网论坛和各大社交网站投诉称,他们在iPhone上安装了最新iOS升级后,手机耗电速度明显比平时快了。

  • 阿里巴巴股价今天突破了180美元,年内涨幅已近翻倍,但在华尔街投资者眼中,故事才刚刚开始。9月19日,顶级基金经理人Tony Mitchell在接受《福布斯》专访时表示,相比亚马逊,阿里巴巴估值仍然偏低,相信股价在3-4年内还将翻倍。就在上个月,投资人Gorden Lam也告诉《福布斯》,阿里巴巴是比亚马逊更好的投资。

  • 9月20日讯 记者从北京市地铁运营有限公司获悉,为进一步提升北京地铁安全运营和服务水平,满足乘客对轨道交通应用移动支付技术的迫切需求,向乘客提供更为便利的出行服务,2017年9月20日起,地铁机场线率先实现刷二维码进出站。