当前位置:大数据业界动态 → 正文

杨凯生:互联网金融应避免大数据认识误区

责任编辑:editor007 作者:韩祎 |来源:企业网D1Net  2016-05-14 23:48:35 本文摘自:财新网

中国银行业监督管理委员会特邀顾问、中国工商银行原行长杨凯生5月14日出席”2016年中国金融科技创新论坛”,并发表题为《关于大数据的认识误区及其在互联网金融中的表现》的演讲。

杨凯生认为,互联网金融近期出现一系列问题反映了我们对互联网、大数据技术的理解存在偏差。在大数据时代更要注意处理好碎片化信息和完整性数据的关系,处理好结构性数据和非结构性数据的关系,作为企业包括银行还要处理好客户个性化意识和社会化共同需求的关系。

杨凯生指出,应该更多地注意到互联网思维有另一层含义,就是互联网、大数据技术的发展和进步给人类提供的是从更宽视野、更多维度、更全方位来认知问题和分析问题的工具和方法。

他举例说,有的机构掌握了一定量的客户信息数据,就以为是掌握了大数据,而忽视了对数据分析工具和方法论的研究,这在金融业务中就很有可能影响对风险的识别和防控,造成风险的积聚和扩散。这一阶段一些从事互联网金融业务的公司尤其是一些P2P网贷公司频频出现的失败,除了一部分是蓄意欺诈行骗外,多数正是因为这些机构并没有真正搞清楚究竟什么是大数据,自己究竟获得的是什么数据,自己究竟有没有掌握好所需要的数据挖掘技术、建模技术和分析评估技术。

也有人总是以为在一个样本范围内得出了结论,就等同于掌握了对某个问题全部的规律性认识。其实在一个范围内的结论(即便是正确的结论)也不一定能够简单外推,这就是在所谓机器学习中需要严格防止的模型“过度拟合”问题。模型越是复杂、需要纳入的变量越是多,就越容易出现这样的问题。这也正是在金融风险管控中必须注意的“模型风险”问题。

杨凯生说,强调大数据的重要性,不能丢掉小数据。传统的小数据有经典的数理模型,有比较成熟的数据分析统计理论、方法,数据挖掘的技术早就成形。但是大数据到今天为止,管理理论、分析方法都还处在快速发展更迭的阶段,并没有十分的成形。大数据数量越大,噪音相应也就越大。甚至往往是数据大幅增加的时候,它的噪音的增长幅度要快于数据量的增长幅度。因而大数据的挖掘成本是比较高。再比如大数据更容易反映出一些相关关系,而小数据通过分析比较容易直接得出因果关系。在许多情况下相关关系并不能简单地取代因果关系。

因此,大数据和小数据各有特点,各有它的长处、短处。简单的想以此来取代彼,不是一种科学的看法。只有把它融合起来,把小数据分析方法的完备性、准确性和大数据的多维性、即时性融合起来,才能对管理真正带来一种质的改变。“应该说,前一阶段一些互联网金融企业出现的问题,就与这方面思想认识上的片面性有关。”杨凯生说。

杨凯生总结说,数据是一种财富,因为它是人类活动的记录与结晶。但数据多了有时也会带来挑战,记录中可能掺杂噪音,结晶旁也许陷阱纵横,对于数据信息的不当理解,对于分析方法的盲目应用,以及数据使用者本身的目的以至品性如果存在问题,那就有可能使得人们在面对世间万象时变得比以往缺乏数据信息的年代更加迷惑。只有学会客观地看待数据,合理地选择工具,科学地进行分析,才能够从纷繁复杂的社会经济生活中提炼出那些有价值的结论。

关键字:数据挖掘技术

本文摘自:财新网

x 杨凯生:互联网金融应避免大数据认识误区 扫一扫
分享本文到朋友圈
当前位置:大数据业界动态 → 正文

杨凯生:互联网金融应避免大数据认识误区

责任编辑:editor007 作者:韩祎 |来源:企业网D1Net  2016-05-14 23:48:35 本文摘自:财新网

中国银行业监督管理委员会特邀顾问、中国工商银行原行长杨凯生5月14日出席”2016年中国金融科技创新论坛”,并发表题为《关于大数据的认识误区及其在互联网金融中的表现》的演讲。

杨凯生认为,互联网金融近期出现一系列问题反映了我们对互联网、大数据技术的理解存在偏差。在大数据时代更要注意处理好碎片化信息和完整性数据的关系,处理好结构性数据和非结构性数据的关系,作为企业包括银行还要处理好客户个性化意识和社会化共同需求的关系。

杨凯生指出,应该更多地注意到互联网思维有另一层含义,就是互联网、大数据技术的发展和进步给人类提供的是从更宽视野、更多维度、更全方位来认知问题和分析问题的工具和方法。

他举例说,有的机构掌握了一定量的客户信息数据,就以为是掌握了大数据,而忽视了对数据分析工具和方法论的研究,这在金融业务中就很有可能影响对风险的识别和防控,造成风险的积聚和扩散。这一阶段一些从事互联网金融业务的公司尤其是一些P2P网贷公司频频出现的失败,除了一部分是蓄意欺诈行骗外,多数正是因为这些机构并没有真正搞清楚究竟什么是大数据,自己究竟获得的是什么数据,自己究竟有没有掌握好所需要的数据挖掘技术、建模技术和分析评估技术。

也有人总是以为在一个样本范围内得出了结论,就等同于掌握了对某个问题全部的规律性认识。其实在一个范围内的结论(即便是正确的结论)也不一定能够简单外推,这就是在所谓机器学习中需要严格防止的模型“过度拟合”问题。模型越是复杂、需要纳入的变量越是多,就越容易出现这样的问题。这也正是在金融风险管控中必须注意的“模型风险”问题。

杨凯生说,强调大数据的重要性,不能丢掉小数据。传统的小数据有经典的数理模型,有比较成熟的数据分析统计理论、方法,数据挖掘的技术早就成形。但是大数据到今天为止,管理理论、分析方法都还处在快速发展更迭的阶段,并没有十分的成形。大数据数量越大,噪音相应也就越大。甚至往往是数据大幅增加的时候,它的噪音的增长幅度要快于数据量的增长幅度。因而大数据的挖掘成本是比较高。再比如大数据更容易反映出一些相关关系,而小数据通过分析比较容易直接得出因果关系。在许多情况下相关关系并不能简单地取代因果关系。

因此,大数据和小数据各有特点,各有它的长处、短处。简单的想以此来取代彼,不是一种科学的看法。只有把它融合起来,把小数据分析方法的完备性、准确性和大数据的多维性、即时性融合起来,才能对管理真正带来一种质的改变。“应该说,前一阶段一些互联网金融企业出现的问题,就与这方面思想认识上的片面性有关。”杨凯生说。

杨凯生总结说,数据是一种财富,因为它是人类活动的记录与结晶。但数据多了有时也会带来挑战,记录中可能掺杂噪音,结晶旁也许陷阱纵横,对于数据信息的不当理解,对于分析方法的盲目应用,以及数据使用者本身的目的以至品性如果存在问题,那就有可能使得人们在面对世间万象时变得比以往缺乏数据信息的年代更加迷惑。只有学会客观地看待数据,合理地选择工具,科学地进行分析,才能够从纷繁复杂的社会经济生活中提炼出那些有价值的结论。

关键字:数据挖掘技术

本文摘自:财新网

电子周刊
回到顶部

关于我们联系我们版权声明隐私条款广告服务友情链接投稿中心招贤纳士

企业网版权所有 ©2010-2024 京ICP备09108050号-6 京公网安备 11010502049343号

^