机器学习在风险评估中的应用研究

2018-01-17蒋鹏

电子技术与软件工程 2017年23期

蒋鹏

摘要随着世界经济全球化进一步深入，各行各业市场波动性也随之加剧，寻找精确、客观、可靠的风险评估方法已成为各行各业急需解决的燃眉之急。机器学习具有很好的处理非线性分类问题的能力，基于机器学习的风险评估模式能有效提高风险评估的精确度与适用性。本文以此为逻辑起点，分析机器学习在风险评估中的应用模式，以及随着而提高的风险评估的准确率。

【关键词】机器学习风險评估

1 序言

随着大数据时代的来临，数据挖掘等新兴的学科技术开始发展起来，机器学习是其中最具代表性的技术。当今公司经营和科学研究中，如何应用这些新兴技术是企业领导和科研人员心中未解的谜题。机器学习广泛应用于在交通运输、医疗业、生物以及信息技术和软件工程领域，但本文认为，机器学习更适用的领域是风险识别，因此本文着重分析风险评估过程中机器学习技术的应用。

2 机器学习概述

以往的风险评估模式主要以线性为主，严重依靠个人的主观能动性和经验知识。随世界经济的一体化和文化日益多元化，风险已经不局限于一国一省了，突破时间和空间的风险隐藏在各行各业中，传统的风险评估模式已经不能满足风险管理的需要。更有甚者，近些年来，机器学习技术进步神速，正在不断接近我们心中的人工智能目标，图像检测、语音识别、风格迁移、机器翻译等技术已经在我们的实际生活中开始得到了应用。

什么是机器学习？简单来说，机器学习就是通过分析大量数据来学习，从数据中挖掘出有用的数据，即电脑利用已有数据代替人类理性思维处理数据，并精准计算数据模式的过程。机器学习不是通过编程来识别数据，而是重在寻找数据中的模式并使用这些模式来做出预算。机器学习中有许多典型的问题，比如回归、异常检测、聚类、分类以及降维等等，每个问题延伸出来即成为算法。机器学习的过程先是选择数据，其次建立模型数据，其次验证数据，再次测试数据，再次使用数据，最终调优数据。机器学习实际应用有很多场景，增强分析以降低风险是最典型的例子，比如为了检测某个过程，计算机将机器学习和其它数据挖掘技术结合起来，开发更为全面且准确的概况，获取对整个过程的深度了解，风险相应降低了。

3 传统的风险评估模式

专家法、评级法和评分法作为传统的风险评估模型，在各行各业的应用颇为成熟。市场甚至能在不依靠中国人民银行征信系统的情况下，自发形成各自适用的风险评估系统。大企业通过大数据挖掘，自建信用评级系统，而中小企业通过信息分享，借助第三方获取风险评估服务。而三大风险评估模式均存在弊端，作为定性分析方法的专家法，因其强大的个人主观性导致评估结果分散，无法形成统一的标准；依靠综合分析信息情况定量评定等级评级法，因其对不同行业，相关因素、特征等方面不具有统一性，所以评估结果无法客观；赋以权重加权或综合考评得出分数的评分法则在互联网大数据发展时代受到严重的限制，丧失了原本的算法框架。

4 机器学习评估风险

机器学习是对大量的互联网数据进行统计分析，只有学习的数据量越大，预判的精准性才越高。事实上，许多机器学习算法给出的评估报告本身就是大概率的。这种大概率的评估结果用于决策用于评估风险恰到好处。风险的意义在于在特定空间和时间下，预期结果可能存在的偏差，以及这种偏差的大小。机器学习算法可对不利事件发生的概率进行预测，而确保风险评估模型都可以套用，因此机器学习技术应用到风险评估领域愈来愈受欢迎。

4.1 数据收集

信息管理方要积极协调风险管理方，采集海量数据，连接端口，消除信息滞后和孤立现象，建立适用于大数据处理的数据中心。机器学习算法的预测依赖于与某件相似风险事件相关联的信息，信息越多，预测越准确。风险评估方应该提供完备而准确历史评估信息，不仅包括已发生风险，还包括隐患事故，并将所有信息形成报告，并入到风险案例库中。

4.2 机器算法

机器学习包括监督学习、无监督学习、半监督学习、强化学习、深度学习、迁移学习、集成学习以及降维学习等等。不同的学习方法体系有不同的算法，不同的算法针对不同的应用方式、数据集、预测目标，预测的结果也不一致。就监督学习而言，就有线性回归、线性判别、支持向量机、分类和回归树、自组织映射以及卷积神经网络等37类算法，深度学习、也有分层时间记忆、生成式对抗网络、因子分析等算法，此处就不详细论述其他体系的算法了。风险评估基于严密的机器算法之下，很难出现不客观的评估结果。

4.3 迭代学习

机器学习不是一劳永逸的，而是一个循环往复不断上升的过程，它能自我更新和验证，修正已有的经验模型和逻辑。应用机器学习进行风险评估是一个连续的学习、得出结论、再学习的过程，从而提高风险监控的准确率。对各行各业存在消极对待、过度承诺、过度乐观、缺乏控制力、监管风险都是一个很好的预测。

4.4 机器学习评估风险仍存在缺陷

比如被修正为无风险的事件，有可能只是在之前的风险评估中被发现，并采取了预防措施，但导致进一步进行机器学习无法识别，从而导致重特大风险事件的遗漏。

5 结语

人工智能已然是历史的第三波浪潮，堪称“工业4.0”，目前有突破性的成就，但也有未解之谜。真正创造一个有认知力的“生命”——还有很大的难度。现代社会中数据的爆炸式产生是由计算机的迅速发展带来的，每时每刻都有数以万计的数据产生，怎样运用如此庞大的数据已经成为炙手可热的焦点话题，而机器学习无疑是最佳的方法之一。

事先对风险做出科学的预测和评估才是防范风险的第一要义。应用机器学习中的大数据预测结果是基于现实的风险来源，通过神经网络进行信息处理，建立训练模型，再评估性能后，持续优化得出的。因此，机器学习可以堪称“工业4.0”时代的人工智能发展方向，这一领域在风险评估的应用还有待挖掘。

参考文献

[1]张潇元.基于BP算法的金融信用风险仿真研究[J].现代商贸工业，2015.

[2]田家俊.基于机器学习的人机博弈的研究与实现[D].东华大学学报，2007.

[3]符永顺.基于机器学习的移动应用推荐系统的研究与实现[D].通讯世界，2014.

[4]李航.统计学习方法[M].北京：清华大学出版社，2012.

作者单位

南阳医学高等专科学校河南省南阳市 473000endprint