博客 大模型在金融风控方面的应用

大模型在金融风控方面的应用

   数栈君   发表于 2024-04-10 14:21  101  0

大模型在金融行业应用优势

1. 大模型催生了“交互革命和效率革命”,为金融业提提质增效

大模型一个是让我们的服务更加强大,大模型具有高发并发的特征,可以实时对终端客户的服务请求进行响应处理,大大增强了金融机构的服务能力。第二是效率更高,大模型可以快速的处理大量数据,提高金融业的业务效率,助力生产经营管理重塑业务模式。第三是创新更快,大模型可以协助金融行业的创产品创新和服务,满足客户不断变化的需求。第四是预测更准,大模型有大量的训练数据,能够在预测和风控方面提供更高的准确度。

2. 大模型在金融行业用用的难点

第一是数据质量和隐私保护。因为大模型的训练过程中要用到大量的金融数据,但金融行业的数据质量参差不齐,且涉及到用户的隐私信息,如何在保证模型效果的同时,保护用户隐私和数据安全,是金融机构面临的一大挑战。数据治理也是金融机构数字化转型过程当中的一个最大障碍,银行在数字化转型过程当中也在做一些数据治理,因为数据治理不治好,很多模型出来也是不正确的。

第二是可解释信任度的问题。大模型决策过程当中往往很难解释,这使得金融机构难以向客户解释模型决策依据和结果,容易引发公众对模型的信任危机。因此,如何提高大模型的可解释性和信任度,是金融机构需要关注的问题。

第三是实时性和动态性。金融市场的变化是是一个动态的过程,而大模型的训练和推理过程,要消耗大量的时间和数据资源,如何保证大模型在实时性和动态性要求较高场景下的应用效果,是金融机构需要解决的一大难题。

第四是技术门槛和成本。大模型的训练和应用需要高性能计算资源和专业的技术人员支持,所以大模型的技术应用门槛和应用成本比较高,如何降低大模型的技术门槛和应用成本,是金融机构需要考虑的问题。

3. 大模型在金融行业应用面临的风险

第一是数据泄露风险。在大模型应用过程当中的数据保护不当,就可能会导致数据的泄露,给金融机构造成损失。

第二是技术滥用的风险。大模型技术一旦被滥用,可能会被用于进行欺诈,洗钱等非法活动,给金融机构带来法律风险。

第三个是模型风险。由于大模型的复杂性和数据依赖性,可能会出现模型过拟合和解释性差等问题。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/a0a799cea604e2197fd12b758e014748..jpg

目前大模型在金融行业应用

已悄然兴起

近期一份来自银行千亿级的大模型采购的结果公布,从公布招投标文件来看,目前需求大多是训练模型,语言模型和数据处理模型,这种现状验证了之前的恒星电子对数家数百家的金融机构的走访结果,AI大模型在这个领域当中,只有8%的银行进行立项阶段,17%在测试阶段,70%的金融机构还处于调研阶段。这两个采购结果也释放了一些信号,大模型也正在走出从纸面规划开始落地到应用行业的一个信号。

从公告信息看,目前谈大模型效果虽然为时过早,但是从需求来看,部分金融机构开始尝试大模型在金融的运用,需求比较集中,经过招投标业界讨论,财务公告资料来看,银行等金融机构关于大模型落地较为集中,主要关注点是可降成本提效,可广泛应用场景的场景包括客户服务,智能研投、风险控制,欺诈监测和运营管理等方面。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/276714aec70c9cdc01f30ec9db3e087b..jpg

大模型在银行信贷风控

应用探索

浙江省联社专门成立了人工智能研究院,借助省联社大数据大算力强算法的相结合大模型技术的建模能力,开展大模型在信贷风控方面的应用,通过人工智能,解决三大场景的痛点。

  • 行业分析痛点:金融从业人员对新兴行业不熟悉;行业集中度风险日益显现;新兴行业需求多样性。

  • 授信尽调痛点:人工服务成本高;现场办理难;业务效率低;综合分析能力弱;难以精准反映用户特征。

  • 审查审批痛点:评审人员业务素质不一;评审人员效率不高;评审人员存在道德风险;评审主观判断较强;评审人员学习能力不足。

1. POC功能特点

基于大模型银行应用领域,POC功能点主要集中在以下方面:一是降低业务人员查询及提取业务数据技术门槛,最大化程度从查询需求到SOL的自动生成;二是减少信贷流程中相关人员撰写报告的精力投入。

2. NL2SOL-现状

现在大模型比较多,在本地化落地过程中存在一些问题:第一,输入文件长度受到限,实际数据规模较大,字段较多,无法直接使用相应的模型;第二,大模型的通用能力比较强,但是金融相关SQL的生成则需要较强的表结构先验信息和与之相匹配的提示工程;第三,数据治理方面存在类型混用、字段命名不统一、外部信息或推理欠缺、执行效率未优化等问题;第四,某些大模型无法本地化部署,且存在网络响应延迟等问题。

因此,并不是大模型拿来我们就可以用,而需要进行针对金融的模型改造。

3. NL2SOL-模型选型

本次POC将字段名筛选和SQL生成分离,采用字段筛选、基于排名增强的编码及SQL任务感知的解码框架。一是基于字段名与检索任务进行排序,二是将已排序字段名注入编码器,而不是整个无序的表结构,三是解码器首先生成SQL关键词,再生成实际SQL 查询语句。从训练难度、结果精度、执行速度三个维度对多种模型进行评测。

http://dtstack-static.oss-cn-hangzhou.aliyuncs.com/2021bbs/files_user1/article/dd5252424e7497014916127866137ac8..jpg

图  NL2SOL-金融模型系统架构

文本报告自动生成的技术路径如下。事实本文数据经过一系列提示工程下的大语言模型生成相应的内容,内容经过业务人员人工校对和修改,得到最终尽调报告。经过人工修改的尽调报告和原始事实数据形成标注数据可以进行大模型的微调,提升模型撰写更适配工行内部要求的文本的能力。

4. 取得的成效

首先是智能生成行业分析报告。能够及时获取生成我更新信息,通过大模型可能会几天或一个星期时间就可以生成我们需要的报告。还可以用于客户经理营销,行业信息能够及时提供给客户经理,客户经理在营销过程当中能跟客户更顺利的交流并营销。在产品开发方面,不同行业有不同的需求,在金融行业当中,可以针对相应的行业开发相应的产品。在制定授信指引方面,可以帮助我们判断对哪个行业是重点支持的,哪些是适度支持的,哪些是禁止支持的,哪些是审慎支持的。此外,也可以用于目标客户的筛选、金融需求分析和机遇行业风险特征制定相应的防范策略。

第二是智能生成评审报告。我们的主审人员有些是金融专业的,有些是法律专业,有些是财务专业的,有些是其他专业的。大模型大大提高了审批人员的综合分析能力和评审效率,解决审查审批人员人力不足,弥补审批人员综合分析能力的不足的问题,同时也可以防范审查人员的道德风险。

5. 下一步拓展方案

下一步的拓展方案就是基于POC的验证,在模型能力及算力上保障未来业务场景的具体落地,在生成“行业授信指引”、“城投评估报告”、“主审分析报告”等完整报告基础上,拓展更多大模型的应用场景。


免责申明:
本文系转载,版权归原作者所有,如若侵权请联系我们进行删除!


《数据治理行业实践白皮书》下载地址:https://fs80.cn/4w2atu
《数栈V6.0产品白皮书》下载地址:https://fs80.cn/cw0iw1
想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=bbs
同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack



0条评论
社区公告
  • 大数据领域最专业的产品&技术交流社区,专注于探讨与分享大数据领域有趣又火热的信息,专业又专注的数据人园地

最新活动更多
微信扫码获取数字化转型资料
钉钉扫码加入技术交流群