ai+金融 实在智能通过中国信通院可信AI金融大模型标准符合性验证
2023年10月,中央金融工作会议于北京召开,会议提出要做好科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章,对数字金融高质量发展提出了新要求。随着人工智能技术的持续发展,大规模预训练模型(以下简称“大模型”)与金融领域日益交汇融合,进一步拓宽了金融行业数字化转型的广度和深度,拥有多元化布局和丰富的应用前景。然而,大模型在金融领域的应用实践面临着复杂的多维掣肘,亟需通过标准符合性验证等手段进行全面评价,推动产业高质量发展。
中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度重视金融大模型发展动态,依托中国人工智能产业发展联盟金融行业推进组,联合业内近50家单位共同编制了金融大模型标准。标准聚焦行业高质量发展,综合评估金融大模型的技术水平和企业应用成效,评价指标覆盖场景丰富度、能力支持度、应用成熟度三大能力域,在促进产业发展、提升技术影响力和服务规范等方面具有重要作用。
图 1 中国信通院金融大模型标准框架
2024年6月,浙江实在智能科技有限公司参与中国信通院组织的可信AI大模型标准符合性验证,其产品TARS大模型顺利通过金融大模型标准符合性验证,并最终获得当前最高评级4+级。此次验证,依据标准《面向行业的大规模预训练模型技术和应用评估方法 第1部分:金融大模型》开展,涉及3大能力域、8个能力子域、60余个能力项,多维度验证各家大模型在金融场景、场景性能和人效优化效果方面的场景丰富度,重点考察大模型在语言、语音、视觉、多模态任务等方面的能力支持度,全方位评估大模型在金融数据合规性、模型可控性、服务可靠性方面的应用成熟度。
【TARS大模型介绍】
实在智能是一家基于大模型和超自动化技术(Agent智能体/IPA/RPA),领跑人机协同时代的人工智能科技公司。2023年8月,实在智能正式发布推出自研大模型TARS。
TARS大模型是实在智能基于在自然语言处理(NLP)领域深厚的技术积累和落地经验,在千亿级高质量上进行了充分训练,经过Pre-train(预训练)、SFT(监督式微调)和RLHF(基于人类反馈的强化学习)三个阶段的完整复现,展现出在语义分析、流程理解和任务规划等方面的较强能力的大模型。
在商业化方面,TARS大模型具备效果可用、成本可控、定制化训练、私有化部署等独特优势。以TARS模型为底座,实在智能已推出国内首个AI Agent智能体应用“实在Agent”和业界首个“chat版”IDP(智能文档审阅)产品,广泛应用于金融、银行、能源、物流、交通、运营商、烟草、航空、零售等行业超过2000家头部企业。
图 2 TARS大模型平台
【评估介绍】
为树立产业发展风向标,提升技术方先行示范影响力,协助应用方选取适配产品,中国信通院将持续开展金融大模型标准符合性验证工作,评估覆盖场景丰富度、能力支持度、应用成熟度三大能力域,具体如下:
1)场景丰富度:关注大模型产品在金融领域的覆盖广度及应用效果,包括通用场景(营销、风控、客服等)、专用场景(银行、保险、证券、基金等)、场景性能和人效优化效果;
2)能力支持度:关注大模型在金融领域的多模态交互能力及先进水平,考察对语言、语音、视觉、多模态任务的覆盖度及效果;
3)应用成熟度:关注大模型在金融领域提供合规、可控、稳定服务的能力,包括数据合规性、模型可控性、服务可靠性三个维度。
图 3 可信AI大模型标准符合性验证清单
中国信通院金融大模型标准符合性验证工作持续进行中,欢迎各方单位参与。
评估联系人
张老师
陶老师