二代征信系统上线 深源恒际升级个人信用报告OCR识别服务

    1月17日,央行征信中心启动了二代征信系统切换上线工作;1月19日,开始面向社会公众和金融机构提供二代格式信用报告查询服务。深源恒际二代信用报告OCR识别升级工作也同步展开。

    据悉,去年4月,深源恒际面向信贷机构推出针对个人信用报告的OCR识别服务:基于OCR识别技术,结合专项训练和自适应提取方法,构建信用报告识别专用算法模型,自动识别、提取个人信用报告上的文本信息,并进行结构化输出,帮助信贷机构快速采录用户信用信息,为信贷决策提供有力支持。二代征信系统上线后,深源恒际启动相应技术服务的配套升级。

    随着国内市场经济的深入发展,各种经济活动的信用关系越来越复杂,建立和完善征信体系成为信用经济正常运转的必要条件。在我国,央行征信中心作为专门的第三方征信服务机构,为个人或企业建立“信用档案”(个人信用报告/企业信用报告),为商业银行及其他专业化授信机构提供信用信息共享,有效降低了交易过程各参与方之间的信息不对称,以及信息不对称带来的交易风险。

    其中,被称为“经济身份证”的个人信用报告,在个体信贷服务中扮演着重要角色。对信贷服务机构而言,基于个人信用报告了解用户既往的信用行为和资信状况,可以为贷前风险评估和放贷决策提供有力参考,进而有效防范信用风险、保障交易安全。

    在业务操作层面,信贷机构经用户授权后,可在央行征信中心查询、下载、打印用户的个人信用报告,随后将报告信息一一录入风控系统,以便风控模型分析、评估潜在的交易风险。然而,一份个人信用报告涵盖的信息量庞大,尤其征信系统优化升级后,信息内容更加丰富,依托人工录入耗时且费力,难免影响放贷审批效率,造成意向客户的流失;或者,为实现快速放款,人工处理信息时删繁就简,容易因疏漏导致风险评估失准。

    深源恒际团队基于OCR识别技术,推出个人信用报告自动识别与结构化提取解决方案,以自动化、智能化的方式帮助信贷审核人员快速录入用户信用信息,高效完成信用分析与评估。二代征信系统更新上线后,深源恒际团队迭代产品配套升级方案,将从模板更新图像降噪两方面着手优化算法模型。

    据了解,二代征信系统在信息采集、产品加工、技术架构和安全防护四个方面进行了优化改进。一是优化丰富信息内容,提升信息采集的扩展性、灵活性和便利性,更为全面、准确地反映信息主体信用状况。二是优化信用报告展示形式和生成机制,提升信用报告的易读性、适应性和便捷性。三是改进系统技术架构,支持系统快速扩展和资源优化,大幅提升信息采集和征信服务效率。四是强化系统安全防护能力,加强用户身份管理、信息传输管理等,确保征信信息安全。

    与一代征信系统提供的信用报告相比,二代征信系统提供的信用报告丰富了基本信息和信贷信息内容,改进了信息展示形式,提升了信息更新效率。针对上述变化,深源恒际团队从两方面着手对算法模型进行配套升级优化:一是基于二代信用报告格式,强化特征提取,更新识别模板,提升模型的识别稳定性;二是优化抗干扰能力,基于直线/表格线识别规则纠正文本畸变,结合启发式规则实现翻页文本合并,提高模型的识别准确率。

    目前,据测试数据,基于OCR录入一份个人信用报告用时大约在20s-30s之间;而人工完成相同作业量耗时不低于30min,相比之下,信息采录效率显著提升。

    由此可见,借力专业化的信用信息服务,信贷交易的信息收集成本大幅降低,业务处理效率明显提升,缩短交易时间的同时也拓宽了交易空间,这有助于信贷服务更便捷地触达用户,进而加快普惠金融发展进程。