深源恒际医疗收据OCR落地九省市 服务范围掩盖过半商场

近年来,我国健康险商场规模继续坚持高增加。银保监会最新统计数据显现,2019年我国健康险事务原稳妥保费收入6564亿元,同比增加29.75%。一起,跟着民众危险保证认识的不断提高,未来健康险仍有巨大的潜在增加空间。据天风证券研报猜测,未来五年内健康险复合增速将坚持在20%左右。

与商场规模呈正相关,健康险理赔案子数也在逐年走高。据了解,自2015年起,健康险理赔案子数量和赔付金额正以年均20%的速度增加。因而,怎么提高服务功率、优化服务体会,成为稳妥组织增强商场竞争力的重要抓手。

稳妥科技公司深源恒际从健康险核赔理算事务场景下手,研发了医疗收据OCR产品,根据深度学习算法下的专项模型练习,主动辨认、提取医疗收据上的中心理算信息,并将结构化的信息录入理算体系,旨在经过计算机视觉代替人力作业,大幅下降人力投入、缩短事务耗时,协助健康险提高理赔服务功率、优化理赔服务体会。

到现在,该产品已先后在北京、天津、上海、广东、浙江、江苏、山东、河南及河北九省市完结落地,预估服务规模掩盖健康险过半商场。

01
切中要害 直击痛点

出于职业监管要素,现在商业医保组织无法直接获取或即时同享到投保用户的医疗信息。在触及健康险理赔时,理算人员需要从用户提交的医疗单据上获取原始的理算数据,并将相关信息逐项录入体系,一般单个案子触及录入的信息多达百余项。而人工录入的作业方法不行经济,一方面人作业业不免呈现讹夺,影响理算准确性,简单构成理赔渗漏,另一方面装备很多人力资源从事高度重复的事务性作业,耗时吃力、功率低下。

深源恒际根据OCR辨认技能,开发了集辨认、提取、结构化功用于一体的信息辨认录入主动化处理方案。在健康险核赔理算中,主动从各类医疗收据图画中辨认、提取出理算所需的字段信息,并同步完结结构化录入,大幅缩短信息处理耗时,削减多半以上人力投入,使理赔功率全体提高60%-80%。一起,医疗收据OCR的使用,有助于健康险组织优化人力资源装备,根据流程主动化而开释的劳动力可参加从事对脑力依靠更强的作业。

现在,支撑辨认录入的收据类型包括门诊发票、住院发票、医保结算单、费用清单,字符辨认准确率超越98%。

02
对症下药 攻破难点

事实上,医疗收据OCR在实践落地使用中面临许多技能难点,如票面信息含糊、发票折叠畸变、内容堆叠、信息串行等,均会对辨认准确率构成搅扰,给算法模型练习带来相应应战。为下降、消弭噪音,深源恒际结合多种图画处理技能,在不危害文字信息的前提下扫除搅扰要素,让辨认模型具有很好的抗搅扰才能和鲁棒性。

深源恒际医疗收据OCR落地九省市 服务范围掩盖过半商场

首要,医疗收据在全国规模内没有一致的制版格局,各地版式差异显着。面临此类景象,通用OCR算法难以打破模版多样化的问题。深源恒际针对各地模版进行独立强化练习,在模型练习中增强特征提取细粒度,根据不同模版上的启发性信息辅佐文字区域的定位和切分,弱化版式差异带来的不良影响。现在,已有包括北京、天津、上海、广东、浙江、江苏、山东、河南及河北九省市在内的收据模版完结针对性强化练习并发布上线。

其次,医疗收据多选用数据与格局别离的套打方法,在OCR辨认中一般会带来两方面困扰:一是套打发票大多选用针式打印技能,图画分辨率低、打印笔迹含糊,影响辨认准确率;二是不免呈现机打信息和印刷信息串行或内容堆叠的景象,串行增加了信息提取难度,影响数据结构化;内容堆叠构成部分信息被遮挡,在文本检测时简单导致漏检,在文本辨认时简单导致误识。

深源恒际根据深度学习算法,经过图层别离技能处理了打破性地处理了套打收据辨认中存在的技能难题,使辨认准确率大幅提高。

图层别离:经过很多剖析样本数据,提取机打部分与印刷部分的差异化特征,强化特征提取细粒度,根据深度学习方法建立像素级图层别离模型,完结从原始图画中别离出机打信息与印刷信息,经过图层别离完结信息剥离。

坐标定位:图层别离后,根据图画辨认技能获取一切文本条目的坐标信息,经过传统匹配算法完结印刷类文本条目坐标信息与机打类文本条目坐标信息的相关,完结印刷字段信息与机打字段信息的匹配,然后处理信息串行带来的搅扰。

双辨认模型:针对机打和印刷两类文本信息别离练习算法模型,大幅提高图层别离准确度,下降信息堆叠带来的搅扰。

再次,为保证理算信息完好无误,深源恒际提出“机器校验为主、人工复核为辅”的校验机制,开发了多重校验规矩引擎。根据字段间的内涵逻辑与相关联系,主动鉴别置信度较低的字段信息,对存疑的高危险信息进行预警提示,并根据内涵逻辑对或许犯错的数据进行启发式纠正;关于含糊文字,则经过医疗词典库进行智能校验。归纳多种方法辅佐复核,快速完结数据的校验与纠正,为理算供给完好、准确的数据根据。

此外,医疗收据OCR服务与健康险理算中常用的智能理算规矩引擎相衔接,可完结从信息录入到成果输出全面主动化,让健康险理赔真实驶入快车道。

未来,深源恒际将继续迭代算法模型,进一步扩展产品落地规模,在不间断的落地使用中优化产品功能,将技能创新优势延展到职业全流程中,打造全栈式智能服务。