一种基于多维度的机器智能文本识别可信度判别方法技术

技术编号:26223394 阅读:15 留言:0更新日期:2020-11-04 10:55
本发明专利技术涉及人工智能、语义分析和知识校验技术领域,尤其为一种基于多维度的机器智能文本识别可信度判别方法,其具体步骤如下:步骤100:输入待识别的文本切片图像;本发通过提出的基于多维度的机器智能文本识别可信度判别方法,是自动判断机器智能识别是否正确的重要环节。机器智能文本识别在最后输出层会选择相对概率最大的结果作为识别结果返回,但相对概率最大是基于单一输入图像相关的,对于不同的输入图像,其返回的概率值不具有可比性,因此该概率值不能直接用作机器识别结果的可行度判别。本发明专利技术提出的多维度可信度判别方法对于不同的输入文本切片图像具有普适性,从而为机器智能文本识别结果是否可以相信提供了较一致的判别方法。

【技术实现步骤摘要】
一种基于多维度的机器智能文本识别可信度判别方法
本专利技术涉及人工智能、语义分析和知识校验
,具体为一种基于多维度的机器智能文本识别可信度判别方法。
技术介绍
近年来,随着数字成像设备的普及和深度学习算法的广泛应用,智能文本识别工具不断涌现,如汉王、合合、阿里云识别、腾讯云识别、百度云识别、华为云识别等,文本识别精度不断提升。但是,目前已有的文本识别工具,除了返回识别结果和坐标位置,很难对识别结果是否完全可信或是否需要人工再审核做出判别,在医疗票据理赔等需要极高准确率的应用场合,无法做到完全的人机分离就无法起到降本增效的作用,不能满足极高精度文本识别和结构化数据采集的应用需求。综上所述,本专利技术通过设计一种基于多维度的机器智能文本识别可信度判别方法来解决存在的问题。
技术实现思路
本专利技术的目的在于提供一种基于多维度的机器智能文本识别可信度判别方法,通过多引擎识别结果一致性、可识别信息完整度、上下文语义逻辑规则、字段内先验知识规则、关联字段知识校验规则等维度对机器识别结果进行全面评估,得到高度可靠的机器识别结果可信度,满足实际应用场合中高精度、高自动化率、预期结果可控的需求。为实现上述目的,本专利技术提供如下技术方案:一种基于多维度的机器智能文本识别可信度判别方法,其具体步骤如下:步骤100:输入待识别的文本切片图像;步骤200:从多个识别引擎中获取文本识别结果,并从多引擎识别结果一致性维度进行可信度判别;步骤300:提取文本图像的有效像素,并统计已识别像素和总体有效像素,从可识别信息完整度维度进行可信度判别;步骤400:从上下文语义维度进行可信度判别;步骤500:确定文本切片所处内容的先验知识,从先验知识规则维度进行可信度判别;步骤600:确定文本切片的关联内容,从关联知识规则维度进行可信度判别;步骤700:综合多维度,确定机器智能文本识别的最终可信度;步骤800:对于不同应用场合,采用不同的可信度阈值,得出完全采纳、存疑、或不采纳机器智能文本识别的判别结果。进一步的,所述步骤100获取待识别文本图像切片的方法为以下三种方法之一:方法1是用智能文本检测工具得到的文本框局部图像;方法2是采用交互式裁剪工具得到的文本框局部图像;方法3是读取一个预先存储的文本切片图像文件。进一步的,所述步骤200为从多引擎识别结果一致性维度进行可信度判别,具体包括如下步骤:步骤210,采用多个网络结构互异的深度学习神经网络模型(例如ResNet、DarkNet、Attraction等)训练得到的智能文本识别引擎,得到输入文本图像切片的文本识别结果(包括位置信息和文字信息)。进一步的,所述步骤300为从识别信息完整度维度进行可信度判别,具体包括如下步骤:步骤310:采用二值化、颜色分离等方法得到该输入文本切片图像的背景和前景信息;步骤320:在前景图上,过滤掉孤立点和噪声点,并统计前景信息总像素P1;步骤330:结合步骤210中已识别文字的位置信息,在前景图上统计已识别文字区域的总像素P2;步骤340:采用P2/P1得到已识别信息的完整度,并记为完整度维度分数S2。进一步的,所述步骤400是从上下文语义规则维度进行可信度判别,具体包括如下步骤:步骤410:采用中文语义理解模型,对识别结果进行分词、词性分析;步骤420:根据中文组词词频等上下文语义信息,得到每个分词的中文组合分数,综合输入文本图像切片文本内容的全部分词分数,得到该识别结果的上下文语义维度分数S3。进一步的,所述步骤500为从先验知识规则维度进行可信度判别,具体包括如下步骤:步骤510:从识别结果分析并确定文本切片的语义归属,如姓名、年龄、号码、医院名、药品名、手术名、金额等。如果能确定该文本切片的语义归属,则文本归属有效性参数V设定为1;如果无法确定,则V为0;步骤520:如果步骤510能确定文本切片的语义归属(即V=1的情况),则结合该归属字段所处内容的先验知识,得到该识别结果的内容先验维度分数S4。进一步的,所述步骤600是从关联知识规则维度进行可信度判别,具体包括如下步骤:步骤610:如果步骤510能确定文本切片的语义归属(即V=1的情况),则根据应用场景,确定该文本切片的语义关联切片(例如单价、数量和金额,入院时间、出院时间以及住院天数等关联信息);步骤620:结合该文本切片的语义归属和语义关联切片信息,根据关联信息校验规则(例如单价*数量=金额,出院时间-入院时间=住院天数等),得到该识别结果的关联校验维度分数S5。进一步的,所述步骤700是综合多维度可信度分数,确定该文本切片图像的机器识别可信度,具体包括如下步骤:步骤710:从大量的识别结果中,训练得出多维度综合的权重w1~w5;步骤720:采用步骤710中预训练的权重,加权平均得到最终的机器识别可信度分数:S=(w1*S1+w2*S2+w3*V*S3+w4*V*S4+w5*S5)/(w1+w2+w3*V+w4*V+w5)。进一步的,所述步骤800是根据应用需求,确定是否采纳机器识别结果,具体包括如下步骤:步骤810:从大量的识别结果中,分析得出S的不同取值对应的机器识别结果的通过率和正确率;步骤820:根据应用需求确定机器识别的通过率和正确率,在此基础上,得到可信度S的阈值ST;如果S>ST,则直接采纳机器的识别结果,无需进行人工校验,保证通过率和正确率达到要求;否则,不采纳机器的识别结果,需进行人工审核。与现有技术相比,本专利技术的有益效果是:1、本专利技术中,通过提出的基于多维度的机器智能文本识别可信度判别方法,是自动判断机器智能识别是否正确的重要环节。机器智能文本识别在最后输出层会选择相对概率最大的结果作为识别结果返回,但相对概率最大是基于单一输入图像相关的,对于不同的输入图像,其返回的概率值不具有可比性,因此该概率值不能直接用作机器识别结果的可行度判别。本专利技术提出的多维度可信度判别方法对于不同的输入文本切片图像具有普适性,从而为机器智能文本识别结果是否可以相信提供了较一致的判别方法。2、本专利技术中,通过提出的基于多维度的机器智能文本识别可信度判别方法,是在极高精度智能文本识别领域进行人机正确分离、降本增效、优化人力资源配置的关键环节。3、本专利技术中,通过提出的基于多维度的机器智能文本识别可信度判别方法,是在保险票据理赔领域进行机器快速理赔、自动核赔、24小时作业、高并发作业的重要技术支撑。附图说明图1为一种基于多维度的机器智能文本识别可信度判别方法的总体流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术人员本文档来自技高网...

【技术保护点】
1.一种基于多维度的机器智能文本识别可信度判别方法,其具体步骤如下:/n步骤100:输入待识别的文本切片图像;/n步骤200:从多个识别引擎中获取文本识别结果,并从多引擎识别结果一致性维度进行可信度判别;/n步骤300:提取文本图像的有效像素,并统计已识别像素和总体有效像素,从可识别信息完整度维度进行可信度判别;/n步骤400:从上下文语义维度进行可信度判别;/n步骤500:确定文本切片所处内容的先验知识,从先验知识规则维度进行可信度判别;/n步骤600:确定文本切片的关联内容,从关联知识规则维度进行可信度判别;/n步骤700:综合多维度,确定机器智能文本识别的最终可信度;/n步骤800:对于不同应用场合,采用不同的可信度阈值,得出完全采纳、存疑、或不采纳机器智能文本识别的判别结果。/n

【技术特征摘要】
1.一种基于多维度的机器智能文本识别可信度判别方法,其具体步骤如下:
步骤100:输入待识别的文本切片图像;
步骤200:从多个识别引擎中获取文本识别结果,并从多引擎识别结果一致性维度进行可信度判别;
步骤300:提取文本图像的有效像素,并统计已识别像素和总体有效像素,从可识别信息完整度维度进行可信度判别;
步骤400:从上下文语义维度进行可信度判别;
步骤500:确定文本切片所处内容的先验知识,从先验知识规则维度进行可信度判别;
步骤600:确定文本切片的关联内容,从关联知识规则维度进行可信度判别;
步骤700:综合多维度,确定机器智能文本识别的最终可信度;
步骤800:对于不同应用场合,采用不同的可信度阈值,得出完全采纳、存疑、或不采纳机器智能文本识别的判别结果。


2.根据权利要求1所述的一种基于多维度的机器智能文本识别可信度判别方法,其特征在于:所述步骤100获取待识别文本图像切片的方法为以下三种方法之一:
方法1是用智能文本检测工具得到的文本框局部图像;
方法2是采用交互式裁剪工具得到的文本框局部图像;
方法3是读取一个预先存储的文本切片图像文件。


3.根据权利要求1所述的一种基于多维度的机器智能文本识别可信度判别方法,其特征在于:所述步骤200为从多引擎识别结果一致性维度进行可信度判别,具体包括如下步骤:
步骤210,采用多个网络结构互异的深度学习神经网络模型(例如ResNet、DarkNet、Attraction等)训练得到的智能文本识别引擎,得到输入文本图像切片的文本识别结果(包括位置信息和文字信息)。


4.根据权利要求1所述的一种基于多维度的机器智能文本识别可信度判别方法,其特征在于:所述步骤300为从识别信息完整度维度进行可信度判别,具体包括如下步骤:
步骤310:采用二值化、颜色分离等方法得到该输入文本切片图像的背景和前景信息;
步骤320:在前景图上,过滤掉孤立点和噪声点,并统计前景信息总像素P1;
步骤330:结合步骤210中已识别文字的位置信息,在前景图上统计已识别文字区域的总像素P2;
步骤340:采用P2/P1得到已识别信息的完整度,并记为完整度维度分数S2。


5.根据权利要求1所述的一种基于多维度的机器智能文本识别可信度判别方法,其特征在于:所述步骤400是从上下文语义规则维度进行可信度判别,具体包括如下步骤:
步骤410:采用中文语义理解模型,对识别结果进行分词、词性分析;...

【专利技术属性】
技术研发人员:张成栋严京旗卞志强
申请(专利权)人:晶璞上海人工智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1