信息处理装置、信息处理方法和计算机可读介质制造方法及图纸

技术编号:33879774 阅读:12 留言:0更新日期:2022-06-22 17:09
提供信息处理装置、信息处理方法和计算机可读介质。信息处理装置具有处理器,所述处理器受理形成有用于记入信息的记入栏的纸张的图像,所述处理器以可供用户选择的方式提示如下3种方法来作为表示所述记入栏中应该记入的信息的属性的定义信息的生成方法,该3种方法包括:由所述用户新生成的方法、沿用在事先准备的其他纸张中生成的所述定义信息的方法、以及使用通过人工智能对受理的所述纸张进行分类而得到的结果来生成的方法。类而得到的结果来生成的方法。类而得到的结果来生成的方法。

【技术实现步骤摘要】
信息处理装置、信息处理方法和计算机可读介质


[0001]本专利技术涉及信息处理装置、信息处理方法和计算机可读介质。

技术介绍

[0002]在日本特开2015

184815号公报中公开了一种表单定义生成装置,该表单定义生成装置生成字符识别用表单的格式定义,至少具有存储部和控制部。其特征在于,在该存储部中,具有存储沿用源表单的格式定义的格式定义存储单元、以及存储由图像读取装置读取的沿用目的地表单的图像的图像存储单元。此外,其特征在于,在控制部中,具有在沿用目的地表单的图像上搜索基于沿用源表单的格式定义的各个读取项目的项目位置搜索单元、以及根据项目位置搜索单元的搜索结果使沿用源表单的读取项目移动的项目对应单元。
[0003]在日本特开2005

173730号公报中公开了一种表单OCR程序,该表单OCR程序使计算机执行表单OCR处理,在该表单OCR处理中,从读取表单而得到的表单图像中识别排列于所述表单中的记入栏内的字符。在该表单中,关于多个项目排列了其记入栏和预先打印的项目名,所述记入栏和项目名分别由格线划分。此外,该表单OCR程序的特征在于,其由整面OCR处理步骤和局部OCR处理步骤构成。在整面OCR处理步骤中,针对所述表单图像的整个面执行OCR处理,识别划分所述记入栏的记入框的位置、包围所述项目名的项目名框的位置和这些框内的字符串。此外,在局部OCR处理步骤中,根据所述整面OCR处理步骤的结果信息,执行确定应该再次进行OCR处理的记入栏的记入栏确定处理步骤,针对所确定的记入栏局部执行OCR处理。
[0004]在日本特开2019

159932号公报中公开了一种信息处理装置,该信息处理装置具有:提取单元,其从形成有应该记入信息的记入栏的纸张的图像中提取与所述记入栏对应的作为记入框的矩形部分;以及显示控制单元,其使显示单元显示所述提取单元的提取结果。该信息处理装置具有:图像编辑单元,其在显示提取结果后,按照用户的指示,对所述图像进行用于将作为记入框的矩形部分提取出来的编辑;以及再次提取单元,其从反映了所述编辑的所述图像中再次提取作为记入框的矩形部分。此外,该信息处理装置具有输出单元,该输出单元输出用于提取记入栏中记入的信息的定义信息,该输出单元输出定义信息,该定义信息表示由再次提取单元提取出的记入框和记入栏中应该记入的信息的属性的对应关系。
[0005]为了从形成有用于记入信息的记入栏的纸张的图像中提取在记入栏中记入的信息,需要预先生成表示该记入栏中应该记入的信息的属性的定义信息。作为定义信息的生成方法,存在用户新生成的方法、沿用在事先准备的其他纸张中生成的定义信息的方法、以及使用通过人工智能对受理的纸张进行分类而得到的结果来生成的方法这3种方法。但是,在现有的系统中,仅应用上述3种生成方法中的任意一种,存在用户无法选择这些生成方法这样的问题。

技术实现思路

[0006]本专利技术的目的在于,使得用户能够选择定义信息的生成方法。
[0007]根据本专利技术的第1方案,提供一种信息处理装置,其具有处理器,所述处理器受理形成有用于记入信息的记入栏的纸张的图像,所述处理器以可供用户选择的方式提示如下3种方法来作为表示所述记入栏中应该记入的信息的属性的定义信息的生成方法,该3种方法包括:由所述用户新生成的方法、沿用在事先准备的其他纸张中生成的所述定义信息的方法、以及使用通过人工智能对受理的所述纸张进行分类而得到的结果来生成的方法。
[0008]根据本专利技术的第2方案,所述处理器还提示所述3种方法中的最推荐的生成方法和按照这3种方法中的每种方法规定的参考信息中的至少一方。
[0009]根据本专利技术的第3方案,所述最推荐的生成方法是使用受理的所述纸张的特征量与所述其他纸张的特征量之间的相似度导出的生成方法。
[0010]根据本专利技术的第4方案,所述处理器在所述相似度为预定的阈值以上的情况下,提示所述沿用的方法作为所述最推荐的生成方法。
[0011]根据本专利技术的第5方案,所述处理器在所述相似度小于预定的阈值的情况下,提示所述新生成的方法和使用通过所述人工智能进行分类而得到的结果来生成的方法中的、所述定义信息的生成时间短的方法,作为所述最推荐的生成方法。
[0012]根据本专利技术的第6方案,所述新生成的方法中的所述参考信息是表示利用该方法生成所述定义信息的情况下的生成时间的信息。
[0013]根据本专利技术的第7方案,所述沿用的方法中的所述参考信息是表示与受理的所述纸张的特征量之间相似度最高的所述其他纸张的信息。
[0014]根据本专利技术的第8方案,使用通过所述人工智能进行分类而得到的结果来生成的方法中的所述参考信息是表示通过人工智能对受理的所述纸张进行分类而得到的结果的信息。
[0015]根据本专利技术的第9方案,所述处理器还提示针对所述每个记入栏组合所述3种方法来生成所述定义信息的方法。
[0016]根据本专利技术的第10方案,提供一种计算机可读介质,其存储有使计算机执行处理的程序,其中,在所述处理中,受理形成有用于记入信息的记入栏的纸张的图像,所述处理器以可供用户选择的方式提示如下3种方法来作为表示所述记入栏中应该记入的信息的属性的定义信息的生成方法,该3种方法包括:由所述用户新生成的方法、沿用在事先准备的其他纸张中生成的所述定义信息的方法、以及使用通过人工智能对受理的所述纸张进行分类而得到的结果来生成的方法。
[0017]根据本专利技术的第11方案,提供一种信息处理方法,其中,受理形成有用于记入信息的记入栏的纸张的图像,所述处理器以可供用户选择的方式提示如下3种方法来作为表示所述记入栏中应该记入的信息的属性的定义信息的生成方法,该3种方法包括:由所述用户新生成的方法、沿用在事先准备的其他纸张中生成的所述定义信息的方法、以及使用通过人工智能对受理的所述纸张进行分类而得到的结果来生成的方法。
[0018](效果)
[0019]根据所述第1、10、11的各方案,用户能够选择定义信息的生成方法。
[0020]根据所述第2方案,能够在视觉上明示最推荐的生成方法和按照被提示的3种生成
方法中的每种方法规定的参考信息中的至少一方。
[0021]根据所述第3方案,能够使用与事先准备的其他纸张之间的相似度导出最推荐的生成方法。
[0022]根据所述第4方案,在相似度为预定的阈值以上的情况下,能够在视觉上明示将沿用事先准备的其他纸张的定义信息的方法作为最推荐的生成方法。
[0023]根据所述第5方案,能够在视觉上明示将新生成的方法和使用通过人工智能进行分类而得到的结果来生成的方法中的、定义信息的生成时间短的方法作为最推荐的生成方法。
[0024]根据所述第6方案,能够在视觉上明示新生成了定义信息的情况下的生成时间。
[0025]根据所述第7方案,能够在视觉上明示表示事先准备的其他纸张中的相似度最高的纸张的信息。
[0026]根据所述第8方案,能够在视觉上明示通本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理装置,其具有处理器,所述处理器受理形成有用于记入信息的记入栏的纸张的图像,所述处理器以可供用户选择的方式提示如下3种方法来作为表示所述记入栏中应该记入的信息的属性的定义信息的生成方法,该3种方法包括:由所述用户新生成的方法、沿用在事先准备的其他纸张中生成的所述定义信息的方法、以及使用通过人工智能对受理的所述纸张进行分类而得到的结果来生成的方法。2.根据权利要求1所述的信息处理装置,其中,所述处理器还提示所述3种方法中的最推荐的生成方法和按照这3种方法中的每种方法规定的参考信息中的至少一方。3.根据权利要求2所述的信息处理装置,其中,所述最推荐的生成方法是使用受理的所述纸张的特征量与所述其他纸张的特征量之间的相似度导出的生成方法。4.根据权利要求3所述的信息处理装置,其中,所述处理器在所述相似度为预定的阈值以上的情况下,提示所述沿用的方法作为所述最推荐的生成方法。5.根据权利要求3或4所述的信息处理装置,其中,所述处理器在所述相似度小于预定的阈值的情况下,提示所述新生成的方法和使用通过所述人工智能进行分类而得到的结果来生成的方法中的、所述定义信息的生成时间短的方法,作为所述最推荐的生成方法。6.根据权利要求2~5中的任意一项所述的信息处理装置,其中,所述新生成的方法中的所述参考信息是表示利用该方法生成所述定义信息的情况下的生成时间的信息。7.根据权利要求2~6中的任意...

【专利技术属性】
技术研发人员:西冈晋太郎
申请(专利权)人:富士胶片商业创新有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1