用于执行光学字符识别的装置和方法制造方法及图纸

技术编号:15397041 阅读:102 留言:0更新日期:2017-05-19 11:33
一种用于在光学字符识别过程中执行字符隔离的方法,所述方法包括:接收表示一个或多个字符列的图像数据;确定图像数据中每一列的黑色像素的数目;定义竖向分开阈值,该竖向分开阈值是列中黑色像素的最大数目;通过排除黑色像素数目低于竖向分开阈值的任何列,将列划分成不同的像素组和排除列组;识别表示图像数据中最左侧字符列的像素组;确定图像数据中有一个还是两个表示字符列的像素组;以及如果确定存在两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。

Apparatus and method for performing optical character recognition

A method for performing character isolation in optical character recognition process, the method comprises: receiving image data representing one or more character columns; determine the number of black pixels in each row of the image data; the definition of vertical separate threshold, the threshold is separated from the vertical maximum number of black pixels in the column; by excluding black pixel number below the threshold of any separate vertical column, will be divided into different groups of pixels and exclusion column group; identification of said pixel group left most character columns in the image data; the image data to determine one or two character pixels said group of columns; and if it is determined that there are two characters said the pixel group of columns, for the right character columns using a predetermined width value is used to identify the right hand boundary character columns.

【技术实现步骤摘要】
【国外来华专利技术】用于执行光学字符识别的装置和方法
本专利技术涉及一种用于执行光学字符识别(OCR)的装置和方法。该装置可以是用于附接到例如注射装置等医疗装置并且与医疗装置一起使用的辅助装置。
技术介绍
在医疗装置领域中,在需要非常高的精度的情况下不常使用OCR技术,例如以防止药物的误配给。因此,许多基于机械的装置也具有剂量标尺或读数,其必须人工读取并且人工记录剂量。这对于用户来说是耗时的,并且可能潜在地导致错误。此外,如果要以电子方式传送数据和/或以电子方式分析数据,则必须首先将数据人工输入到单独的电子装置中。此外,一些患者(例如视力差的患者)可能难以读取通常较小的机械读数。存在多种疾病需要通过注射药剂进行定期治疗。这种注射可以通过使用注射装置来进行,由医务人员或患者自己注射。作为一个示例,1型和2型糖尿病可以由患者自己通过注射胰岛素剂量来治疗,例如每天一次或多次。例如,预填充的一次性胰岛素笔可以用作注射装置。作为替代,可以使用可重复使用的笔。可重复使用的笔允许用新的药筒更换空药物筒。任一种笔可以带有一套一次性针,在每次使用之前更换。然后可以例如通过转动剂量旋钮并从胰岛素笔的剂量窗口或显示器观察实际剂量,在胰岛素笔处手动选择要注射的胰岛素剂量。然后通过将针插入适当的皮肤部分并按压胰岛素笔的注射按钮来注射剂量。为了能够监视胰岛素注射,例如以防止对胰岛素笔的错误操作或者保持跟踪已经应用的剂量,期望测量与注射装置的状况和/或使用相关的信息,例如关于所注射的胰岛素类型和剂量的信息。
技术实现思路
本专利技术的第一方面提供了一种在光学字符识别过程中执行字符隔离的方法,所述方法包括:接收表示一个以上字符列的图像数据;确定所述图像数据的每一列中的黑色像素的数目;定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;通过排除黑色像素数目低于所述竖向分开阈值的任何列,将这些列划分为不同的像素组和排除列组;识别表示所述图像数据中最左侧字符列的像素组;确定所述图像数据中有一个还是两个表示字符列的像素组;以及如果确定有两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。此方法允许最右侧字符列中的字符被正确地分割和隔离,即使它们与右手边距/框线区域合并。对图像数据中的字符的正确分割和隔离允许执行准确且可靠的OCR过程,这对于在医疗应用中使用OCR技术特别重要。识别图像数据中表示最左侧字符列的像素组可以包括识别紧邻最左侧排除列组右边的像素组。识别图像数据中表示最左侧字符列的像素组可以包括:如果紧邻最左侧排除列组右边的像素组小于最小数字宽度阈值,则排除该像素组,因而将在最左侧排除列组右边的第二像素组定义为图像数据中的最左侧字符列。该过程考虑(并且忽略)了在可以使用字符隔离方法的许多装置中印制在“0”和“2”之间较小的“1”。确定图像数据中有一个还是两个表示字符列的像素组,可以包括确定最左侧排除列组的宽度。最左侧排除列组表示最左数字组左边的空白空间。该区域的宽度取决于可见数码是否各自包括一个或两个数字。如果确定最左侧排除列组的宽度小于最大左边距阈值,则该方法还可以包括确定在图像数据中有两个表示字符列的像素组。该方法还可以包括确定图像数据中最左侧字符列的宽度。该方法还可以包括使用所确定的图像数据中最左侧字符列的宽度,来确定最左侧字符列是仅包括窄的数码还是仅包括宽的数码。如果确定最左侧字符列仅包括窄的数码,则该方法还可以包括将最大有效剂量结果设置为“19”。由于数吗“1”在宽度上与每一个其他数码明显不同,因此对于随后的OCR过程的精度来说,识别最左数字是否为“1”是重要的。该方法还可以包括排除接触图像左手边缘的任何像素组。在一些情况下,可能存在应当被识别为不表示字符数据并且应被排除的左手边框区域。该方法还可以包括通过识别位于左手字符列和右手字符列之间的排除列组,来识别右手字符列的左手边界。该过程识别一个两位数中的数字之间的间隙。OCR算法可以要求每个数字被隔离以便被正确地识别。该方法还可以包括确定左手字符列是否比最大数字宽度阈值宽,如果是,则确定图像数据中的数码在8到10的范围内。这种情况可能发生在数码“8”能够在数码“10”之上或之下在图像数据中看见。在这种情况下,很难将字符分开成列。然而,通过将潜在有效结果限制为“8”、“9”或“10”,仍然可以返回精确的结果。本专利技术的第二方面提供了一种用于在光学字符识别过程中执行字符隔离的处理器,所述处理器配置为:接收表示一个以上字符列的图像数据;确定所述图像数据的每一列中的黑色像素的数目;定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;通过排除黑色像素数目低于竖向分开阈值的任何列,将列划分为不同的像素组和排除列组;识别所述图像数据中表示最左侧字符列的像素组;确定所述图像数据中有一个还是两个表示字符列的像素组;以及如果确定有两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。处理器可以被配置为通过识别紧邻最左侧排除列组右边的像素组来识别表示图像数据中最左侧字符列的像素组。处理器可以被配置为通过确定最左侧排除列组的宽度来确定图像数据中有一个还是两个表示字符列的像素组。本专利技术的第三方面提供了一种用于附接到注射装置的辅助装置,所述辅助装置包括:成像组件,所述成像组件被配置为捕获存在于所述注射装置的可移动部件上的一个以上数的图像;以及根据本专利技术第二方面的处理器。附图说明附图示出:图1a:药物输送装置的分解图;图1b示出了图1a药物输送装置的一些细节的透视图;图2a:根据本专利技术一个方面的可释放地附接到图1a和1b药物输送装置的传感器装置的示意图;图2b:根据本专利技术多个方面的可释放地附接到图1a和1b药物输送装置的传感器装置的透视图;图2c:根据本专利技术其他方面的可释放地附接到图1a和1b药物输送装置的传感器装置的透视图;图3:附接到药物输送装置的传感器装置的示意图,示出了传感器装置的部件;图4:二值化之后的剂量窗口一个图像的示例;图5:示出对图4图像进行竖向投影的结果图;图6:示出对来自图4图像数据施用模糊函数的结果图;图7:将各种阈值应用于图4图像数据的结果;图8:剂量窗口一个图像二值化之后的示例,示出较小的“1”用于指示单个单位的药剂;图9:示出根据本专利技术诸方面的处理器示例性操作的流程图。具体实施方式在下文中,将参照胰岛素注射装置来描述本专利技术的实施例。然而,本专利技术不限于这种应用,并且同样可以被很好地与注射其他药物的注射装置,或者与其他类型的医疗装置(诸如注射筒、无针注射器和吸入器)一起部署。图1a是注射装置1的分解图,注射装置1可以例如代表Sanofi'sSolostar(R)胰岛素注射笔。图1a的注射装置1是预填充的一次性注射笔,其包括壳体10并且包含胰岛素容器14,针15可以固定到胰岛素容器14。针由内部针帽16和外部针帽17保护,外部针帽17又可以被帽18覆盖。从注射装置1注射的胰岛素剂量可以通过转动剂量旋钮12来选择,然后通过剂量窗口13显示所选剂量,例如以所谓的国际单位(IU)的倍数显示所选剂量,其中一个IU是约45.5微克纯结晶胰岛素(1/22mg)的生物学等价物。在剂量窗口13中显示的选定剂量的一个示例可以例如是本文档来自技高网...
用于执行光学字符识别的装置和方法

【技术保护点】
一种用于在光学字符识别过程中执行字符隔离的方法,所述方法包括:接收表示一个以上字符列的图像数据;确定所述图像数据中每一列的黑色像素的数目;定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;通过将黑色像素数目低于所述竖向分开阈值的任何列排除,将列划分为不同的像素组和排除列组;识别所述图像数据中表示最左侧字符列的像素组;确定所述图像数据中有一个还是两个表示字符列的像素组;以及如果确定有两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。

【技术特征摘要】
【国外来华专利技术】2014.07.10 EP 14176482.91.一种用于在光学字符识别过程中执行字符隔离的方法,所述方法包括:接收表示一个以上字符列的图像数据;确定所述图像数据中每一列的黑色像素的数目;定义竖向分开阈值,所述竖向分开阈值是列中黑色像素的最大数目;通过将黑色像素数目低于所述竖向分开阈值的任何列排除,将列划分为不同的像素组和排除列组;识别所述图像数据中表示最左侧字符列的像素组;确定所述图像数据中有一个还是两个表示字符列的像素组;以及如果确定有两个表示字符列的像素组,则针对最右侧字符列使用预定宽度值,用以识别最右侧字符列的右手边界。2.根据权利要求1所述的方法,其中,识别所述图像数据中表示最左侧字符列的像素组包括:识别紧邻最左侧排除列组右边的像素组。3.根据权利要求1所述的方法,其中,识别所述图像数据中表示最左侧字符列的像素组包括:如果紧邻最左侧排除列组右边的像素组低于最小数字宽度阈值,则排除所述紧邻最左侧排除列组右边的像素组,因而将最左侧排除列组右边的第二像素组定义为所述图像数据中的最左侧字符列。4.根据权利要求1至3中任一项所述的方法,其中,确定所述图像数据中有一个还是两个表示字符列的像素组包括:确定最左侧排除列组的宽度。5.根据权利要求4所述的方法,其中,如果确定最左侧排除列组的宽度低于最大左边距阈值,则确定在所述图像数据中有两个表示字符列的像素组。6.根据前述权利要求中任一项所述的方法,所述方法还包括确定所述图像数据中的最左侧字符列的宽度。7.根据权利要求6所述的方法,所述方法还包括使用所确定的所述图像数据中的最左侧字符列的宽度,确定最左侧字符列仅包括窄的数码还是仅包括宽的数码。8.根据...

【专利技术属性】
技术研发人员:D·哈门
申请(专利权)人:赛诺菲安万特德国有限公司
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1