公开了一种用于使用图像识别字符的方法和装置。根据字符识别请求激活照相机,以及设置预览模式以实时地显示通过照相机拍摄的一个或多个图像。控制照相机的自动聚焦,以及从预览模式下获得的图像中获得具有预定水平的清晰度的用于字符识别的图像。字符识别处理所述用于字符识别的图像以便提取识别结果数据。从识别结果数据中提取出排除了非字符数据的最终的识别字符行。组合第一字使其包括最终的识别字符行的至少一个字符和预定最大数目的字符。并且使用第一字搜索存储关于各种语言的字典信息的字典数据库,以便为用户提供相应的字。
【技术实现步骤摘要】
本专利技术一般涉及用于识别字符的方法和装置,更具体地,涉及用于使用 照相机识别字符的方法和装置。
技术介绍
随着电子技术的发展,诸如移动通信终端、个人数字助理(PDA)和便 携式游戏设备的便携式终端除了它们的一两个专有功能之外,还已经合并有 各种功能。例如,除通信功能需要的设备之外,移动通信终端也可以包括数 字照相机或音乐文件再现设备,以便为用户提供照相功能或音乐再现功能。 此外,这样增加的设备与其它应用相连接,以便提供各种功能。例如,包括 照相机的便携式终端在与字符识别应用连接时,还可以使用静止图像提供字 符识别的功能。一般说来,包括照相机的便携式终端产生和存储用于字符识别的静止图 像,然后字符识别应用读取存储的静止图像以便执行字符识别。识别的结果 可以被用于另一个应用。具体地说,字符识别可以用来省去复杂的处理,诸 如用户的字符4建输入。字符识别还可以用来输入那些不能通过包括在使j夷式 终端中的键输入的字符,或者用来输入用户不知道的字符。但是,传统字符识别方法不能实时地快速地识别连续字,因为用户按下 快门来获取字符的图片,由拍摄的结果获得静止图像,然后执行字符识别处 理。在这点上,如果存在许多要被识别的字符,则需要一种高效快速地执行 字符识别并且提供识别结果的方法。
技术实现思路
做出本专利技术以解决至少上述问题和/或缺点并且提供至少下述优点。因 此,本专利技术的一方面提供一种用于识别字符的方法和装置,当用户使用照相 机识别字符时,该方法和装置实时地快速地识别多个字符并且为用户提供识 别的结果。根据本专利技术的 一方面,提供了 一种在字符识别装置中识别字符的方法。 根据字符识别请求激活照相机,以及设置预览模式以实时地显示通过照相机 拍摄的一个或多个图像。控制照相机的自动聚焦,以及从预览模式下获得的 图像中获得具有预定水平的清晰度的图像作为用于字符识别的图像。对用于 字符识别的图像进行字符识别处理以便提取识别结果数据。从识别结果数据 中提取出排除了非字符数据的最终的识别字符行。用于识别字符的方法还可以包括根据字符识别请求激活照相机并且设 置预览模式,该预览模式实时地显示通过照相机拍摄的一个或多个图像;从 用于字符识别的图像中检测字符;以及如果没有字符存在,则获得通过预览 模式首先显示的预览图像,或者如果存在字符,则检测由用户引起的字符识 别装置的运动是否存在。用于识别字符的方法还可以包括如果字符识别装置的运动存在,则获 得通过预览模式首先显示的预览图像;以及如果没有运动存在,则控制照相 机的自动聚焦,并且从预览模式下获得的图像中获得具有预定水平的清晰度 的图像作为用于字符识别的图像。用于识别字符的方法还可以包括组合包括最终的识别字符行的字符和 预定的最大数目的字符的第一字,并且使用第一字搜索存储关于各种语言的 字典信息的字典数据库,以便为用户提供相应的字。附图说明通过下面结合附图的详细描述,本专利技术的上述方面、特征和优点将更加 明显,其中图1是示出根据本专利技术的实施例的字符识别装置的结构的图2是示出根据本专利技术的实施例的字符识别装置的操作方法的流程图3是示出根据本专利技术的实施例的控制字符识别装 的自动聚焦功能的过程的流程图4是示出根据本专利技术的实施例的字典搜索过程的图5是示出才艮据本专利技术的另 一个实施例的字典搜索过程的图6是示出根据本专利技术的另 一个实施例的字符识别装置的操作过程的流程图;图8是示出根据本专利技术的实施例的确定运动的存在的过程的流程图; 图。 、、、、 -、 具体实施例方式下面参考附图详细描述本专利技术的优选实施例。虽然它们在不同的附图已知的结构或处理的详细描述可以被省略以避免混淆本专利技术的主题。参考图l描述本专利技术的字符识别装置的结构。根据本专利技术的字符识别装 置可以被安装在诸如移动通信终端或便携式媒体播放机(PMP)的便携式终 端上。如图1所示,字符识别装置包括识别控制单元10、照相4几20、存储 器30、字典数据库40、显示单元60和^:输入单元50。照相机20根据识别控制单元10的控制,使用固态图像捕获设备等将通 过物镜和取景器接收的对象的模拟图像转换成数字信息,以便将转换后的信 息存储在存储器30中。显示单元60在识别控制单元10的控制下,将存储在存储器30中的各 种图像和数据信息显示在屏幕上。当照相机功能被激活时,操作照相机20 以便执行预览模式,该预览模式实时地将通过镜头捕获的图像显示在显示单 元60的屏幕上。当在期望的对象被显示在显示单元60的液晶显示器(LCD) 上的状态下用户按下照相按钮时,图像通过照相机20的镜头被捕获,以及 捕获的图像被压缩,以存储在存储器30中。此外,显示单元60显示字符识 别结果、字符识别状态等等。键输入单元50包括数字键、方向键或对应于字符识别装置的各种功能 的功能键,并且为识别控制单元IO提供与用户按下的键对应的键输入数据。字典数据库40存储对应于各种语言的字典信息。存储器30存储用于处理并控制识别控制单元10的程序、参考数据、各 种可更新的数据存储器数据等等,其被提供给识别控制单元10的工作存储 器。此外,存储器30存储由照相机20产生的图像数据。识别控制单元10控制字符识别装置的各种操作,处理数据,根据本发 明识别字符,使用识别的字符搜索字典数据库40,以及为用户提供搜索结果。参考图2描述识别控制单元10的操作。图2示出了根据本专利技术的实施例的识别控制单元10的操作。参考图2,如果用户请求字符识别,则识别控制单元IO在步骤101激活 照相机20,设置预览模式,以及实时地将通过照相机20拍摄的图像显示在 显示单元60上。识别控制单元IO在屏幕上指示输入起始点。输入起始点有 助于提高字符识别率并且表示用于识别的字符在屏幕上的位置。当预览模式 被设置并且图像被显示在显示单元60上时,用户将照相机20的镜头对准字 符。用户可以调整照相机20的位置以使得字符在输入起始点上。在上述过程中,照相才几20由用户移动以使得照相才几20和对象字符之间 的距离可能被改变,从而引起聚焦损失以及图像的模糊。模糊是指图像中的 对象的轮廓模糊的现象。在严重模糊的图像中是不可能识别出字符的,因此 必须获得具有一定水平的清晰图像。因此,在本专利技术中的识别控制单元10 在步骤103中控制自动聚焦,其实时地检测图像输入的模糊并且自动地调整 聚焦。自动聚焦的控制如图3所示。识别控制单元10在步骤201获得预览图 像并且在步骤203检测模糊。识别控制单元10在步骤205识别预览图像中 是否存在模糊,以及如果存在模糊,则在步骤209执行自动聚焦。但是,如 果不存在冲莫糊,则识别控制单元10在步骤207获得预览图像作为用于字符 识别的图像。在使用模糊检测方法中,如果当前图像的对象的轮廓不如预定的参考值 清晰,则识别控制单元10确定产生了模糊并且当前图像的焦距是不完全的 (incomplete )。识别控制单元10然后控制照相机20以便执行自动聚焦。如 果根据模糊检测结果,包括在当前图像中的对象的轮廓与预定的参考值一样 清晰或者比预定的参考值更清晰,即具有大于或等于参考值的值的清晰度, 则该图像被获得作为用于识别的图像。因为识别控制单元IO通过自动聚焦 控制有条件地执行自动聚焦,因此它可以快速地获得用于识别的图像。本文档来自技高网...
【技术保护点】
一种用于在字符识别装置中识别字符的方法,该方法包括步骤: 根据字符识别请求激活照相机,以及设置预览模式以实时地显示通过照相机拍摄的一个或多个图像; 控制照相机的自动聚焦,以及从预览模式下获得的一个或多个图像中获得具有预定水平的清 晰度的用于字符识别的图像; 对所述用于字符识别的图像进行字符识别处理以便提取识别结果数据;以及 从识别结果数据中提取出排除了非字符数据的最终的识别字符行。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:金玄水,黄星泽,吴尚昱,金尚镐,吴润济,郑熙远,金成喆,
申请(专利权)人:三星电子株式会社,
类型:发明
国别省市:KR[韩国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。