【技术实现步骤摘要】
本申请享受2013年9月6日在先提出的日本国专利申请第2013 — 185634号的优先权的利益,并且包括在先申请的全部内容。
实施方式涉及使用知识词典进行字符串的修正的知识处理装置、方法以及程序。
技术介绍
例如,作为用于对通过OCR (Optical Character Recognit1n/Reader:光学字符识别)等而字符识别出的字符串进行修正而使其接近正确答案的技术,已知有知识处理。知识处理为,将作为修正的对象的字符串(以下,称为修正对象字符串)与预先准备的知识词典(单词词典)对照,根据需要用储存于知识词典的字符串(单词)置换修正对象字符串,从而进行对修正对象字符串的修正。例如,如果修正对象字符串是表示姓名的姓的字符串,则将修正对象字符串与储存了姓中使用的多个单词的知识词典对照,如果有符合的单词则置换修正对象字符串。 然而,在以往的知识处理中,从知识词典未恰当地筛选出用于置换修正对象字符串的字符串而未获得足够的修正精度的情况较多,要求精度的提高。
技术实现思路
实施方式公开了能够高精度地进行使用了知识词典的字符串的修正的。 实施方式的知识处理装置,使用知识词典进行字符串的修正,该知识处理装置具备:选择部、生成部、修正部。选择部从包含多个字符串且按每个字符串附有该字符串的属性的文件数据,选择修正对象字符串。生成部基于所述文件数据中的、属性与所述修正对象字符串不同的其他的字符串,生成取得置换字符串的候补的条件,该置换字符串用于置换所述修正对象字符串。修正部使用按照所述条件而从所述知识词典取得的所述置换字符串的候补 ...
【技术保护点】
一种知识处理装置,使用知识词典进行字符串的修正,该知识处理装置具备:选择部,从包含多个字符串且按每个字符串附有该字符串的属性的文件数据,选择修正对象字符串;生成部,基于所述文件数据中的、属性与所述修正对象字符串不同的其他的字符串,生成取得置换字符串的候补的条件,该置换字符串用于置换所述修正对象字符串;以及修正部,使用按照所述条件而从所述知识词典取得的所述置换字符串的候补,进行对所述修正对象字符串的修正。
【技术特征摘要】
2013.09.06 JP 2013-1856341.一种知识处理装置,使用知识词典进行字符串的修正,该知识处理装置具备: 选择部,从包含多个字符串且按每个字符串附有该字符串的属性的文件数据,选择修正对象字符串; 生成部,基于所述文件数据中的、属性与所述修正对象字符串不同的其他的字符串,生成取得置换字符串的候补的条件,该置换字符串用于置换所述修正对象字符串;以及 修正部,使用按照所述条件而从所述知识词典取得的所述置换字符串的候补,进行对所述修正对象字符串的修正。2.如权利要求1所述的知识处理装置, 还具备确定部,该确定部与所述条件无关地确定所述置换字符串, 在所述确定部无法确定所述置换字符串的情况下,所述生成部生成所述条件, 在所述确定部能够确定所述置换字符串的情况下,所述修正部用所确定的所述置换字符串置换所述修正对象字符串,在所述确定部无法确定所述置换字符串的情况下,所述修正部使用按照所述条件而取得的所述置换字符串的候补,进行对所述修正对象字符串的修正。3.如权利要求1所述的知识处理装置,还具备: 提示部,将所述置换字符串的候补提示给用户;以及 受理部,受理对所提示的所述置换字符串的候补进行选择的用户操作, 所述修正部用所选择的所述置换字符串的候补来置换所述修正对象字符串。4.如权利要求1所述的知识处理装置,还具备: 提示部,将所述文件数据提示给用户;以及 受理部,受理对所提示的所述文件数据中的任意的字符串进行指定的用户操作, 所述选择部选择由用户操作所指定的字符串作为所述修正对象字符串。5.如权利要求1所述的知识处理装置, 提示部,将所述文件数据提示给用户;以及 受理部,受理对所提示的所述文件数据中的任意的字符串进行指定的用户操作, 所述生成部基于由用户操作所指定的字符串、而且是属性与所述修正对象字符串不同的其他的字符串,生成所述条件。6.如权利要求1所述的知识处理装置, 所述修正对象字符串的属性是表示该字符串是姓名的姓的姓属性且所述其他的字符串的属性是表示该字符串是住所的住所属性的情况下,所述生成部生成取得以所述其他的字符串所示的地域特有的姓作为所述置换字符串的候补的、所述条件。7.如权利要求1所述的知识处理装置, 所述修正对象字符串的属性是表示该字符串...
【专利技术属性】
技术研发人员:吉田笃弘,
申请(专利权)人:株式会社东芝,东芝解决方案株式会社,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。