【技术实现步骤摘要】
【技术保护点】
一种用于校对文档的信息处理器,所述信息处理器包括:第一存储单元,用于存储输出信息,所述输出信息包括规定通过对源手稿图像执行OCR而获得的文本的信息及其位置信息;第二存储单元,用于存储由用户校对的文档文件,所述文档文件是通过根据来自所述输出信息的读取顺序来读取经OCR处理的所述文本而生成的;行移动检测单元,用于基于由所述用户对所述文档文件执行的校对来检测包括所述文档文件中所包含的文本的行的移动;以及合并单元,用于在所述输出信息中反映校对所述文档文件的结果;其中所述行移动检测单元计算指示在用于删除包括所述文档文件中所包含的文本的行的行删除操作与行插入操作或者行编辑操作之间的匹配程度的权重,并且通过确定行删除操作以及行插入操作或者行编辑操作是否导致所述加权的最大值来检测所述行的移动;并且所述合并单元在所述行移动检测单元已经检测到所述行的移动的情况下,根据规定在所述权重的计算中获得的所述行的目的地的信息,来移动作为所述行的构成元素并且被包括在所述输出信息中的文本。
【技术特征摘要】
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。