当前位置: 首页 > 专利查询>微软公司专利>正文

通过快速图像匹配的全局定位方法技术

技术编号:2931753 阅读:255 留言:0更新日期:2012-04-11 18:40
提供一种有效技术,用于确定对应于捕捉图像的文档部分。标识其中图案至少被部分遮掩的文档区域。在图像中选择一个参考像素,并确定像素与图案之间的偏移。随后将图像与文档进行逐像素比较,使得仅将参考像素与文档中这样的位置比较,这些位置既在所标识的区域内,又与图案有确定的偏移。具有图像像素与电子文档之间最高一致性的比较则标识参考像素相对于电子文档的位置。

【技术实现步骤摘要】

本专利技术涉及确定文档的哪个部分对应于该部分的捕捉图像。本专利技术的各方面尤其适用于通过捕捉该文档的图像标识文档上记号的位置。
技术介绍
尽管存储在计算机上的电子文档比书写的文档提供许多优点,但许多用户继续用电子文档的打印版本来执行某些任务。这些任务包括,例如,阅读和批注文档。有了批注,文档的纸质版本呈现特殊的意义,因为批注一般由用户直接写在打印文档上。然而,问题之一是,具有直接批注的文档的打印版本以后难以将批注转换成电子格式。理论上,以电子方式存储的批注应当以书写批注与文档的纸质版本相一致的相同方式,与文档的电子版本相一致。这种一致通常要求原始或另一用户费力地读完这些批注并亲自将它们输入到计算机中。在某些情况下,用户可用电子方式扫描书写在纸质文档上的批注,从而建立新的电子文档。这些多重步骤使得难以在重复的基础上处理的文档打印版本与文档电子版本之间一致性。而且,扫描得到的图像常常不能被编辑。因而,可能没有将批注与文档的原始文本分开的方法。这使得难以使用批注。为解决这个问题,已经开发了笔以捕捉用笔书写在打印文档上的批注。这种类型的笔包括摄像机,它在用户书写批注时捕捉打印文档的图像。然而,用这种类型的笔的某些例子,笔可使用对于摄像机不可见的墨水。例如,该笔可使用无炭墨水和红外照明用于摄像机,这防止摄像机“看见”用这种墨水书写的批注。用这种类型的笔,笔将根据由笔在批注的书写过程中捕捉的图像,来推断在文档上形成的批注的笔尖运动。然而,为了将图像与原始的电子文档相关联,必须确定这些图像相对于文档的位置。因此,常与包括一种图案的纸一起使用这种类型的笔,该图案唯一地标识纸上的不同位置。通过分析这种图案,接收图像的计算机可以确定在该图像中所捕捉的是纸的什么部分(即打印文档的什么部分)。尽管这样的加有图案的纸或其它媒质的使用允许将在纸质文档上书写的批注转换成电子格式并且正确地与文档的电子版本相关联,但该技术并不总是可靠的。例如,在纸上包含文本的文档可遮掩图案区域。如果笔捕捉这些区域之一的图像,则计算机不能使用该图案来准确地确定由该图像捕捉的文档部分的位置。相反,计算机必须使用替换的技术来标识在该图像中捕捉的文档部分的位置。例如,计算机可执行所捕捉图像与电子文档的逐像素比较。逐像素比较通常将标识在捕捉的图像中文档的部分,但该技术具有高处理开销。为执行该技术,例如,必须首先估算所捕捉图像与文档图像之间的变换,例如旋转和比例(scale),从而可以将所捕捉图像扭曲(warp)并将它与文档图像逐像素地匹配。如果变换是未知的,则必须考虑所有可能的旋转和比例。此外,在图像中选择一参考像素。随后将扭曲的图像中的每一像素与电子文档中的相应像素比较,使得将图像参考像素与电子文档的第一位置比较。随后必须重复该比较,使得最终将参考像素与电子文档中的每一位置比较。在图像像素与电子文档之间具有最高一致性的比较,标识参考像素相对于电子文档的位置,并由此标识图像中所捕捉文档的部分。因此,所希望的是提供一种技术,使计算机能够确定在捕捉的图像中文档的部分的位置,而不必执行图像与整个文档的逐像素比较。
技术实现思路
有利的是,本专利技术的各种实施例提供一种有效的技术,用于确定相应于捕捉图像的文档部分。按照本专利技术的各种实施例,标识其中图案至少被部分地遮掩的文档区域。在图像中选择一参考像素、估算所捕捉图像的旋转和比例、并确定像素与图案之间的偏移。随后将扭曲的图像与文档进行逐像素比较,使得仅将参考像素与文档中这样的位置比较,这些位置既在所标识的区域内,又与图案有确定的偏移。图像像素与电子文档之间最高相关性的比较则标识参考像素相对于电子文档的位置。使用该技术,可以避免参考像素与文档的其它位置的比较,从而减少确定图像中所捕捉文档的部分的位置所需要的处理开销。附图说明图1示出可结合本专利技术的实施例使用的计算机的一般描述。图2A例示按照本专利技术的各种实施例的笔的一个例子,而图2B例示可由本专利技术的各种实施例获得的图像的分辨率。图3A至3I示出按照本专利技术的实施例的编码系统的各种例子。图4以图形例示可以如何使用一种编码的图案来确定从文档部分捕捉的图像的旋转。图5例示一个公式,可用于确定从文档部分捕捉的图像的旋转。图6例示一种按照本专利技术的各种实施例的工具,可用于将捕捉图像与文档部分进行匹配。图7A-7C例示一流程图,描述一种按照本专利技术的各种实施例将捕捉图像与文档部分进行匹配的方法。图8例示如何将捕捉图像扭曲并随后以多个90°旋转它的例子。具体实施例方式图1示出常规通用数字计算环境的一个例子的功能框图,该环境可以用于实现本专利技术的各种方面。在图1中,计算机100包括处理单元110,系统存储器120和系统总线130,它将包括系统存储器在内的各种系统组件耦合到处理单元110。系统总线130可以是若干总线结构中的任何一种,包括存储器总线或存储器控制器,外围总线和使用任何各种总线结构的局部总线。系统存储器120包括只读存储器(ROM)140和随机存取存储器(RAM)150。基本输入/输出系统160(BIOS),包含帮助诸如在启动期间在计算机100内的元件之间传送信息的例程,存储在ROM 140中。计算机100还包括用于从硬盘(未示出)读写的硬盘驱动器170,用于从可移动磁盘190读写的磁盘驱动器180,和用于从诸如CD ROM或其它光媒质等可移动光盘192读写的光盘驱动器191。硬盘驱动器170、磁盘驱动器180和光盘驱动器191分别通过硬盘驱动器接口192、磁盘驱动器193和光盘驱动器194连接到系统总线130。这些驱动器及其相关联的计算机可读媒质为计算机100提供计算机可读指令、数据结构、程序模块和其它数据的非易失性存储。本领域的熟练技术人员将意识到,可以存储可由计算机访问的数据的其它类型的计算机可读媒质,诸如磁盒、闪存卡、数字视频盘、伯努利盒(Bernoullicartridge)、随机存取存储器(RAM)、只读存储器(ROM)等,也可在示例的操作环境中使用。可以在硬盘驱动器170、磁盘190、光盘192、ROM 140或RAM 150中存储多个程序模块,包括操作系统195、一个或多个应用程序196、其它程序模块197和程序数据198。通过输入设备,诸如键盘101和定位设备102,用户可以将命令和信息输入到计算机100。其它输入设备(未示出)可包括麦克风、操纵杆、游戏垫、圆盘式卫星天线、扫描仪等等。这些和其它输入设备常常通过耦合到系统总线的串行端口接口106连接到处理单元110,但可通过其它接口连接,诸如并行端口、游戏端口或通用串行总线(USB)。而且,这些设备可直接通过适合的接口(未示出)耦合到系统总线130。监示器107或其它类型的显示设备也通过诸如视频适配器108的接口连接到系统总线130。除监示器之外,个人计算机一般包括其它外围输出设备(未示出),诸如扬声器和打印机。在一个较佳的实施例中,配备笔数字化仪165和随附的笔或触针165以便以数字方式捕捉手写输入。尽管示出笔数字化仪165和串行端口之间的直接连接,但实际上,笔数字化仪165可直接耦合到处理单元110,通过并行端口或者其它接口和系统总线130,如本领域已知的。而且,尽管所示的数字化仪165与监示器107是分开的,但最好本文档来自技高网
...

【技术保护点】
一种确定对应于捕捉图像的文档部分的方法,其特征在于,所述方法包括:获得文档部分的捕捉图像,所述文档具有一种图案,它唯一地标识所述文档中的不同位置;确定所述文档的被遮掩区域,其中所述图案至少被部分地遮掩;在所述捕捉图像 中指定一参考像素;标识在所述文档的被遮掩区域中可能与所述参考像素对应的位置;将所述捕捉图像与所述文档的不同部分比较,使得所述参考像素与一个或多个所述标识位置比较;以及基于所述比较,确定所述文档中一与所述参考像素对应的 标识位置。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:王坚陈黎勇王强马晓旭党映农
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1