【技术实现步骤摘要】
【国外来华专利技术】辅助弱视用户进行图像拍摄和图像回顾
技术介绍
如今,许多电子装置(如移动电话、智能电话、平板计算机,以及膝上型计算机)都具有使得用户能够利用该电子装置拍摄可视图像的图像拍摄装置(例如,摄像机)。一旦拍摄,该可视图像就可以在该电子装置上显示和/或编辑、发送至另一装置、与存储在该电子装置中的联系人相关联、或者由用户以其它方式使用。当前,大多数(如果不是所有)图像拍摄和再现装置被设计成由能够看见的用户使用。对于弱视用户来说,很难(如果不是无法)有效使用图像拍摄和再现装置。例如,如果弱视用户要尝试利用图像拍摄装置拍摄图片,则对于该用户来说,极难的是:(1)拍摄该图片内的合适主体;(2)将该主体定位在该图片中央;(3)按正确的距离或缩放级别拍摄该主体,以使该主体具有对于该图片的恰当尺寸;等。最可能的是,用户必须争取看得见的人的帮助,以帮助对该图片内的主体取景和调整大小。类似的是,弱视用户很难(如果不是无法)有意义地回顾和欣赏由图像再现装置再现的图像,则这相当困难。该用户不知道有多少人在该图片中、谁在该图片中、不同的人位于该图片内的什么地方等。此外,用户很可能必须争取看得见的人的帮助以向他/她描述该图片。由此,如当前设计和构造的,图像拍摄和再现装置对于弱视用户来说不是非常用户友好。附图说明图1示出了可以实现本专利技术一个实施例的样本装置的框图。图2示出了根据本专利技术一个实施例的、在图像拍摄过程期间由图1的装置执行的操作的流程图。图3例示了根据本专利技术的一个实施例的帧跟踪的示例。图4示出了根据本专利技术一个实施例的、在图像回顾过程期间由图1的装置执行的操作的流程图。图5示 ...
【技术保护点】
一种装置,包括:图像拍摄机构;和图像处理器,耦接至图像拍摄机构,其中,图像处理器被配置成使所述装置执行以下操作:拍摄包括一个或多个面部的场景的图像;分析该图像,其中,分析该图像的步骤包括:检测该图像中的所述一个或多个面部;以及向用户提供具有有关所述一个或多个面部的信息的一个或多个音频消息。
【技术特征摘要】
【国外来华专利技术】2011.06.24 US 61/501,113;2011.09.28 US 13/247,9011.一种装置,包括:图像拍摄机构;和图像处理器,耦接至图像拍摄机构,其中,图像处理器被配置成使所述装置执行以下操作:拍摄包括一个或多个面部的场景的图像;分析该图像,其中,分析该图像包括检测该图像中的所述一个或多个面部;执行面部辨认以识别所检测的面部;基于所述面部辨认确定用于每个所检测的面部的唯一标识符;保持所述唯一标识符以在后续的所拍摄的图像中识别所检测的面部;以及基于至少一个所检测的面部各自的唯一标识符并响应于检测到显示器内所述至少一个所检测的面部的特定位置处的触敏输入,向用户提供识别所述至少一个所检测的面部的一个或多个音频消息。2.根据权利要求1所述的装置,其中,提供一个或多个音频消息包括:向用户提供指示在图像中检测到多少面部的音频消息。3.根据权利要求1所述的装置,其中,保持所述唯一标识符还包括:拍摄所述场景的包括至少一个所检测的面部的随后图像;检测随后图像中的所述至少一个所检测的面部;关联初始图像中的所述至少一个所检测的面部与随后图像中的相同的面部;以及关联分配给初始图像中的第一特定面部的标志与随后图像中的第一特定面部,以使跨多个图像对于所述第一特定面部使用同一标志。4.根据权利要求1所述的装置,其中,分析该图像包括:确定所述一个或多个面部如何相对于图像的一个或多个边缘定位,并且其中,提供一个或多个音频消息包括:向用户提供指示所述一个或多个面部如何相对于图像的一个或多个边缘定位的音频消息。5.根据权利要求4所述的装置,其中,向用户提供指示所述一个或多个面部如何相对于图像的一个或多个边缘定位的音频消息包括:向用户提供指示所述一个或多个面部靠近图像的一个或多个边缘的音频消息。6.根据权利要求4所述的装置,其中,向用户提供指示所述一个或多个面部如何相对于图像的一个或多个边缘定位的音频消息包括:向用户提供指示所述一个或多个面部处于图像的中央部分内的音频消息。7.根据权利要求4所述的装置,其中,确定所述一个或多个面部如何相对于图像的一个或多个边缘定位包括:确定所述一个或多个面部中的一特定面部与图像的一特定边缘之间的间隔是否低于一阈值。8.根据权利要求1所述的装置,其中,分析该图像包括:确定所述一个或多个面部中的至少一特定面部的尺寸,并且其中,提供一个或多个音频消息包括:向用户提供指示该特定面部的尺寸的音频消息。9.根据权利要求8所述的装置,其中,确定该特定面部的尺寸包括:确定该特定面部的尺寸是否小于一下限值或大于一上限值,并且其中,向用户提供指示该特定面部的尺寸的音频消息包括:提供以下音频消息之一:(a)指示该特定面部小于下限值的音频消息;或者(b)指示该特定面部大于上限值的音频消息。10.根据权利要求1所述的装置,其中,所述装置还包括触敏输入机构,并且其中,所述图像处理器被配置成使所述装置还执行以下操作:检测到用户正在触摸输入机构的特定部分;关联所述输入机构的特定部分与图像的一特定部分;确定所述图像的特定部分是否对应于所述一个或多个面部中的一个面部;以及响应于确定所述图像的特定部分对应于所述一个或多个面部中的一个面部,向用户提供具有有关所述图像的特定部分所对应的面部的信息的一个或多个音频消息。11.根据权利要求10所述的装置,其中,分析该图像包括:执行面部识别以识别图像中的所述一个或多个面部中的一个或多个,并且其中,向用户提供具有有关所述图像的特定部分所对应的面部的信息的一个或多个音频消息包括:向用户提供有关所述图像的特定部分所对应的面部的识别信息的音频消息。12.根据权利要求1所述的装置,其中,所述图像是初始图像,其中,所述一个或多个面部包括一特定面部,并且其中,所述图像处理器被配置成使所述装置还执行以下操作:拍摄所述场景的包括该特定面部的随后图像;检测随后图像中的该特定面部;关联初始图像中该特定面部与随后图像中的该特定面部;以及关联分配给初始图像中的该特定面部的标志与随后图像中的该特定面部,以使跨多个图像对于该特定面部使用同一标志。13.根据权利要求1所述的装置,其中,所述图像是未存储为永久性图像的初始临时图像,并且其中,所述图像处理器被配置成使所述装置还执行以下操作:在用户已经响应于所述一个或多个音频消息而进行了场景取景调节之后,拍摄该场景的随后临时图像,其中,该随后临时图像未存储为永久性图像;分析随后临时图像,其中,分析随后临时图像包括检测随后临时图像中的一个或多个面部;执行面部辨认以识别所检测的面部;向用户提供基于其各自的唯一标识符识别至少一个所检测的面部并指示所述至少一个所检测的面部如何定位在随后临时图像中的一个或多个音频消息;检测指示用户希望拍摄如当前取景的场景的永久性图像的用户输入;以及响应于用户输入,拍摄如当前取景的场景的永久性图像。14.根据权利要求1所述的装置,其中,所述图像处理器包括一个或多个处理器和存储指令的一个或多个存储部,所述指令在通过所述一个或多个处理器执行时使所述一个或多个处理器使所述装置执行根据权利要求1所述的操作。15.根据权利要求1所述的装置,其中,所述图像处理器包括多个部件,包括逻辑部件,其被配置成使所述装置执行根据权利要求1所述的操作。16.一种方法,包括:拍摄包括一个或多个面部的一场景的图像;分析该图像,其中,分析该图像包括检测该图像中的一个或多个面部;执行面部辨认以识别所检测的面部;基于所述面部辨认确定用于每个所检测的面部的唯一标识符;保持所述唯一标识符以在后续的所拍摄的图像中识别所检测的面部;以及基于至少一个所检测的面部各自的唯一标识符并响应于检测到显示器内所述至少一个所检测的面部的特定位置处的触敏输入,向用户提供识别所述至少一个所检测的面部的一个或多个音频消息。17.根据权利要求16所述的方法,其中,提供一个或多个音频消息包括:向用户提供指示在该图像中检测到多少面部的音频消息。18.根据权利要求16所述的方法,其中,保持所述唯一标识符还包括:拍摄所述场景的包括至少一个所检测的面部的随后图像;检测随后图像中的所述至少一个所检测的面部;关联初始图像中的所述至少一个所检测的面部与随后图像中的相同的面部;以及关联分配给初始图像中的第一特定面部的标志与随后图像中的第一特定面部,以使跨多个图像对于所述第一特定面部使用同一标志。19.根据权利要求16所述的方法,其中,分析该图像包括:确定所述一个或多个面部中的至少一特定面部的尺寸,并且其中,提供一个或多个音频消息包括:向用户提供指示该特定面部的尺寸的音频消息。20.根据权利要求19所述的方法,其中,确定该特定面部的尺寸包括:确定该特定面部的尺寸是否小于一下限值或大于一上限值,并且其中,向用户提供指示该特定面部的尺寸的音频消息包括:提供以下音频消息之一:(a)指示该特定面部小于下限值的音频消息;或者(b)指示该特定面部大于上限值的音频消息。21.根据权利要求16所述的方法,还包括:检测到用户在触摸输入机构的特定部分;关联输入机构的该特定部分与所述...
【专利技术属性】
技术研发人员:J·霍兰德,E·塞默尔,C·弗雷扎齐,D·胡德森,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。