当前位置: 首页 > 专利查询>苹果公司专利>正文

辅助弱视用户进行图像拍摄和图像回顾制造技术

技术编号:9832664 阅读:147 留言:0更新日期:2014-04-01 23:16
本发明专利技术提供了用于简化弱视用户拍摄和回顾可视图像的技术和机构。在一个实现中,这些技术和机构提供了每图像拍摄功能和拍摄图像回顾功能。利用每图像拍摄功能,向用户提供音频消息,来帮助用户适当地定位图像拍摄机构,以拍摄一图片中的希望主体、对图片内的主体适当地取景、对图片内的主体适当地调整大小等。利用图像回顾功能,向用户提供音频消息,来帮助用户欣赏和“看见”已经拍摄并且向用户显示的可视图像。利用这些功能,与当前可能程度相比,弱视用户能够更大程度地拍摄和回顾图像。

【技术实现步骤摘要】
【国外来华专利技术】辅助弱视用户进行图像拍摄和图像回顾
技术介绍
如今,许多电子装置(如移动电话、智能电话、平板计算机,以及膝上型计算机)都具有使得用户能够利用该电子装置拍摄可视图像的图像拍摄装置(例如,摄像机)。一旦拍摄,该可视图像就可以在该电子装置上显示和/或编辑、发送至另一装置、与存储在该电子装置中的联系人相关联、或者由用户以其它方式使用。当前,大多数(如果不是所有)图像拍摄和再现装置被设计成由能够看见的用户使用。对于弱视用户来说,很难(如果不是无法)有效使用图像拍摄和再现装置。例如,如果弱视用户要尝试利用图像拍摄装置拍摄图片,则对于该用户来说,极难的是:(1)拍摄该图片内的合适主体;(2)将该主体定位在该图片中央;(3)按正确的距离或缩放级别拍摄该主体,以使该主体具有对于该图片的恰当尺寸;等。最可能的是,用户必须争取看得见的人的帮助,以帮助对该图片内的主体取景和调整大小。类似的是,弱视用户很难(如果不是无法)有意义地回顾和欣赏由图像再现装置再现的图像,则这相当困难。该用户不知道有多少人在该图片中、谁在该图片中、不同的人位于该图片内的什么地方等。此外,用户很可能必须争取看得见的人的帮助以向他/她描述该图片。由此,如当前设计和构造的,图像拍摄和再现装置对于弱视用户来说不是非常用户友好。附图说明图1示出了可以实现本专利技术一个实施例的样本装置的框图。图2示出了根据本专利技术一个实施例的、在图像拍摄过程期间由图1的装置执行的操作的流程图。图3例示了根据本专利技术的一个实施例的帧跟踪的示例。图4示出了根据本专利技术一个实施例的、在图像回顾过程期间由图1的装置执行的操作的流程图。图5示出了根据本专利技术的一个实施例的、如何将帧划分成具有九部分的网格。具体实施方式概述根据本专利技术的一个实施例,提供了用于辅助弱视用户拍摄和回顾可视图像的技术和机构。在一个实施例中,这些技术和机构包括图像预拍摄功能和拍摄图像回顾功能。利用图像预拍摄功能,向用户提供音频消息,以帮助用户适当地定位图像拍摄机构,以拍摄图片中的希望主体、对图片内的主体适当地取景、对图片内的主体适当地调整大小等。利用图像回顾功能,向用户提供音频消息,来帮助用户欣赏和“看见”已经拍摄并显示的可视图像。利用图像预拍摄功能,用户可以按场景指示具有图像拍摄机构(例如,摄像机)的电子装置。周期性地,或者响应于用户调用该装置的某一控制(例如,通过触摸某一控制部或者进行某一姿势或移动),该装置预拍摄该场景的图像。在预拍摄该图像之后,装置分析该图像。例如,装置可以应用面部检测技术以确定该图像中有多少面部。该装置还可以识别构成每一个面部的像素,以确定该预拍摄图像内的每一个面部的位置。另外,该装置可以应用面部识别技术来识别这些面部。由此,不是将预拍摄图像中的一面部称为“面部1”,而是该装置可以将该面部识别为“Zachary”。而且,该装置可以分析该预拍摄图像以确定这些面部中的任一个是否过于靠近图片的边缘(例如,左侧、右侧、上侧以及下侧)。该装置还可以分析该预拍摄图像,以确定这些面部相对于图片的总尺寸的大小。在分析该预拍摄图像之后,该装置可以向用户提供一个或多个音频消息。例如,如果该图像包含属于Zachary和Emily的面部,则该装置可以提供说“两个面部”,“Zachary”、“Emily”的音频消息。该装置还可以提供有关该图像内的面部位置的音频消息。例如,如果面部过于靠近该图片左边缘,则装置可以提供说“面部靠近左边缘”的音频消息。如果这些面部在该图像内居中,则该装置可以提供说“面部居中”的音频消息。在某些情况下,面部可以靠近多个边缘(例如,上边缘和左边缘)。在这种情况下,该装置可以提供说“面部靠近左上边缘”的音频消息。该装置还可以提供有关该图像内的面部的尺寸的音频消息。例如,如果面部太小,则该装置可以提供说“面部太小”的音频消息。另一方面,如果一面部几乎填满整个图像,则该装置可以提供说“面部全宽”的音频消息。可以将这些和其它音频消息提供给用户。响应于这些音频消息,用户可以改变图像拍摄机构的定位、更靠近或更远离主体移动、调节图像拍摄机构的缩放特征等。例如,如果用户希望拍摄该图片中的三个主体,但当前仅检测到两个面部,则该用户可以重定位图像拍摄机构以拍摄全部三个主体。而且,如果一面部过于靠近边缘,则该用户可以移动图像拍摄机构,以将该主体更好居中。而且,如果面部太小或太大,则用户可以更靠近或更远离主体移动,或者调节图像拍摄机构的缩放因子。这些和其它调节可以由用户进行。在进行这些调节之后,用户可以等待来自该装置的更新音频消息(其将在该装置在预拍摄另一图像并分析该图像之后提供)。通过响应于来自该装置的音频消息而进行调节的迭代过程,用户可以获得他/她希望的精确图像。作为调节过程的一部分,用户可能希望获知各个主体位于预拍摄图像内的什么地方。在一个实施例中,该装置具有显示该预拍摄图像的触敏显示器。用户可以触摸该显示器的任何部分,并且响应于该用户输入,该装置确定该预拍摄图像的被用户触摸的部分是否对应于构成该图片中的面部之一的像素。基于该确定,该装置可以提供恰当的音频消息。例如,如果被用户触摸的部分不对应于图片中的任何面部,则该装置可以提供蜂鸣声音(或用户选择的某一其它声音,或完全接受为意指“没有什么”的声音的声音,或者根本没有声音)。另一方面,如果所触摸部分对应于图片中的一面部,则该装置可以提供指示其的音频消息。例如,该音频消息可以说“面部1”、“面部2”等。如果该面部在面部识别处理期间被识别,则该音频消息可以更具体。例如,如果所触摸部分对应于Zachary的面部,则该音频消息可以说“Zachary”。利用该功能,弱视用户能够确定主体位于预拍摄图像内的什么地方,并且它们怎样彼此相对定位。这使得用户能够在永久性拍摄该图像之前“视觉化”它。一旦用户基于来自该装置的音频消息而满意图像拍摄机构相对于主体的定位,该用户就可以使该装置(例如,通过触摸某一控制部或进行某一姿势或移动)永久性拍摄并存储该图像。在拍摄并存储该图像之后,分析其以导出一组元数据。在一个实施例中,直接在永久性拍摄一图像之后执行该分析。所导出的元数据与该图像一起存储,并且可以被用于增强用户在回顾所拍摄图像时的经验。作为一示例,面部检测技术可以被应用至所拍摄图像以确定该图像中有多少面部。所检测面部的数量可以被存储为针对所拍摄图像的元数据的一部分。另外,作为面部检测过程的一部分,可以识别构成面部的像素。利用该信息,可以指定该图片内的面部的位置。该像素信息可以被存储为针对所拍摄图像的元数据的一部分。而且,可以应用面部识别技术以识别出现在该图片中的面部。由此,不是仅仅获知该图片中存在两个面部,而是该装置例如可以确定其是处于图片中的Zachary和Emily。该识别信息还可以被存储为针对所拍摄图像的元数据的一部分。这些和其它元数据集可以利用所拍摄图像导出并与其一起存储。一旦导出元数据,其就可以被该装置用于向用户提供反馈。在一个实施例中,在永久性拍摄一图像之后,该装置向用户提供有关该图像的音频反馈。例如,该装置可以提供说“两个面部”,“Zachary”、“Emily”的音频消息。该音频反馈向用户提供刚才拍摄了什么图像的确认。在某一点上,用户可能希望显示并回顾先前拍摄的图像。在本文档来自技高网...

【技术保护点】
一种装置,包括:图像拍摄机构;和图像处理器,耦接至图像拍摄机构,其中,图像处理器被配置成使所述装置执行以下操作:拍摄包括一个或多个面部的场景的图像;分析该图像,其中,分析该图像的步骤包括:检测该图像中的所述一个或多个面部;以及向用户提供具有有关所述一个或多个面部的信息的一个或多个音频消息。

【技术特征摘要】
【国外来华专利技术】2011.06.24 US 61/501,113;2011.09.28 US 13/247,9011.一种装置,包括:图像拍摄机构;和图像处理器,耦接至图像拍摄机构,其中,图像处理器被配置成使所述装置执行以下操作:拍摄包括一个或多个面部的场景的图像;分析该图像,其中,分析该图像包括检测该图像中的所述一个或多个面部;执行面部辨认以识别所检测的面部;基于所述面部辨认确定用于每个所检测的面部的唯一标识符;保持所述唯一标识符以在后续的所拍摄的图像中识别所检测的面部;以及基于至少一个所检测的面部各自的唯一标识符并响应于检测到显示器内所述至少一个所检测的面部的特定位置处的触敏输入,向用户提供识别所述至少一个所检测的面部的一个或多个音频消息。2.根据权利要求1所述的装置,其中,提供一个或多个音频消息包括:向用户提供指示在图像中检测到多少面部的音频消息。3.根据权利要求1所述的装置,其中,保持所述唯一标识符还包括:拍摄所述场景的包括至少一个所检测的面部的随后图像;检测随后图像中的所述至少一个所检测的面部;关联初始图像中的所述至少一个所检测的面部与随后图像中的相同的面部;以及关联分配给初始图像中的第一特定面部的标志与随后图像中的第一特定面部,以使跨多个图像对于所述第一特定面部使用同一标志。4.根据权利要求1所述的装置,其中,分析该图像包括:确定所述一个或多个面部如何相对于图像的一个或多个边缘定位,并且其中,提供一个或多个音频消息包括:向用户提供指示所述一个或多个面部如何相对于图像的一个或多个边缘定位的音频消息。5.根据权利要求4所述的装置,其中,向用户提供指示所述一个或多个面部如何相对于图像的一个或多个边缘定位的音频消息包括:向用户提供指示所述一个或多个面部靠近图像的一个或多个边缘的音频消息。6.根据权利要求4所述的装置,其中,向用户提供指示所述一个或多个面部如何相对于图像的一个或多个边缘定位的音频消息包括:向用户提供指示所述一个或多个面部处于图像的中央部分内的音频消息。7.根据权利要求4所述的装置,其中,确定所述一个或多个面部如何相对于图像的一个或多个边缘定位包括:确定所述一个或多个面部中的一特定面部与图像的一特定边缘之间的间隔是否低于一阈值。8.根据权利要求1所述的装置,其中,分析该图像包括:确定所述一个或多个面部中的至少一特定面部的尺寸,并且其中,提供一个或多个音频消息包括:向用户提供指示该特定面部的尺寸的音频消息。9.根据权利要求8所述的装置,其中,确定该特定面部的尺寸包括:确定该特定面部的尺寸是否小于一下限值或大于一上限值,并且其中,向用户提供指示该特定面部的尺寸的音频消息包括:提供以下音频消息之一:(a)指示该特定面部小于下限值的音频消息;或者(b)指示该特定面部大于上限值的音频消息。10.根据权利要求1所述的装置,其中,所述装置还包括触敏输入机构,并且其中,所述图像处理器被配置成使所述装置还执行以下操作:检测到用户正在触摸输入机构的特定部分;关联所述输入机构的特定部分与图像的一特定部分;确定所述图像的特定部分是否对应于所述一个或多个面部中的一个面部;以及响应于确定所述图像的特定部分对应于所述一个或多个面部中的一个面部,向用户提供具有有关所述图像的特定部分所对应的面部的信息的一个或多个音频消息。11.根据权利要求10所述的装置,其中,分析该图像包括:执行面部识别以识别图像中的所述一个或多个面部中的一个或多个,并且其中,向用户提供具有有关所述图像的特定部分所对应的面部的信息的一个或多个音频消息包括:向用户提供有关所述图像的特定部分所对应的面部的识别信息的音频消息。12.根据权利要求1所述的装置,其中,所述图像是初始图像,其中,所述一个或多个面部包括一特定面部,并且其中,所述图像处理器被配置成使所述装置还执行以下操作:拍摄所述场景的包括该特定面部的随后图像;检测随后图像中的该特定面部;关联初始图像中该特定面部与随后图像中的该特定面部;以及关联分配给初始图像中的该特定面部的标志与随后图像中的该特定面部,以使跨多个图像对于该特定面部使用同一标志。13.根据权利要求1所述的装置,其中,所述图像是未存储为永久性图像的初始临时图像,并且其中,所述图像处理器被配置成使所述装置还执行以下操作:在用户已经响应于所述一个或多个音频消息而进行了场景取景调节之后,拍摄该场景的随后临时图像,其中,该随后临时图像未存储为永久性图像;分析随后临时图像,其中,分析随后临时图像包括检测随后临时图像中的一个或多个面部;执行面部辨认以识别所检测的面部;向用户提供基于其各自的唯一标识符识别至少一个所检测的面部并指示所述至少一个所检测的面部如何定位在随后临时图像中的一个或多个音频消息;检测指示用户希望拍摄如当前取景的场景的永久性图像的用户输入;以及响应于用户输入,拍摄如当前取景的场景的永久性图像。14.根据权利要求1所述的装置,其中,所述图像处理器包括一个或多个处理器和存储指令的一个或多个存储部,所述指令在通过所述一个或多个处理器执行时使所述一个或多个处理器使所述装置执行根据权利要求1所述的操作。15.根据权利要求1所述的装置,其中,所述图像处理器包括多个部件,包括逻辑部件,其被配置成使所述装置执行根据权利要求1所述的操作。16.一种方法,包括:拍摄包括一个或多个面部的一场景的图像;分析该图像,其中,分析该图像包括检测该图像中的一个或多个面部;执行面部辨认以识别所检测的面部;基于所述面部辨认确定用于每个所检测的面部的唯一标识符;保持所述唯一标识符以在后续的所拍摄的图像中识别所检测的面部;以及基于至少一个所检测的面部各自的唯一标识符并响应于检测到显示器内所述至少一个所检测的面部的特定位置处的触敏输入,向用户提供识别所述至少一个所检测的面部的一个或多个音频消息。17.根据权利要求16所述的方法,其中,提供一个或多个音频消息包括:向用户提供指示在该图像中检测到多少面部的音频消息。18.根据权利要求16所述的方法,其中,保持所述唯一标识符还包括:拍摄所述场景的包括至少一个所检测的面部的随后图像;检测随后图像中的所述至少一个所检测的面部;关联初始图像中的所述至少一个所检测的面部与随后图像中的相同的面部;以及关联分配给初始图像中的第一特定面部的标志与随后图像中的第一特定面部,以使跨多个图像对于所述第一特定面部使用同一标志。19.根据权利要求16所述的方法,其中,分析该图像包括:确定所述一个或多个面部中的至少一特定面部的尺寸,并且其中,提供一个或多个音频消息包括:向用户提供指示该特定面部的尺寸的音频消息。20.根据权利要求19所述的方法,其中,确定该特定面部的尺寸包括:确定该特定面部的尺寸是否小于一下限值或大于一上限值,并且其中,向用户提供指示该特定面部的尺寸的音频消息包括:提供以下音频消息之一:(a)指示该特定面部小于下限值的音频消息;或者(b)指示该特定面部大于上限值的音频消息。21.根据权利要求16所述的方法,还包括:检测到用户在触摸输入机构的特定部分;关联输入机构的该特定部分与所述...

【专利技术属性】
技术研发人员:J·霍兰德E·塞默尔C·弗雷扎齐D·胡德森
申请(专利权)人:苹果公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1