当前位置: 首页 > 专利查询>索尼公司专利>正文

记录介质、信息处理设备和信息处理方法技术

技术编号:26427595 阅读:28 留言:0更新日期:2020-11-20 14:25
提供了一种其上记录有程序的记录介质,所述程序使计算机用作:学习部,被配置为学习行动模型,用于基于指示第一环境的环境信息和指示当行动主体在第一环境中采取行动时的成本的行动成本信息,来决定行动主体的行动;以及决定部,被配置为基于环境信息和行动模型,来决定行动主体在第一环境中的行动。

【技术实现步骤摘要】
【国外来华专利技术】记录介质、信息处理设备和信息处理方法相关申请的交叉引用本申请要求2018年4月17日的临时申请号US62/658783的优先权的权益,其全部内容通过引用结合于此。本申请要求2018年7月26日的申请号US16/046485的优先权的权益,其全部内容通过引用结合于此。
本公开涉及记录介质、信息处理设备和信息处理方法。
技术介绍
近年来,已经开发了自主地采取行动的各种行动主体,例如,机器狗和无人机。例如,基于周围环境做出行动主体的行动决策。从抑制行动主体的功耗等的角度来看,期望一种使得行动决策更合适的技术。例如,下面列出的PTL1公开了与车辆轮胎的旋转控制相关的技术,并且执行反馈控制,以减小防止发生打滑而相对于光滑轮胎预先测量的扭矩值和行驶时实际测量的扭矩值之间的差值。引文列表专利文献PTL1:US2015/0112508A
技术实现思路
技术问题然而,在上面列出的PTL1中公开的技术难以应用于除了轮胎的旋转控制之外的控制,而且,这是在实际行驶之后执行的反馈控制。因此,原则上难以在行驶前预测扭矩值,并执行旋转控制。因此,上面列出的PTL1中公开的技术难以在未知环境中对轮胎适当地执行旋转控制。于是,本公开提供了允许行动主体更适当地决定行动的机制。问题解决方案根据本公开的实施方式,提供了一种记录有程序的记录介质,该程序使计算机用作:学习部,被配置为学习行动模型,用于基于指示第一环境的环境信息和指示当行动主体在第一环境中采取行动时的成本的行动成本信息,来决定行动主体的行动;以及决定部,其被配置为基于环境信息和行动模型,来决定行动主体在第一环境中的行动。此外,根据本公开的实施方式,提供了一种信息处理设备,包括:学习部,其被配置为学习行动模型,用于基于指示第一环境的环境信息和指示当行动主体在第一环境中采取行动时的成本的行动成本信息,来决定行动主体的行动;以及决定部,其被配置为基于环境信息和行动模型,来决定行动主体在第一环境中的行动。此外,根据本公开的实施方式,提供了一种由处理器执行的信息处理方法,所述信息处理方法包括:学习行动模型,用于基于指示第一环境的环境信息和指示当行动主体在第一环境中采取行动时的成本的行动成本信息,来决定行动主体的行动;并且基于环境信息和行动模型,来决定行动主体在第一环境中的行动。专利技术的有益效果如上所述,根据本公开的实施方式,提供了一种允许行动主体更适当地决定行动的机制。注意,上述效果不一定是限制性的。利用或代替上述效果,可以实现本说明书中描述的任何一种效果或可以从本说明书中理解的其他效果。附图说明[图1]图1是用于描述所提出的技术的概述的示图;[图2]图2是示出根据本公开的实施方式的自主移动对象的硬件配置示例的示图;[图3]图3是示出根据本实施方式的自主移动对象的功能配置示例的框图;[图4]图4是示出根据本实施方式的用户终端的功能配置示例的框图;[图5]图5是用于描述根据本实施方式的参考测量信息的获取示例的示图;[图6]图6是用于描述根据本实施方式的评估值的计算示例的示图;[图7]图7是用于描述根据本实施方式的评估值的计算示例的示图;[图8]图8是用于描述根据本实施方式的预测模型的示例的示图;[图9]图9是用于描述根据本实施方式的预测模型的学习示例的示图;[图10]图10是用于描述根据本实施方式的自主移动对象的行动决定示例的示图;[图11]图11是用于描述根据本实施方式的自主移动对象的行动决定示例的示图;[图12]图12是用于描述根据本实施方式的自主移动对象的行动决定示例的示图;[图13]图13是用于描述根据本实施方式的自主移动对象的评估值的预测示例的示图;[图14]图14是用于描述根据本实施方式的自主移动对象的行动模型的学习示例的示图;[图15]图15是示出根据本实施方式的由用户终端显示的UI画面的示例的示图;[图16]图16是示出根据本实施方式的由自主移动对象执行的学习处理的流程的示例的流程图;以及[图17]图17是示出根据本实施方式的由自主移动对象执行的行动决定处理的流程的示例的流程图。具体实施方式在下文中,将参考附图详细描述本公开的一个或多个优选实施方式。注意,在本说明书和附图中,具有基本相同的功能和结构的结构元件用相同的附图标记表示,并且省略了这些结构元件的重复说明。注意,将按照以下顺序进行描述。1.介绍2.配置示例2.1.自主移动对象的硬件配置示例2.2.自主移动对象的功能配置示例2.3.用户终端的功能配置示例3.技术特征3.1.测量信息的获取3.2.评估值的实际测量3.3.评估值的预测3.4.行动决定3.5.行动模型的学习3.6.用户请求的反映3.7.更新触发器3.8.处理流程3.9.补充信息4.结论<<1.介绍>>图1是用于描述所提出的技术的概述的示图。在图1所示的空间30中,存在自主移动对象10和操作用户终端20的用户。自主移动对象10是行动主体的示例。作为行动的示例,自主移动对象10在地板上移动。在此处,移动是包括旋转等的概念,除了位置改变之外,还改变移动方向。除了图1所示的四足机器狗之外,自主移动对象10可以实现为任何设备,例如,两足人形机器人、车辆或飞行物体。用户终端20基于用户操作来控制自主移动对象10的行动。例如,用户终端20执行关于自主移动对象10的行动决定的设置。除了图1所示的智能手机之外,用户终端20可以实现为任何设备,例如,平板终端、个人计算机(PC)或可穿戴装置。自主移动对象10的行动容易程度取决于环境。在难以移动的环境中,移动需要时间,首先不可能移动,或者会消耗很多的功率。例如,空间30的地板是木地板33,并且易于移动。然而,在包括电缆31的区域或地毯32的区域中,难以移动。在木地板33的区域中,每单位时间的移动量大,并且耗电量小。另一方面,在包括电缆31的区域或地毯32的区域中,每单位时间的移动量小,并且耗电量大。在此处,如果能够预先预测行动容易程度,则能够实现有效的移动。另一方面,很难预先定义所有各种真实环境(地板和地毯的类型、障碍物的图案等)。此外,行动容易程度不仅受到环境的影响,还受到自主移动对象10随时间的退化、行动方法的变化等的影响。然后,本公开提出了允许自主移动对象10甚至在未知环境中适当地决定行动的技术。根据本文提出的技术的实施方式,自主移动对象10能够甚至在未知环境中预先预测行动容易程度,选择容易采取行动的路线,并且移动。<<2.配置示例>><2.1.自主移动对象的硬件配置示例>接下来,将描述根据本公开的实施方式的自主移动对本文档来自技高网...

【技术保护点】
1.一种记录有程序的记录介质,所述程序使计算机用作:/n学习部,被配置为学习行动模型,所述行动模型用于基于环境信息和行动成本信息,来决定行动主体的行动,所述环境信息指示第一环境,所述行动成本信息指示当所述行动主体在所述第一环境中采取行动时的成本;以及/n决定部,被配置为基于所述环境信息和所述行动模型,来决定所述行动主体在所述第一环境中的行动。/n

【技术特征摘要】
【国外来华专利技术】20180417 US 62/658,783;20180726 US 16/046,4851.一种记录有程序的记录介质,所述程序使计算机用作:
学习部,被配置为学习行动模型,所述行动模型用于基于环境信息和行动成本信息,来决定行动主体的行动,所述环境信息指示第一环境,所述行动成本信息指示当所述行动主体在所述第一环境中采取行动时的成本;以及
决定部,被配置为基于所述环境信息和所述行动模型,来决定所述行动主体在所述第一环境中的行动。


2.根据权利要求1所述的记录介质,其中,
所述决定部基于所述环境信息预测所述行动成本信息,所述行动成本信息指示所述行动主体在所述第一环境中采取行动时的成本。


3.根据权利要求2所述的记录介质,其中,
所述学习部从所述环境信息中学习用于预测所述行动成本信息的预测模型,并且
通过将所述环境信息输入到所述预测模型中,来预测所述行动成本信息。


4.根据权利要求3所述的记录介质,其中,
所述环境信息包括通过对所述第一环境成像而获得的拍摄图像,并且
针对所述拍摄图像的每个分割的部分区域预测所述行动成本信息。


5.根据权利要求3所述的记录介质,其中,
通过将所述行动主体在所述第一环境中采取行动时对所述行动主体测量的第一测量信息与所述行动主体在第二环境中采取行动时对所述行动主体测量的第二测量信息进行比较,来计算所述行动成本信息。


6.根据权利要求5所述的记录介质,其中,
所述学习部学习所述预测模型,以最小化通过测量获得的所述行动成本信息和根据所述预测模型通过预测获得的所述行动成本信息之间的误差。


7.根据权利要求5所述的记录介质,其中,
所述第一测量信息和所述第二测量信息是基于移动距离、移动速度、耗电量、包括移动前后的坐标的运动矢量、旋转角度、角速度、振动和倾斜度中的至少任何一种的信息。


8.根据权利要求5所述的记录介质,所述记录介质上记录有使所述计算机进一步用作以下的程序:
更新确定部,被配置为基于通过测量获得的所述行动成本信息和根据所述预测模型通过预测获得的所述行动成本信息之间的误差,来确定是否更新所述预测模型。


9.根据权利要求8所述的记录介质,其中,
所述更新确定部基于用于计算所述行动成本信息的所述第二测量信...

【专利技术属性】
技术研发人员:大塚纯二児岛环
申请(专利权)人:索尼公司索尼电子公司
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1