【技术实现步骤摘要】
【国外来华专利技术】记录介质、信息处理设备和信息处理方法相关申请的交叉引用本申请要求2018年4月17日的临时申请号US62/658783的优先权的权益,其全部内容通过引用结合于此。本申请要求2018年7月26日的申请号US16/046485的优先权的权益,其全部内容通过引用结合于此。
本公开涉及记录介质、信息处理设备和信息处理方法。
技术介绍
近年来,已经开发了自主地采取行动的各种行动主体,例如,机器狗和无人机。例如,基于周围环境做出行动主体的行动决策。从抑制行动主体的功耗等的角度来看,期望一种使得行动决策更合适的技术。例如,下面列出的PTL1公开了与车辆轮胎的旋转控制相关的技术,并且执行反馈控制,以减小防止发生打滑而相对于光滑轮胎预先测量的扭矩值和行驶时实际测量的扭矩值之间的差值。引文列表专利文献PTL1:US2015/0112508A
技术实现思路
技术问题然而,在上面列出的PTL1中公开的技术难以应用于除了轮胎的旋转控制之外的控制,而且,这是在实际行驶之后执行的反馈控制。因此,原则上难以在行驶前预测扭矩值,并执行旋转控制。因此,上面列出的PTL1中公开的技术难以在未知环境中对轮胎适当地执行旋转控制。于是,本公开提供了允许行动主体更适当地决定行动的机制。问题解决方案根据本公开的实施方式,提供了一种记录有程序的记录介质,该程序使计算机用作:学习部,被配置为学习行动模型,用于基于指示第一环境的环境信息和指示当行动主体在第一环境中采取行动 ...
【技术保护点】
1.一种记录有程序的记录介质,所述程序使计算机用作:/n学习部,被配置为学习行动模型,所述行动模型用于基于环境信息和行动成本信息,来决定行动主体的行动,所述环境信息指示第一环境,所述行动成本信息指示当所述行动主体在所述第一环境中采取行动时的成本;以及/n决定部,被配置为基于所述环境信息和所述行动模型,来决定所述行动主体在所述第一环境中的行动。/n
【技术特征摘要】
【国外来华专利技术】20180417 US 62/658,783;20180726 US 16/046,4851.一种记录有程序的记录介质,所述程序使计算机用作:
学习部,被配置为学习行动模型,所述行动模型用于基于环境信息和行动成本信息,来决定行动主体的行动,所述环境信息指示第一环境,所述行动成本信息指示当所述行动主体在所述第一环境中采取行动时的成本;以及
决定部,被配置为基于所述环境信息和所述行动模型,来决定所述行动主体在所述第一环境中的行动。
2.根据权利要求1所述的记录介质,其中,
所述决定部基于所述环境信息预测所述行动成本信息,所述行动成本信息指示所述行动主体在所述第一环境中采取行动时的成本。
3.根据权利要求2所述的记录介质,其中,
所述学习部从所述环境信息中学习用于预测所述行动成本信息的预测模型,并且
通过将所述环境信息输入到所述预测模型中,来预测所述行动成本信息。
4.根据权利要求3所述的记录介质,其中,
所述环境信息包括通过对所述第一环境成像而获得的拍摄图像,并且
针对所述拍摄图像的每个分割的部分区域预测所述行动成本信息。
5.根据权利要求3所述的记录介质,其中,
通过将所述行动主体在所述第一环境中采取行动时对所述行动主体测量的第一测量信息与所述行动主体在第二环境中采取行动时对所述行动主体测量的第二测量信息进行比较,来计算所述行动成本信息。
6.根据权利要求5所述的记录介质,其中,
所述学习部学习所述预测模型,以最小化通过测量获得的所述行动成本信息和根据所述预测模型通过预测获得的所述行动成本信息之间的误差。
7.根据权利要求5所述的记录介质,其中,
所述第一测量信息和所述第二测量信息是基于移动距离、移动速度、耗电量、包括移动前后的坐标的运动矢量、旋转角度、角速度、振动和倾斜度中的至少任何一种的信息。
8.根据权利要求5所述的记录介质,所述记录介质上记录有使所述计算机进一步用作以下的程序:
更新确定部,被配置为基于通过测量获得的所述行动成本信息和根据所述预测模型通过预测获得的所述行动成本信息之间的误差,来确定是否更新所述预测模型。
9.根据权利要求8所述的记录介质,其中,
所述更新确定部基于用于计算所述行动成本信息的所述第二测量信...
【专利技术属性】
技术研发人员:大塚纯二,児岛环,
申请(专利权)人:索尼公司,索尼电子公司,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。