设备场景的更新方法和装置、存储介质及电子装置制造方法及图纸

技术编号:35518374 阅读:19 留言:0更新日期:2022-11-09 14:36
本发明专利技术公开了一种设备场景的更新方法和装置、存储介质及电子装置,涉及智慧家庭技术领域,该设备场景的更新方法包括:获取目标对象的行为数据;其中,行为数据用于指示目标对象在执行第一设备场景之前或者后主动操作除第一设备场景对应设备之外的其他设备的操作动作;通过预设的场景自学习模型确定行为数据对应的更新参数;其中,更新参数用于确定是否对第一设备场景执行场景更新;在确定更新参数大于预设更新参数的情况下,确定行为数据对应的子场景,并将子场景添加至第一设备场景中,得到第二设备场景,解决了相关技术中无法实现在现有设备场景的基础上主动进行场景的自我更新的问题。更新的问题。更新的问题。

【技术实现步骤摘要】
设备场景的更新方法和装置、存储介质及电子装置


[0001]本专利技术涉及智慧家庭
,具体而言,涉及一种设备场景的更新方法和装置、存储介质及电子装置。

技术介绍

[0002]现在随着智能家电的快速发展,用户场景的使用也越来越广泛,例如:晚上回家场景,触发打开灯,关闭窗帘。离家场景,关闭灯,关闭电视灯。但是,常规的用户场景定义好后不具备自我更新功能,在用户执行完场景后还需要进行额外的操作,就需要手动去执行。并且多次使用后场景也不会进行自我更新。
[0003]因此,针对相关技术中,无法实现在现有设备场景的基础上主动进行场景的自我更新的问题,尚未提出有效的解决方案。

技术实现思路

[0004]本专利技术实施例提供了一种设备场景的更新方法和装置、存储介质及电子装置,以至少解决相关技术中,无法实现在现有设备场景的基础上主动进行场景的自我更新的问题。
[0005]根据本专利技术实施例的一个实施例,提供了一种设备场景的更新方法,包括:获取目标对象的行为数据;其中,所述行为数据用于指示目标对象在执行第一设备场景之前或者后主动操作除所述第一设备场景对应设备之外的其他设备的操作动作;通过预设的场景自学习模型确定所述行为数据对应的更新参数;其中,所述更新参数用于确定是否对所述第一设备场景执行场景更新;在确定所述更新参数大于预设更新参数的情况下,确定所述行为数据对应的子场景,并将所述子场景添加至所述第一设备场景中,得到第二设备场景。
[0006]在一个示例性实施例中,通过预设的场景自学习模型确定所述行为数据对应的更新参数,包括:通过第一计算方式得到所述行为数据对应的当前回报值;基于所述当前回报值对预设值函数进行更新,得到所述行为数据对应的值函数;在确定所述目标对象对应的当前行为状态的情况下,通过所述预设的场景自学习模型结合所述值函数、所述当前行为状态、所述当前回报值对所述行为数据进行策略决策,并基于所述策略决策的结果确定更新参数。
[0007]在一个示例性实施例中,通过预设第一计算方式得到所述行为数据对应的当前回报值,包括:获取预设的场景自学习模型对应的回报标准数据,其中,所述回报标准数据包括:不同操作动作对应的历史回报值以及回报系数;匹配所述回报标准数据和所述行为数据,确定所述行为数据对应的操作动作的目标历史回报值以及目标回报系数;计算所述目标历史回报值与所述目标回报系数的乘积,以得到所述行为数据对应的当前回报值。
[0008]在一个示例性实施例中,通过所述预设的场景自学习模型结合所述值函数、所述当前行为状态、所述当前回报值对所述行为数据进行策略决策,包括:在确定所述行为数据包括一个其他设备的操作动作的情况下,确定选择所述行为数据作为设备场景的期望回报
值;比较所述期望回报值与所述当前回报值的回报差值,在所述回报差值小于预设差值的情况下,允许使用所述行为数据生成用于指示其他设备对应场景动作的子场景;或,在确定所述行为数据包括多个其他设备的多组操作动作的情况下,将所述行为数据根据设备类型划分为多个子行为数据;确定在所述当前行为状态下选择每一个子行为数据作为设备场景的期望回报值,得到多个期望回报值;从所述多个期望回报值中确定出最大回报值,使用所述最大回报值对应的目标子行为数据生成子场景。
[0009]在一个示例性实施例中,在确定所述更新参数大于预设更新参数的情况下,确定所述行为数据对应的子场景,并将所述子场景添加至所述第一设备场景中,得到更新后的第二设备场景之前,上述方法还包括:在所述目标对象完成执行所述第一设备场景之后保持场景执行状态的情况下,确定存在与所述第一设备场景连续的第三设备场景,并确定所述第三设备场景包含的子场景的场景信息;在所述场景信息中存在所述子场景的情况下,停止将所述第一设备场景更新为所述第二设备场景;在所述场景信息中不存在所述子场景的情况下,将所述第一设备场景更新为所述第二设备场景。
[0010]在一个示例性实施例中,在确定所述更新参数大于预设更新参数的情况下,确定所述行为数据对应的子场景,并将所述子场景添加至所述第一设备场景中,得到更新后的第二设备场景之后,包括:在目标对象已执行过所述第二设备场景的情况下,获取所述目标对象的反馈信息;基于所述反馈信息确定将所述第一设备场景更新为所述第二设备场景是否符合所述目标对象的场景需求。
[0011]根据本专利技术实施例的另一个实施例,还提供了一种设备场景的更新装置,包括:获取模块,用于获取目标对象的行为数据;其中,所述行为数据用于指示目标对象在执行第一设备场景之前或者后主动操作除所述第一设备场景对应设备之外的其他设备的操作动作;第一确定模块,用于通过预设的场景自学习模型确定所述行为数据对应的更新参数;其中,所述更新参数用于确定是否对所述第一设备场景执行场景更新;添加模块,用于在确定所述更新参数大于预设更新参数的情况下,确定所述行为数据对应的子场景,并将所述子场景添加至所述第一设备场景中,得到第二设备场景。
[0012]在一个示例性实施例中,上述第一确定模块,还用于通过第一计算方式得到所述行为数据对应的当前回报值;基于所述当前回报值对预设值函数进行更新,得到所述行为数据对应的值函数;在确定所述目标对象对应的当前行为状态的情况下,通过所述预设的场景自学习模型结合所述值函数、所述当前行为状态、所述当前回报值对所述行为数据进行策略决策,并基于所述策略决策的结果确定更新参数。
[0013]在一个示例性实施例中,上述第一确定模块包括:计算单元,用于获取预设的场景自学习模型对应的回报标准数据,其中,所述回报标准数据包括:不同操作动作对应的历史回报值以及回报系数;匹配所述回报标准数据和所述行为数据,确定所述行为数据对应的操作动作的目标历史回报值以及目标回报系数;计算所述目标历史回报值与所述目标回报系数的乘积,以得到所述行为数据对应的当前回报值。
[0014]在一个示例性实施例中,上述第一确定模块还包括:决策单元,用于在确定所述行为数据包括一个其他设备的操作动作的情况下,确定在所述当前行为状态下选择所述行为数据作为设备场景的期望回报值;比较所述期望回报值与所述当前回报值的回报差值,在所述回报差值小于预设差值的情况下,允许使用所述行为数据生成用于指示其他设备对应
场景动作的子场景;或,在确定所述行为数据包括多个其他设备的多组操作动作的情况下,将所述行为数据根据设备类型划分为多个子行为数据;确定在所述当前行为状态下选择每一个子行为数据作为设备场景的期望回报值,得到多个期望回报值;从所述多个期望回报值中确定出最大回报值,使用所述最大回报值对应的目标子行为数据生成子场景。
[0015]在一个示例性实施例中,上述装置还包括:第二确定模块,用于在所述目标对象完成执行所述第一设备场景之后保持场景执行状态的情况下,确定存在与所述第一设备场景连续的第三设备场景,并确定所述第三设备场景包含的子场景的场景信息;在所述场景信息中存在所述子场景的情况下,停止将所述第一设备场景更新为所述第二设备场景;在所述场景信息中不存在所述子场景的情况下,执本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种设备场景的更新方法,其特征在于,包括:获取目标对象的行为数据;其中,所述行为数据用于指示目标对象在执行第一设备场景之前或者后主动操作除所述第一设备场景对应设备之外的其他设备的操作动作;通过预设的场景自学习模型确定所述行为数据对应的更新参数;其中,所述更新参数用于确定是否对所述第一设备场景执行场景更新;在确定所述更新参数大于预设更新参数的情况下,确定所述行为数据对应的子场景,并将所述子场景添加至所述第一设备场景中,得到第二设备场景。2.根据权利要求1所述的设备场景的更新方法,其特征在于,通过预设的场景自学习模型确定所述行为数据对应的更新参数,包括:通过第一计算方式得到所述行为数据对应的当前回报值;基于所述当前回报值对预设值函数进行更新,得到所述行为数据对应的值函数;在确定所述目标对象对应的当前行为状态的情况下,通过所述预设的场景自学习模型结合所述值函数、所述当前行为状态、所述当前回报值对所述行为数据进行策略决策,并基于所述策略决策的结果确定更新参数。3.根据权利要求2所述的设备场景的更新方法,其特征在于,通过第一计算方式得到所述行为数据对应的当前回报值,包括:获取预设的场景自学习模型对应的回报标准数据,其中,所述回报标准数据包括:不同操作动作对应的历史回报值以及回报系数;匹配所述回报标准数据和所述行为数据,确定所述行为数据对应的操作动作的目标历史回报值以及目标回报系数;计算所述目标历史回报值与所述目标回报系数的乘积,以得到所述行为数据对应的当前回报值。4.根据权利要求2所述的设备场景的更新方法,其特征在于,通过所述预设的场景自学习模型结合所述值函数、所述当前行为状态、所述当前回报值对所述行为数据进行策略决策,包括:在确定所述行为数据包括一个其他设备的操作动作的情况下,确定在所述当前行为状态下选择所述行为数据作为设备场景的期望回报值;比较所述期望回报值与所述当前回报值的回报差值,在所述回报差值小于预设差值的情况下,允许使用所述行为数据生成用于指示其他设备对应场景动作的子场景;或,在确定所述行为数据包括多个其他设备的多组操作动作的情况下,将所述行为数据根据设备类型划分为多个子行为数据;确定在所述当前行为状态下选择每一个子行为数据作为设备场景的期望回报值,得到多个期望回报值;从所述多个期望回报值中确定出最大回报值,使用所述最大回报值对应的目标子行为数据生成子场景。5.根据权利要求1所述的设备场景的更新方法,其特征在于,在确定所述更新参数大于预...

【专利技术属性】
技术研发人员:周杰
申请(专利权)人:海尔智家股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1