一种汽车空调温度调节方法及系统技术方案

技术编号:34086994 阅读:47 留言:0更新日期:2022-07-11 20:15
本发明专利技术公开了一种汽车空调温度调节方法及系统,方法包括:按照预设时间周期,采集车辆内的当前环境状态数据,构建当前环境状态向量;从预设的奖励值表确定与当前环境状态向量对应的所有奖励值中的最大值,将最大值对应的目标温度作为当前目标温度;实时检测当前目标温度维持的第一时长,根据第一时长确定奖励调整值,并根据奖励调整值更新与当前环境状态向量对应的所有奖励值中的最大值;实时检测新目标温度维持的第二时长,当第二时长大于第一时长时,增大对应的奖励值;按照预设的周期,重复前述步骤,动态调整空调目标温度。本发明专利技术基于目标温度的维持时间来获知用户对空调温度调节策略的反馈,并更新奖励值表,温度调节更符合用户感知。合用户感知。合用户感知。

【技术实现步骤摘要】
一种汽车空调温度调节方法及系统


[0001]本专利技术属于汽车空调领域,具体涉及一种汽车空调温度调节方法及系统。

技术介绍

[0002]汽车车内空调温度控制,一般是由用户手动输入设置空调目标温度值,然而输入的目标温度值未必是适合用户的最佳温度,用户在后续过程中可能还需要继续地、甚至反复地进行调整。
[0003]还有一种方法是基于车外温度确定空调温度,自主调节车内空调温度,这种方法虽然能智能化调节车内空调温度,不需要用户输入,但是不同的用户对温度的舒适性感知并不相同,相同的环境温度下有的人感觉到热,但有的人感觉到冷或正好舒适,这种基于车外温度来确定目标温度的控制策略相对固定化,并不能准确地输出符合用户感知和温度环境的空调温度。

技术实现思路

[0004]本专利技术实施例所要解决的技术问题在于,提供一种汽车空调温度调节方法及系统,以解决现有的汽车空调调节方法不能准确地输出符合用户感知和温度环境的空调温度的问题。
[0005]为解决上述技术问题,本专利技术提供一种汽车空调温度调节方法,包括:
[0006]步骤S1,按照预设时间周期,采集车辆内的当前环境状态数据,构建当前环境状态向量,所述当前环境状态数据包括当前车内温度、乘车人数和当前车外温度;
[0007]步骤S2,从预设的奖励值表确定与所述当前环境状态向量对应的所有奖励值中的最大值,将所述最大值对应的目标温度作为当前目标温度;
[0008]步骤S3,将空调的目标温度设置为所述当前目标温度,实时检测所述当前目标温度维持的第一时长,根据所述第一时长确定奖励调整值,并根据所述奖励调整值更新与所述当前环境状态向量对应的所有奖励值中的最大值;
[0009]步骤S4,获取所述当前目标温度被用户调整后的新目标温度,并实时检测所述新目标温度维持的第二时长,当所述第二时长大于所述第一时长时,增大所述奖励值表中所述当前环境状态向量所对应的奖励值;
[0010]步骤S5,按照预设的周期,重复步骤S1

步骤S4,动态调整空调目标温度。
[0011]进一步地,所述预设的奖励值表包括若干个奖励值Q(S,T),每一个奖励值Q与一个环境状态向量S和一个目标温度T对应,其中,所述环境状态向量S=[T
IN
,C
P
,T
OUT
],T
IN
为车内温度,C
P
为乘车人数,T
OUT
为车外温度。
[0012]进一步地,所述步骤S2具体包括:随机生成一参考值x∈[0,1],当x>A时,从所述奖励值表确定与所述当前环境状态向量S
r
对应的所有奖励值中的最大值Q
max
,Q
max
所对应的目标温度作为当前目标温度T
aim
,A为预设的探索系数,A∈[0,1]。
[0013]进一步地,所述步骤S5还包括:
[0014]当更新的探索系数与更新之前的探索系数比值在[1

δ,1]区间时,按照预设的周期,根据所述当前环境状态向量S
r
对应的所有奖励值中的最大值Q
max
确定当前目标温度T
aim
,动态调整空调目标温度,δ为预设的极小值。
[0015]进一步地,所述步骤S2还包括:当x≤A时,在所述奖励值表与所述当前环境状态向量S
r
对应的所有目标温度中随机选定一个目标温度作为当前目标温度T
aim

[0016]所述步骤S3还包括:将所述探索系数A的值更新为A


[0017][0018]其中,r
decay
为预设的探索系数衰减系数,r
decay
取值为[0,1],global_step为探索系数的更新次数,decay_step为预设的衰减总步数。
[0019]进一步地,所述奖励调整值R(S,T)的计算方法如下:
[0020][0021]其中,T
d
为预设时长,ΔT为第一时长;
[0022]所述根据奖励调整值更新与所述当前环境状态向量对应的所有奖励值中的最大值具体为:将所述奖励值R(S
r
,T
aim
)与所述最大值Q
max
相加,得到更新的奖励值Q
new

[0023]一种汽车空调温度调节系统,包括:
[0024]环境状态向量构建单元,用于按照预设时间周期,采集车辆内的当前环境状态数据,构建当前环境状态向量,所述当前环境状态数据包括当前车内温度、乘车人数和当前车外温度;
[0025]目标温度确定单元,用于从预设的奖励值表确定与所述当前环境状态向量对应的所有奖励值中的最大值,将所述最大值对应的目标温度作为当前目标温度;
[0026]第一奖励值调整单元,用于将空调的目标温度设置为所述当前目标温度,实时检测所述当前目标温度维持的第一时长,根据所述第一时长确定奖励调整值,并根据所述奖励调整值更新与所述当前环境状态向量对应的所有奖励值中的最大值;
[0027]第二奖励值调整单元,用于获取所述当前目标温度被用户调整后的新目标温度,并实时检测所述新目标温度维持的第二时长,当所述第二时长大于所述第一时长时,增大所述奖励值表中所述当前环境状态向量所对应的奖励值;
[0028]目标温度调整单元,用于按照预设的周期,重复步骤S1

步骤S4,动态调整空调目标温度。
[0029]进一步地,所述的汽车空调温度调节系统还包括奖励值存储单元,用于存储所述预设的奖励值表,所述奖励值表包括若干个奖励值Q(S,T),每一个奖励值Q与一个环境状态向量S和一个目标温度T对应,其中,所述环境状态向量S=[T
IN
,C
P
,T
OUT
],T
IN
为车内温度,C
P
为乘车人数,T
OUT
为车外温度。
[0030]进一步地,所述目标温度确定单元,具体用于随机生成一参考值x∈[0,1],当x>A时,从所述奖励值表确定与所述当前环境状态向量S
r
对应的所有奖励值中的最大值Q
max
,Q
max
所对应的目标温度作为当前目标温度T
aim
,A为预设的探索系数,A∈[0,1]。
[0031]进一步地,所述目标温度调整单元,还用于当更新的探索系数与更新之前的探索系数比值在[1

δ,1]区间时,按照预设的周期,根据所述当前环境状态向量S
r
对应的所有奖励值中的最大值Q
max
确定当前目标温度T
aim
,动态调整空调目标温度,δ为预设的极小值。
[0032]进一步地,所述目标温度确定单元,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种汽车空调温度调节方法,其特征在于,包括:步骤S1,按照预设时间周期,采集车辆内的当前环境状态数据,构建当前环境状态向量,所述当前环境状态数据包括当前车内温度、乘车人数和当前车外温度;步骤S2,从预设的奖励值表确定与所述当前环境状态向量对应的所有奖励值中的最大值,将所述最大值对应的目标温度作为当前目标温度;步骤S3,将空调的目标温度设置为所述当前目标温度,实时检测所述当前目标温度维持的第一时长,根据所述第一时长确定奖励调整值,并根据所述奖励调整值更新与所述当前环境状态向量对应的所有奖励值中的最大值;步骤S4,获取所述当前目标温度被用户调整后的新目标温度,并实时检测所述新目标温度维持的第二时长,当所述第二时长大于所述第一时长时,增大所述奖励值表中所述当前环境状态向量所对应的奖励值;步骤S5,按照预设的周期,重复步骤S1

步骤S4,动态调整空调目标温度。2.根据权利要求1所述的汽车空调温度调节方法,其特征在于,所述预设的奖励值表包括若干个奖励值Q(S,T),每一个奖励值Q与一个环境状态向量S和一个目标温度T对应,其中,所述环境状态向量S=[T
IN
,C
P
,T
OUT
],T
IN
为车内温度,C
P
为乘车人数,T
OUT
为车外温度。3.根据权利要求1所述的汽车空调温度调节方法,其特征在于,所述步骤S2具体包括:随机生成一参考值x∈[0,1],当x>A时,从所述奖励值表确定与所述当前环境状态向量S
r
对应的所有奖励值中的最大值Q
max
,Q
max
所对应的目标温度作为当前目标温度T
aim
,A为预设的探索系数,A∈[0,1]。4.根据权利要求3所述的汽车空调温度调节方法,其特征在于,所述步骤S5还包括:当更新的探索系数与更新之前的探索系数比值在[1

δ,1]区间时,按照预设的周期,根据所述当前环境状态向量S
r
对应的所有奖励值中的最大值Q
max
确定当前目标温度T
aim
,动态调整空调目标温度,δ为预设的极小值。5.根据权利要求3所述的汽车空调温度调节方法,其特征在于,所述步骤S2还包括:当x≤A时,在所述奖励值表与所述当前环境状态向量S
r
对应的所有目标温度中随机选定一个目标温度作为当前目标温度T
aim
;所述步骤S3还包括:将所述探索系数A的值更新为A

:其中,r
decay
为预设的探索系数衰减系数,r
decay
取值为[0,1],global_step为探索系数的更新次数,decay_step为预设的衰减总步数。6.根据权利要求1

5任一所述的汽车空调温度调节方法,其特征在于,所述奖励调整值R(S,T)的计算方法如下:其中,T
d
为预设时长,ΔT为第一时长;
所述根据奖励调整值更新与所述当前环境状态向量对应的所有奖励值中的最大值具体为:将所述奖励值R(S
r
,T
aim
)与所述最大值Q
max
相加,得到更新的奖励值Q
new
。7.一种汽车空调温度调节系统,其特征在于,包括:环境状态向量构建单元,用...

【专利技术属性】
技术研发人员:陈超何小军辛聪李璐陈烯桐黄昊
申请(专利权)人:广州汽车集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1