面向性能衰退时间序列数据的可借用样本筛选方法和系统技术方案

技术编号:29759472 阅读:43 留言:0更新日期:2021-08-20 21:12
本发明专利技术公开一种面向性能衰退时间序列数据的可借用样本筛选方法,涉及人工智能与数据处理技术领域,包括对采集目标相似产品当前的产品数据及数据库中保存的同类型相似产品的全寿产品数据分别按M个不同平滑尺度进行平滑处理,通过对每个处理结果进行双指标综合评估,实现时间尺度自优化选择,最终获得可借用样本。本发明专利技术方法能够自动给出性能衰退序列数据的最佳平滑尺度,解决由于大尺度平滑引起的退化趋势信息丢失和小尺度过滤噪声对准确预测的负面影响;同时还能够从其他域大量差异化数据中获得与性能衰退序列数据最相似样本,进而增强模型的泛化能力,提高预测的精准度,解决了目前无法利用相似样本进行精准预测的问题。

【技术实现步骤摘要】
面向性能衰退时间序列数据的可借用样本筛选方法和系统
本专利技术涉及人工智能与数据处理
,尤其涉及可借用样本的筛选方法。
技术介绍
迁移学习在文本分类、情感分类和强化学习等领域都取得了显著的成果。然而,这些迁移学习方法大多用于解决分类问题,通过类似样本加权的方法将两个领域不同统计分布的数据进行分布对齐来逼近相似性。但是,性能衰退序列数据和类别数据存在明显区别,也不符合一定的统计分布规律,已有的类别数据迁移学习方法无法用于性能衰退序列数据。因此,针对性能衰退数据特点和预测任务需求,从序列间距离、角度、当前和未来趋势等多个方面,研究如何定义和度量数据可借用性,并用于设计可借用样本的筛选策略,从其他域大量差异化数据中获得最相似的样本,具有重大意义和应用需求。本领域一般将对预测有用的信息通常定义为对性能退化趋势敏感的信息。由于多种因素(如传感器、数据采集装置、剖面振动等)引起的噪声和干扰信号,有用的信息隐藏在原始数据中,导致很难直接通过原始数据获得较高的精度。因此,提出了多种数据平滑方法,包括移动平均法、指数平滑法、指数移动平均法、局部加权回归法(LWR)等。尽管LWR在根据曲线形状和序列关系进行自适应平滑方面拥有较大优势,并且有利于避免末端效应问题,可以突出退化趋势,进一步提高预测精度,但是基于LWR数据平滑方法的时间尺度通常是根据专家经验手动设置的,因此误差较大,平滑效果和效率低。
技术实现思路
为从其他域大量差异化数据中获得最相似的样本,本专利技术提供一种筛选可借用性能衰退序列数据的方法,本专利技术方法能够自动给出性能衰退序列数据的最佳平滑尺度,解决由于大尺度平滑引起的退化趋势信息丢失和小尺度过滤噪声对准确预测的负面影响;同时还能够从其他域大量差异化数据中获得与性能衰退序列数据最相似的样本,进而增强模型的泛化能力,提高预测的精准度,解决了目前无法利用相似样本进行精准预测的问题。为实现本专利技术的技术目的,本专利技术提供一种面向性能衰退时间序列数据的可借用样本筛选方法,其特征在于,包括:通过采集目标相似产品当前的产品数据,得到目标相似产品的性能衰退时间序列数据;将数据库中保存的同类型相似产品的N条全寿产品数据作为其他域差异化时间序列数据;按M个不同平滑尺度分别对一条性能衰退时间序列数据进行平滑处理,得到M条性能衰退时间序列的平滑数据;按M个不同时间尺度分别对N条其他域差异化时间序列数据进行平滑处理,得到N组且每组具有M条的其他域差异化时间序列平滑数据;利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据,得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集,将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域;利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据,得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集,将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据,形成具有N条其他域差异化时间序列平滑数据的源域;通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理,将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本;其中所述M和N是大于2的正整数。特别是,所述利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据,得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集包括:利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据获得每条性能衰退时间序列的平滑数据的均方根误差值和平滑度值;应用系数变异法计算均方根误差值和平滑度值的权重值,并对均方根误差值和平滑度值进行归一化,根据得到的均方根误差值和平滑度值的权重值与归一化后的均方根误差值和平滑度值计算得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值。具体的,所述利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据,得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集包括:利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据获得每条其他域差异化时间序列平滑数据的均方根误差值和平滑度值;应用系数变异法计算均方根误差值和平滑度值的权重值,并对均方根误差值和平滑度值进行归一化,根据得到的均方根误差值和平滑度值的权重值与归一后的均方根误差值和平滑度值计算得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集特别是,所述通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理包括:在源域中截取与目标域具有相同时间序列的N条截断数据;计算每条截断数据与目标域数据的余弦距离,获得每条截断数据的余弦距离值。特别是,所述将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本是选择余弦距离值最低的截断数据所对应的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本。为实现本专利技术的技术目的,本专利技术再提供一种一种面向性能衰退时间序列数据的可借用样本筛选系统,其特征在于,包括:数据采集单元,用于采集目标相似产品当前产品数据作为性能衰退时间序列数据,采集数据库中保存的同类型相似产品的全寿产品数据作为其他域差异化时间序列数据;数据处理单元,按不同平滑尺度分别对性能衰退时间序列数据进行平滑处理,得到多条性能衰退时间序列的平滑数据,按不同平滑尺度分别对多个其他域差异化数据进行平滑处理,得到多组其他域差异化时间序列平滑数据;样本自动筛选单元,用于自动根据数据处理单元中输入的多条性能衰退时间序列的平滑数据和多组其他域差异化时间序列平滑数据进行筛选,获得性能衰退序列数据的可借用样本;其中,样本自动筛选模块包括:数据评选模块,用于利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据,得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集,将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域;利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据,得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集,将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据,形成具有N条其他域差异化时间序列平滑数据的源域;;数据匹配模块,通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理;样本输出模块,用于将源域中匹配度最高的一条其他域差异化本文档来自技高网...

【技术保护点】
1.一种面向性能衰退时间序列数据的可借用样本筛选方法,其特征在于,包括:/n通过采集目标相似产品当前的产品数据,得到目标相似产品的性能衰退时间序列数据;/n将数据库中保存的同类型相似产品的N条全寿产品数据作为其他域差异化时间序列数据;/n按M个不同平滑尺度分别对一条性能衰退时间序列数据进行平滑处理,得到M条性能衰退时间序列的平滑数据;/n按M个不同时间尺度分别对N条其他域差异化时间序列数据进行平滑处理,得到N组且每组具有M条的其他域差异化时间序列平滑数据;/n利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据,得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集,将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域;/n利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据,得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集,将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据,形成具有N条其他域差异化时间序列平滑数据的源域;/n通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理,将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本;/n其中所述M和N是大于2的正整数。/n...

【技术特征摘要】
20200612 CN 20201053673661.一种面向性能衰退时间序列数据的可借用样本筛选方法,其特征在于,包括:
通过采集目标相似产品当前的产品数据,得到目标相似产品的性能衰退时间序列数据;
将数据库中保存的同类型相似产品的N条全寿产品数据作为其他域差异化时间序列数据;
按M个不同平滑尺度分别对一条性能衰退时间序列数据进行平滑处理,得到M条性能衰退时间序列的平滑数据;
按M个不同时间尺度分别对N条其他域差异化时间序列数据进行平滑处理,得到N组且每组具有M条的其他域差异化时间序列平滑数据;
利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据,得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集,将第一双综合评估值集中的最小值对应的性能衰退时间序列的平滑数据选作目标域;
利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据,得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集,将选择得到的每组中第二双指标综合评估值集中的最小值所对应的其他域差异化时间序列平滑数据,形成具有N条其他域差异化时间序列平滑数据的源域;
通过将源域中的N条其他域差异化时间序列的平滑数据分别与目标域中的一条性能衰退时间序列的平滑数据进行匹配处理,将源域中匹配度最高的一条其他域差异化时间序列的平滑数据作为性能衰退序列数据的可借用样本;
其中所述M和N是大于2的正整数。


2.如权利要求1所述的面向性能衰退时间序列数据的可借用样本筛选方法,其特征在于,利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据,得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值集包括:
利用所述一条性能衰退时间序列数据和所述M条性能衰退时间序列平滑数据获得每条性能衰退时间序列的平滑数据的均方根误差值和平滑度值;
应用系数变异法计算均方根误差值和平滑度值的权重值,并对均方根误差值和平滑度值进行归一化,根据得到的均方根误差值和平滑度值的权重值与归一化后的均方根误差值和平滑度值计算得到对M个性能衰退时间序列平滑数据进行选择的第一双指标综合评估值。


3.如权利要求1所述的面向性能衰退时间序列数据的可借用样本筛选方法,其特征在于,所述利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据,得到分别对每组中的M条其他域差异化时间序列平滑数据的进行选择的第二双指标综合评估值集包括:
利用所述N条其他域差异化时间序列数据和N组且每组具有M条的其他域差异化时间序列平滑数据获得每条其他域差异化时间序列平滑数据的...

【专利技术属性】
技术研发人员:马剑刘学邹新宇尚芃超丁宇吕琛
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1