一种基于深度学习的化妆品防腐剂智能选择方法技术

技术编号：38087458 阅读：30 留言：0更新日期：2023-07-06 08:56

本发明专利技术公开一种基于深度学习的化妆品防腐剂智能选择方法，包括如下步骤：步骤S1，首先采集现有的化妆品成分数据，其次对采集到的数据进行预处理，然后将预处理后的数据随机划分成训练集、验证集和测试集；步骤S2，构建BERT多标签分类模型，将训练集和验证集输入到模型中进行训练，使用测试集评估模型；步骤S3，将已确定的化妆品成分输入到训练好的BERT多标签分类模型中，输出一种或多种适宜的防腐剂类别。该方法能够帮助化妆品研发人员选择适宜的防腐剂类型，缩短研发周期，减少研发成本，其采用注意力机制和经过预训练之后的BERT模型，提高了模型的预测性能。了模型的预测性能。了模型的预测性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的化妆品防腐剂智能选择方法

[0001]本专利技术属于人工智能
，尤其涉及一种基于深度学习的化妆品防腐剂智能选择方法。

技术介绍

[0002]化妆品中含有大量的营养成分，为微生物的生长和繁殖提供了适宜的条件。然而从化妆品打开到丢弃的整个过程里，消费者用未消过毒的手指或工具接触产品，化妆品非常容易被进一步污染。因此在化妆品之中加入一定量的防腐剂来抑制微生物是非常必要的。
[0003]目前防腐剂添加主要依靠研究人员的经验和多次试验，并且化妆品使用的防腐剂具有多样性和一定程度的复配性，因此选择适宜的防腐剂势必会耗费大量的时间和成本。而随着计算机网络技术的飞速发展，深度学习方法已经被广泛应用到各个领域，本专利技术采用深度学习的方法准确选择化妆品适用的防腐剂，节省了大量的研发时间和成本，对化妆品研发工作具有重要的意义。

技术实现思路

[0004]本专利技术的目的，在于提供一种基于深度学习的化妆品防腐剂智能选择方法，能够帮助化妆品研发人员选择适宜的防腐剂类别，其采用注意力机制和经过预训练之后的BERT模型，提高了模型的预测性能，从而提高智能选择结果的准确性。
[0005]为了达成上述目的，本专利技术的解决方案是：
[0006]一种基于深度学习的化妆品防腐剂智能选择方法，包括如下步骤：
[0007]步骤S1，首先采集现有的化妆品成分数据，其次对采集到的数据进行预处理，然后将预处理后的数据随机划分成训练集、验证集和测试集；
[0008]步骤S2，构建BER...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的化妆品防腐剂智能选择方法，其特征在于包括如下步骤：步骤S1，首先采集现有的化妆品成分数据，其次对采集到的数据进行预处理，然后将预处理后的数据随机划分成训练集、验证集和测试集；步骤S2，构建BERT多标签分类模型，将训练集和验证集输入到模型中进行训练，使用测试集评估模型，直至得到训练好的符合收敛条件的BERT多标签分类模型；步骤S3，将已确定的化妆品成分输入到训练好的BERT多标签分类模型中，输出一种或多种适宜的防腐剂类别。2.如权利要求1所述的基于深度学习的化妆品防腐剂智能选择方法，其特征在于：所述步骤S1中，采集现有的化妆品成分数据，包括，采用爬虫程序在网站上爬取化妆品成分的数据。3.如权利要求1所述的基于深度学习的化妆品防腐剂智能选择方法，其特征在于：所述步骤S1中，对采集到的数据进行预处理，包括：首先，数据清理：采用re库的正则表达式过滤掉数据中无意义的字符；其次，中英文字符转换：将成分中的英文字符转换为中文；再次，标签提取：将防腐剂按类别存储在列表中，再利用python的正则表达式匹配化妆品的每一个成分，从而提取出所有防腐剂；创建字典，将所提取的防腐剂映射到相应的类别，最终得到防腐剂类别作为标签；最后，特征提取：为化妆品的成分设定一个固定长度，并将其作为模型的输入。4.如权利要求1所述的基于深度学习的化妆品防腐剂智能选择方法，其特征在于：所述步骤S2中，构建的BERT多标签分类模型架构包含12个编码层和1个全连接层，其中每个编码层都由多头注意力机制、残差连接和层归一化、全连接层、残差连接和层归一化四个结构组成，编码层从输入的文本中获得包含上下文语义信息的句向量，全连接层将分布式特征表示映射到样本的标记空间，输出相应类别。5.如权利要求4所述的基于深度学习的化妆品防腐剂智能选择方法，其特征在于：所述BERT多标签分类模型的建模过程是：步骤S2
‑
1，调用经过中文预训练的BERT分词器，该分词器首先对文本进行分词，然后利用BERT固定词库将分词后的token映射为对应的ID，最终得到文本的词嵌入、分割嵌入和位置嵌入，将这三个嵌入以组合的方式作为模型的输入；步骤S2
‑
2，BERT多标签分类模型计算输入中所有词的相关度，基于相关度进一步计算单头自注意力值向量；步骤S2
‑
3，BERT多标签分类模型中的多头注意力机制将多个不同的单头自注意力值向量连接成一个向量，并与权重矩阵相乘，再经过残差连接和层归一化输入到全连接层进行降维输出，再将输出结果经过残差连接和层归一化，就得到嵌入全文语义特征的词向量，该向量与输入矩阵的维度相；步骤S2
‑
4，将最后一个编码器输出的词向量输入到全连接层中，输出预测概率大于设定值的类别。6.如权利要求5所述的基于深度学习的化妆品防腐剂智能选择方法，其特征在于：所述步骤S2
‑
2的具体内容是：步骤S2
‑2‑
1，将输入矩阵X分别与查询向量矩阵W
Q
，键向量矩阵W
K
，值向量矩阵W
V
相乘，
得到Q，K...

【专利技术属性】
技术研发人员：赵鸿萍，杜克，司婉雨，唐丽，王倩，顾天骄，傅远鹏，王尔安，
申请(专利权)人：中国药科大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人