基于多粒度文本语义信息的运维项目管理方法技术

技术编号：30555419 阅读：51 留言：0更新日期：2021-10-30 13:36

本发明专利技术公开了一种基于多粒度文本语义信息的运维项目管理方法，包括步骤：S1.构建多粒度文本语义匹配模型；S2.得到项目信息摘要；S3.将项目信息摘要以及待匹配项目信息摘要输入到多粒度文本语义匹配模型中进行训练，使得多粒度文本语义匹配模型输出的项目信息相似度达到目标值；S4.得到待测项目信息摘要；S5.将待测项目信息摘要输入到多粒度文本语义匹配模型中得到待测运维项目信息的项目信息相似度；S6.判断项目信息相似度是否大于设定的阈值，若是，则待测运维项目为相似项目；若否，则待测运维项目为正常项目。本发明专利技术能够对相似的运维项目进行筛选，从而避免相似项目的重复申报，缩短了项目申报周期，降低了申报人力成本。本。本。

全部详细技术资料下载

【技术实现步骤摘要】
基于多粒度文本语义信息的运维项目管理方法

[0001]本专利技术涉及自然语言处理领域，具体涉及一种基于多粒度文本语义信息的运维项目管理方法。

技术介绍

[0002]深度学习中，文本匹配研究主要目的是判断两段文本的相似度关系，所以很多任务在一定程度上都可以抽象成文本匹配的问题，例如：信息搜索、自动问答、机器翻译、对话系统、复述识别等等。
[0003]Huang等人提出的DSSM(Deep Structured Semantic Models)模型最早将神经网络应用到文本匹配任务当中。该模型首先利用深度神经网络把Query和Document的词袋模型生成的向量表示为低维度的语义向量，然后通过余弦公式来计算两个向量的相似度。由于词袋模型生成的向量在进行表示的时候会丢失来自文本的上下文结构信息，因此，Shen等人利用卷积神经网络代替DSSM模型当中的多层感知机得到CDSSM模型。它采用单词序列作为模型的输入，通过词的n
‑
gram和卷积池化操作来捕获上下文关系。与DSSM相比，CDSSM的匹配精度得到了进一步的提高。为了能使模型记住长距离上的句子特征，Wan等人提出了一种基于双向长短时记忆网络(Bidirecti
‑
onal Long Short
‑
Term Memory，Bi
‑
LSTM)的多语义模型MV_LSTM。Hu等人提出的ARC
‑
II模型，首先对两段文本分别利用一维卷积来关注相邻的单词向量，然后将两个卷积后得到的张量...

【技术保护点】

【技术特征摘要】
1.一种基于多粒度文本语义信息的运维项目管理方法，其特征在于：包括如下步骤：S1.构建多粒度文本语义匹配模型；S2.采集运维项目信息并对运维项目信息进行摘要抽取，得到项目信息摘要；S3.将项目信息摘要以及待匹配项目信息摘要输入到多粒度文本语义匹配模型中进行训练，使得多粒度文本语义匹配模型输出的项目信息相似度达到目标值；S4.采集待测运维项目信息并对待测运维项目信息进行摘要抽取，得到待测项目信息摘要；S5.将待测项目信息摘要输入到多粒度文本语义匹配模型中得到待测运维项目信息的项目信息相似度；S6.判断待测运维项目信息的项目信息相似度是否大于设定的阈值，若是，则待测运维项目为相似项目，并进行提示；若否，则待测运维项目为正常项目。2.根据权利要求1所述的基于多粒度文本语义信息的运维项目管理方法，其特征在于：对运维项目信息进行摘要抽取前，对运维项目信息进行清洗处理，具体包括：剔除运维项目信息中申报违规的项目信息以及与运维项目无关的项目信息。3.根据权利要求1所述的基于多粒度文本语义信息的运维项目管理方法，其特征在于：所述步骤S3，具体包括：S31.分别对项目信息摘要以及待匹配项目信息摘要进行字嵌入处理，得到处理后的摘要数据；所述处理后的摘要数据包括处理后的项目信息摘要以及处理后的待匹配项目信息摘要；S32.对处理后的摘要数据进行目标粒度下的相似度特征提取，得到若干相似度特征张量；S33.对若干相似度特征张量进行结合，并对结合后的相似度特征张量进行加权处理，得到加权后的相似度特征张量；S34.计算加权后的相似度特征张量的项目信息相似度，使得所述项目信息相似度达到目标值。4.根据权利要求3所述的基于多粒度文本语义信息的运维项目管理方法，其特征在于：步骤S31中，所述字嵌入处理采用Bert字嵌入。5.根据权利要求3所述的基于多粒度文本语义信息的运维项目管理方法，其特征在于：步骤S32，具体包括：S321.对处理后的摘要数据进行字粒...

【专利技术属性】
技术研发人员：王文娟，吕乐宾，戴诚，赵伟，胥钟予，刘倩雯，胡洛娜，谭涵丹，
申请(专利权)人：国网重庆市电力公司信息通信分公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人