一种基于文本相似度改进的原子能力匹配方法组成比例

技术编号：33044669 阅读：22 留言：0更新日期：2022-04-15 09:27

本发明专利技术公开一种基于文本相似度改进的原子能力匹配方法，将原子能力详情和匹配文本进行分词，再取其并集得到词组S；计算各分词在匹配文本和原子能力中的频率分别记为X，Y；计算各分词在原子能力库中的权重并使用关键词加强权重记为Z；4.向量值A=X*Z，向量值B=Y*Z；将向量组A和B根据以下公式求得相似度通过余弦相似度公式计算得出相似值，判断相似度是否大于设定值；是则，判定原子能力符合匹配文本；否则，判定原子能力不符合匹配文本。本发明专利技术根据原子能力特性更新了文本相似度算法，提高了算法的准确性；增加电信专有名词词典，提高了分词的准确性；新增可调节算法因子，提高算法的专业性；本发明专利技术支持多线程并发运算，提高计算效率。效率。效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文本相似度改进的原子能力匹配方法

[0001]本专利技术涉及计算机
，尤其涉及一种基于文本相似度改进的原子能力匹配方法。

技术介绍

[0002]原子能力(atomic ability，AA)是终端设备中可独立运行的最小能力单元。与传统应用程序(application，APP)相比，AA是用来为其他APP提供原子服务的新型应用，并且AA无用户界面(UI，User Interface)。分布式应用(distributed application)是指包括若干相对独立的原子能力的应用程序。另外，部署在一个终端设备中的AA，可能被部署在该终端设备或者其它终端设备中的APP调用。
[0003]电信业务中，用户在根据需求文档来选择需要使用的原子能力的卡位阶段，由于没有针对相应的原子能力匹配方法，使得用户在选择原子能力时无从入手。

技术实现思路

[0004]本专利技术的目的在于提供一种基于文本相似度改进的原子能力匹配方法。
[0005]本专利技术采用的技术方案是：
[0006]一种基于文本相似度改进的原子能力匹配方法，其包括以下步骤：
[0007]步骤1，将匹配文本进行分词并筛选出有实际意义的词，得到词组A；
[0008]具体地，以如下匹配文本为例：实现对整个场所的视频监控，并实现视频流的转发和存储。经过分词得到词组A：[实现,场所,视频,监控,实现,视频,转发,存储]。
[0009]步骤2，将原子能力详情进行分词，并筛选出有实际意义的词，得到词组B；<...

【技术保护点】

【技术特征摘要】
1.一种基于文本相似度改进的原子能力匹配方法，其特征在于：其包括以下步骤：步骤1，将匹配文本进行分词并筛选出有实际意义的词，得到词组A；步骤2，将原子能力详情进行分词，并筛选出有实际意义的词，得到词组B；步骤3，取词组A和词组B的并集，得到超集词组S。步骤4，遍历超集词组S计算匹配文本中各个分词的频率X以及原子能力详情中各个分词的频率Y；步骤5，权重的算法：遍历超集的词组计算超集中每个分词权重z＝x/y；其中，x为原子能力总数量为，y为存在当前对应分词的原子能力数量；步骤6，加强权重算法：获取原子能力的关键词组，判断超集中分词是否在关键词组；是则，获取关键词中对应分词的词频v，并计算对应分词的...

【专利技术属性】
技术研发人员：陈金灿，陈军，马龙，郑宗宇，
申请(专利权)人：中电福富信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人