语意相似度计算方法技术

技术编号：26763951 阅读：58 留言：0更新日期：2020-12-18 23:32

一种语意相似度计算方法，包括下列步骤，首先，输入待解析的语句，并将该语句与每一标示词预设的杂词进行去杂词处理，接着，提取该语句中的字词与每一标示词预设的反义词进行反义词检查，然后，将该语句与每一标示词预设的相似词进行相似词的置换，接着，该语句与每一标示词默认的特征词进行特征词检查，以获取语意解析后的规则语句，最后，对所述的规则语句与该标示词进行相似度计算，以输出与该规则语句的语意相对应的响应语句。

全部详细技术资料下载

【技术实现步骤摘要】
语意相似度计算方法
本专利技术是有关一种相似度计算方法，特别是指一种语意相似度计算方法。
技术介绍
随着科技的日新月异，人类与智能型电子装置间的沟通模式已透过最自然且方便的语音来进行，近年来互动要求为主的机器人陆续被发表。目前较为熟知的人机互动技术有一种是先针对使用者可能会表达的话语或问题，于机器人身上内建预先设好的对话数据库，当机器人接收到语音消息即与内建的对话数据库进行比对，以辨识该语音消息的语意，而进行的互动对谈，如果需达到双向互动沟通的功能，设备所需对话数据量非常巨大，单以人工方式建置该对话数据库，除了需耗费庞大的时间与人力成本，更会增加存放数据库的内存空间，且建置后的对话数据库若无持续扩充更新，几次后使用者将对机器人丧失新鲜感。另一种技术则是透过神经网络进行深度学习，于实务上神经网络大多利用超级计算机或单芯片系统来实现。在使用单芯片系统的情况下，是令单芯片系统中的同一套电路在不同时间点分别扮演多层人造神经网络中不同的运算层，当神经网络的层数越多，越能模拟复杂的函式(亦即较复杂的判断规则)，然而，当层数增加，整个网络中所需要的神经元数量会随的大幅增长，将衍生庞大的硬件成本负担，且各个运算层的输入数据、可学习参数与运算结果的数据数量都非常可观，绝非一般企业得以负担。上述缺点都是现有人机互动技术在使用上所衍生的种种问题，依目前人工智能的发展，要达到人机自主互动仍属不易，毕竟语言是人类经过长期学习与经验累积的文化产物，因此，如何利用有限度的对话数据库，且快速撷取使用者的语意进行分析，成为重要...

【技术保护点】
1.一种语意相似度计算方法，其特征在于，包括下列步骤︰/n输入待解析的语句，并将所述语句与每一标示词预设的杂词进行去杂词处理；/n提取所述语句中的字词与每一标示词预设的反义词进行反义词检查；/n将所述语句与每一标示词预设的相似词进行相似词的置换；/n所述语句与每一标示词默认的特征词进行特征词检查，以获取语意解析后的规则语句；及/n对所述规则语句与所述标示词进行相似度计算，以输出与所述规则语句的语意相对应的响应语句。/n

【技术特征摘要】
1.一种语意相似度计算方法，其特征在于，包括下列步骤︰
输入待解析的语句，并将所述语句与每一标示词预设的杂词进行去杂词处理；
提取所述语句中的字词与每一标示词预设的反义词进行反义词检查；
将所述语句与每一标示词预设的相似词进行相似词的置换；
所述语句与每一标示词默认的特征词进行特征词检查，以获取语意解析后的规则语句；及
对所述规则语句与所述标示词进行相似度计算，以输出与所述规则语句的语意相对应的响应语句。

2.如权利要求1所述的语意相似度计算方法，其特征在于，在进行所述语句的特征词检查时，所述语句与每一标示词默认的常数特征词先进行特征词检查，再与每一标示词默认的变量特征词进行特征词检查，且所述标示词的特征词包括至少一常数特征词、至少一变量特征词，或二者的组合，而每一变量特征词具有多个与所述变量特征词相关的关联特征词。

3.如权利要求1所述的语意相似度计算方法，其特征在于，在进行所述语句的特征词检查时，所述语句与每一标示词默认的常数特征词先进行特征词检查，再与每一标示词默认的变量特征词进行特征词检查，且所述标示词的特征词包括至少一常数特征词、至少一变量特征词，或二者的组合，每一变量特征词具有多个与所述变量特征词相关的关联特征词，且多个所述变量特征词间互为交集关系。

4.如权利要求2或3所述的语意相似度计算方...

【专利技术属性】
技术研发人员：黄本聪，陈建亨，
申请(专利权)人：云义科技股份有限公司，
类型：发明
国别省市：中国台湾;71

全部详细技术资料下载我是这个专利的主人