【技术实现步骤摘要】
关键词智能提取方法、装置、计算机设备及存储介质
本专利技术涉及语义解析
,属于智慧城市中对文本进行关键词智能提取的应用场景,尤其涉及一种关键词智能提取方法、装置、计算机设备及存储介质。
技术介绍
关键词提取是传统自然语言处理中非常常见的任务,关键词是从文本中提取出来比较特别的、且能够代表文本基本含义词汇,从文本中提取到的关键词的质量对下游任务而言是至关重要的。传统技术方法均是对文本中词汇的出现频率进行分析统计,基于词汇出现频率确定文本中的关键词,然而专利技术人发现,文本中部分出现频率不高的词汇可能会具有显著体现文本特征的作用,而现有的关键词提取方法基于词汇出现频率确定关键词,会导致提取到的关键词无法准确体现文本的含义,影响了从文本中提取到的关键词的质量,导致关键词提取的准确性不高。因此,现有的技术方法中关键词提取方法存在的关键词提取准确性不高的问题。
技术实现思路
本专利技术实施例提供了一种关键词智能提取方法、装置、计算机设备及存储介质,旨在解决现有技术方法中所关键词提取方法所存在的关键词提取准确性不高的问题。第一方面,本专利技术实施例提供了一种关键词智能提取方法,其包括:若接收到用户输入的初始文本,将所述初始文本转换为由语句编码组合形成的文本编码信息;将所述文本编码信息输入预置的神经网络模型以得到与每一语句编码对应的语句向量矩阵;根据预置的词汇集合从每一所述语句向量矩阵中提取得到对应的词汇向量;根据所述语句向量矩阵对与所述语句向量矩阵对应的多个所述词 ...
【技术保护点】
1.一种关键词智能提取方法,其特征在于,所述方法包括:/n若接收到用户输入的初始文本,将所述初始文本转换为由语句编码组合形成的文本编码信息;/n将所述文本编码信息输入预置的神经网络模型以得到与每一语句编码对应的语句向量矩阵;/n根据预置的词汇集合从每一所述语句向量矩阵中提取得到对应的词汇向量;/n根据所述语句向量矩阵对与所述语句向量矩阵对应的多个所述词汇向量分别进行白化处理,得到与每一所述词汇向量对应的标准单位向量;/n获取每一所述语句向量矩阵的语句标识向量与对应的多个所述标准单位向量之间的相似度得到相似度计算结果;/n根据预置的词汇筛选规则及所述相似度计算结果从所述初始文本的分词结果中筛选得到目标词汇作为所述初始文本的关键词提取结果。/n
【技术特征摘要】
1.一种关键词智能提取方法,其特征在于,所述方法包括:
若接收到用户输入的初始文本,将所述初始文本转换为由语句编码组合形成的文本编码信息;
将所述文本编码信息输入预置的神经网络模型以得到与每一语句编码对应的语句向量矩阵;
根据预置的词汇集合从每一所述语句向量矩阵中提取得到对应的词汇向量;
根据所述语句向量矩阵对与所述语句向量矩阵对应的多个所述词汇向量分别进行白化处理,得到与每一所述词汇向量对应的标准单位向量;
获取每一所述语句向量矩阵的语句标识向量与对应的多个所述标准单位向量之间的相似度得到相似度计算结果;
根据预置的词汇筛选规则及所述相似度计算结果从所述初始文本的分词结果中筛选得到目标词汇作为所述初始文本的关键词提取结果。
2.根据权利要求1所述的关键词智能提取方法,其特征在于,所述将所述初始文本转换为文本编码信息,包括:
将所述初始文本拆分为对应的多个文本语句;
根据预置的转换词典对所述多个文本语句进行转换得到与每一文本语句对应的语句编码。
3.根据权利要求1所述的关键词智能提取方法,其特征在于,所述根据预置的词汇集合从每一所述语句向量矩阵中提取得到对应的词汇向量,包括:
根据所述词汇集合对每一所述语句向量矩阵对应的文本语句进行分词得到每一所述文本语句的分词结果;
从每一所述语句向量矩阵中提取与所述分词结果包含的词汇所对应的字符向量信息;
对每一所述词汇的字符向量信息进行平均计算得到与每一所述词汇对应的词汇向量。
4.根据权利要求1所述的关键词智能提取方法,其特征在于,所述根据所述语句向量矩阵对与所述语句向量矩阵对应的多个所述词汇向量分别进行白化处理,得到与每一所述所述词汇向量对应的标准单位向量,包括:
将每一所述语句向量矩阵的语句标识向量及对应的多个所述词汇向量进行组合,得到与每一所述语句向量矩阵对应的初始向量集合;
计算每一所述初始向量集合对应的协方差矩阵;
对每一所述协方差矩阵进行奇异值分解及矩阵变换处理得到对应的协方差单位矩阵;
将每一所述词汇向量与对应均值向量的差值与所述词汇向量对应的协方差单位矩阵相乘,得到每一所述词汇向量对应的标准单位向量。
5.根据权利要求1所述的关键词智能提取方法,其特征在于,所述相似度为余弦相似度,所述获取每一所述语句向量矩阵的语句标识向量与对应的多个所述标准单位向量之间的相似度得到相似度计...
【专利技术属性】
技术研发人员:李志韬,王健宗,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。