【技术实现步骤摘要】
文本向量生成方法、装置及存储介质
[0001]本申请涉及人工智能
,尤其涉及一种文本向量生成方法
、
装置及存储介质
。
技术介绍
[0002]文本向量化是一种将自然语言文本
(
如单词
、
短语
、
句子或者文章
)
转换为数值向量的技术
。
这些数值向量能够在一个连续的向量空间中表示文本,捕捉文本的语义信息,具有相似意义的文本通常在空间中距离较近
。
在自然语言处理领域中,文本向量化可以用于进行文本检索
、
内容推荐
、
文本聚类等场景任务
。
[0003]目前,文本向量化通常通过一些自然语言处理模型实现,利用自然语言处理模型对文本进行向量转换,得到文本的向量
。
然而,当从不同角度去对文本进行分析时,文本可以归属于不同的应用领域,但目前的自然语言处理模型无法针对文本在不同应用领域下的语义信息进行准确的向量转换,从而容易影响转换得到的文本向量的准确性
。
技术实现思路
[0004]以下是对本文详细描述的主题的概述
。
本概述并非是为了限制权利要求的保护范围
。
[0005]本申请实施例提供了一种文本向量生成方法
、
装置及存储介质,能够针对文本的目标领域进行准确的文本向量转换,从而能够提高转换得到的文本向量的准确性
。
[0006]一方面, ...
【技术保护点】
【技术特征摘要】
1.
一种文本向量生成方法,其特征在于,包括以下步骤:获取待处理文本,并根据所述待处理文本得到引导提示信息,所述引导提示信息包括所述待处理文本所归属的目标领域的信息;调用预训练的语言模型根据所述引导提示信息对所述待处理文本进行基于所述目标领域的向量转换处理,得到多个字符向量;根据多个所述字符向量,生成所述待处理文本在所述目标领域中的文本向量
。2.
根据权利要求1所述的方法,其特征在于,所述根据所述待处理文本得到引导提示信息,包括:根据所述待处理文本的内容确定所述目标领域;根据所述目标领域得到所述引导提示信息
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述待处理文本的内容确定所述目标领域,包括:根据所述待处理文本的内容确定所述待处理文本所归属的多个候选领域;从多个所述候选领域中确定所述目标领域
。4.
根据权利要求2所述的方法,其特征在于,所述根据所述目标领域得到所述引导提示信息,包括:确定所述待处理文本的任务目标和文本类型;根据所述目标领域
、
所述任务目标和所述文本类型得到引导提示信息
。5.
根据权利要求1所述的方法,其特征在于,所述根据多个所述字符向量,生成所述待处理文本在所述目标领域中的文本向量,包括:对多个所述字符向量进行向量融合,生成所述待处理文本在所述目标领域中的文本向量
。6.
根据权利要求5所述的方法,其特征在于,所述对多个所述字符向量进行向量融合,生成所述待处理文本在所述目标领域中的文本向量,包括:确定各个所述字符向量的权重;根据各个所述字符向量的所述权重,对多个所述字符向量进行加权融合,生成所述待处理文本在所述目标领域中的文本向量
。7.
根据权利要求6所述的方法,其特征在于,每个所述字符向量均对应有字符位置;所述确定各个所述字符向量的权重,包括:根据所述字符位置,确定各个所述字符向量的权重
。8.
根据权利要求7所述的方法,其特征在于,对应于不同的所述字符位置的所述字符向量,对应有不同的所述权重
。9.
根据权利要求7或8所述的方法,其特征在于,所述字符向量所对应的所述字符位置越靠后,...
【专利技术属性】
技术研发人员:郑孙聪,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。