System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于深度语法树的语义特征识别方法、装置、设备及介质制造方法及图纸_技高网

基于深度语法树的语义特征识别方法、装置、设备及介质制造方法及图纸

技术编号:43525626 阅读:3 留言:0更新日期:2024-12-03 12:13
本申请提供一种基于深度语法树的语义特征识别方法、装置、设备及介质,涉及自然语言处理领域。本申请方法通过文本分析模型,对输入文本进行分词,获得文本分词特征,准确的分词处理能够确保文本中词汇单元的正确识别;通过语法树解析算法,对输入文本进行语法解析,获得语法特征,语法树解析算法揭示了文本中词语之间的依存和句法关系,有助于模型更准确地理解句子结构。结合文本分词特征和语法特征,将文本中字与字或词与词之间的关系进行关联理解,语义解析模型能够进行更深层次的语义理解,捕捉文本的内在含义,使得生成的回复文本更贴合用户的查询意图和需求,提高文本解析结果的准确性。

【技术实现步骤摘要】

本申请涉及自然语言处理领域,尤其涉及一种基于深度语法树的语义特征识别方法、装置、设备及介质


技术介绍

1、现有业内对中文文本的语义特征理解技术主要依赖于预训练模型做词嵌入特征处理。虽然拥有大规模语料进行预训练,但是实际进行下游任务的特征提取时,并不能很好的根据文本语法进行词汇的解析提取。预训练使用的是通用领域的文本进行模型理解,对政务领域的特定下游任务缺乏可理解性,往往会以常识性知识曲解专业性知识。

2、在政务处理场景中,一般会出现比较有典型性的,难以用自然语言处理模型进行语义理解的文本存在。比如:“南京市长江大桥”出现在文本中,模型就很难理解用户说的是:南京/市长/江大桥,还是:南京市/长江大桥。这两种解读差别是较大的,而现有的技术在理解这类政务文本是比较困难的。

3、因此,如何提高文本解析结果的准确性成为目标亟待解决的技术问题。


技术实现思路

1、本申请提供了一种基于深度语法树的语义特征识别方法、装置、设备及介质,旨在提高文本解析结果的准确性。

2、第一方面,本申请提供一种基于深度语法树的语义特征识别方法,所述基于深度语法树的语义特征识别方法包括以下步骤:

3、基于文本分词模型,对输入文本进行分词处理,获得文本分词特征;

4、基于语法树解析算法,对所述输入文本进行语法解析,获得所述输入文本的语法特征;

5、基于语义解析模型,对所述文本分词特征和所述语法特征进行语言概率预测,输出回复文本。

6、第二方面,本申请还提供一种基于深度语法树的语义特征识别装置,所述基于深度语法树的语义特征识别装置包括:

7、文本分词模块,用于基于文本分词模型,对输入文本进行分词处理,获得文本分词特征;

8、语法特征识别模块,用于基于语法树解析算法,对所述输入文本进行语法解析,获得所述输入文本的语法特征;

9、语义解析模块,用于基于语义解析模型,对所述文本分词特征和所述语法特征进行语言概率预测,输出回复文本。

10、第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的基于深度语法树的语义特征识别方法的步骤。

11、第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的基于深度语法树的语义特征识别方法的步骤。

12、本申请提供一种基于深度语法树的语义特征识别方法、装置、计算机设备及存储介质,本申请方法包括基于文本分词模型,对输入文本进行分词处理,获得文本分词特征;基于语法树解析算法,对所述输入文本进行语法解析,获得所述输入文本的语法特征;基于语义解析模型,对所述文本分词特征和所述语法特征进行语言概率预测,输出回复文本。通过上述方式,本申请通过文本分析模型,对输入文本进行分词,获得文本分词特征,准确的分词处理能够确保文本中词汇单元的正确识别;通过语法树解析算法,对输入文本进行语法解析,获得语法特征,语法树解析算法揭示了文本中词语之间的依存和句法关系,有助于模型更准确地理解句子结构。结合文本分词特征和语法特征,将文本中字与字或词与词之间的关系进行关联理解,语义解析模型能够进行更深层次的语义理解,捕捉文本的内在含义,帮助语义分析模型往正确的方向进行语义理解分析,进而生成的回复文本更贴合用户的查询意图和需求,提高文本解析结果的准确性。

本文档来自技高网...

【技术保护点】

1.一种基于深度语法树的语义特征识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于语法树解析算法,对所述输入文本进行语法解析,获得所述输入文本的语法特征,包括:

3.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于语义解析模型,对所述文本分词特征和所述语法特征进行语言概率预测,输出回复文本,包括:

4.根据权利要求3所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于所述语义解析模型,对所述文本分词特征和所述语法特征进行解析,输出文本解析结果,包括:

5.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于文本分词模型,对输入文本进行分词处理,获得文本分词特征,包括:

6.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于文本分词模型,对输入文本进行分词处理,获得文本分词特征之前,还包括:

7.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于语义解析模型,对所述文本分词特征和所述语法特征进行语言概率预测,输出回复文本之后,还包括:

8.一种基于深度语法树的语义特征识别装置,其特征在于,所述基于深度语法树的语义特征识别装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的基于深度语法树的语义特征识别方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的基于深度语法树的语义特征识别方法的步骤。

...

【技术特征摘要】

1.一种基于深度语法树的语义特征识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于语法树解析算法,对所述输入文本进行语法解析,获得所述输入文本的语法特征,包括:

3.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于语义解析模型,对所述文本分词特征和所述语法特征进行语言概率预测,输出回复文本,包括:

4.根据权利要求3所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于所述语义解析模型,对所述文本分词特征和所述语法特征进行解析,输出文本解析结果,包括:

5.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于,所述基于文本分词模型,对输入文本进行分词处理,获得文本分词特征,包括:

6.根据权利要求1所述的基于深度语法树的语义特征识别方法,其特征在于...

【专利技术属性】
技术研发人员:潘荣峰王健宗黄章成孔令炜
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1