System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息处理,尤其涉及一种文本的动态可变邻近语义连贯性评估方法与装置。
技术介绍
1、文本和对话分割的目的是将文本和对话分割成语义连贯的线性序列片段,每个片段中的文本都密切相关。它在社交媒体分析、摘要分析、对话归纳、对话生成、反馈预测、对话评价、问答,以及众包协同文本处理任务切分分配等多种任务中发挥着至关重要的作用。
2、语义的连贯性评估是对话和文本分割任务的关键,决定了分割的合理和准确性。目前的方法主要侧重于计算相邻的两个单句语句文本或固定个数单句语句文本之间的连贯性。但是对话的结构和特点与单纯的文本不同。对话是一系列交互的语言行为,更加简短、精炼。单句对话很大程度上依赖于前面的上下文,并且存在更多的主题漂移以及指代现象,有时还涉及多个参与者。而现有方法,往往由于短句语义信息的丢失,从而导致语义信息连贯性评估时误差增大的问题。
技术实现思路
1、本专利技术提供一种文本的动态可变邻近语义连贯性评估方法与装置,用以解决现有技术中语义信息连贯性评估误差大的缺陷。
2、一种文本的动态可变邻近语义连贯性评估方法,包括:
3、获取文本信息;
4、将所述文本信息分割成若干单句语句文本;
5、确定第一单句语句文本与第二单句语句文本之间的第一连贯性评分;所述第一单句语句文本与第二单句语句文本为一对相邻的语句文本;
6、根据所述第一连贯性评分是否趋于连贯,来动态合并相邻的若干条语句,并确定动态合并后的语句文本与其相邻的
7、根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性。
8、进一步地,如上所述的文本的动态可变邻近语义连贯性评估方法,所述根据所述第一连贯性评分是否趋于连贯,来动态合并相邻的若干条语句,并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分,直到最后一个单句语句文本的连贯性评分被确定包括:
9、在所述第一连贯性评分为趋于连贯的情况下,将所述第一单句语句文本与第二单句语句文本合并,作为所述动态合并后的语句文本。
10、进一步地,如上所述的文本的动态可变邻近语义连贯性评估方法,在所述第一连贯性评分为不趋于连贯的情况下,将所述第二单句语句文本与其相邻的下一单句语句文本合并,并确定合并后的语句文本与所述第一单句语句文本之间的第二连贯性评分;
11、在所述第二连贯性评分为趋于连贯的情况下,将所述第一单句语句文本、第二单句语句文本、与所述第二单句语句文本相邻的下一单句语句文本合并,作为所述动态合并后的语句文本。
12、进一步地,如上所述的文本的动态可变邻近语义连贯性评估方法,在所述第二连贯性评分为不趋于连贯的情况下,以所述第二单句语句文本作为前置语句,判断与其相邻的下一单句语句文本之间的连贯性评分。
13、进一步地,如上所述的文本的动态可变邻近语义连贯性评估方法,根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性包括:
14、确定完所有相邻单句语句文本之间的连贯性评分后,即可按各相邻句之间的连贯性确定所述文本信息的语义连贯性,并据此完成文本分割。
15、一种文本的动态可变邻近语义连贯性评估装置,包括:
16、获取单元,用于获取文本信息;
17、分割单元,用于将所述文本信息分割成若干单句语句文本;
18、确定单元,用于确定第一单句语句文本与第二单句语句文本之间的第一连贯性评分;所述第一单句语句文本与第二单句语句文本为一对相邻的语句文本;
19、所述确定单元,还用于根据所述第一连贯性评分是否趋于连贯,来动态合并相邻的若干条语句,并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分,直到最后一个单句语句文本的连贯性评分被确定;
20、所述确定单元,还用于根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性。
21、本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述文本的动态可变邻近语义连贯性评估方法。
22、本专利技术提供的文本的动态可变邻近语义连贯性评估方法与装置,该方法通过根据第一单句语句文本与第二单句语句文本之间的第一连贯性评分,来确定下一单句语句文本与之前单句语句文本之间的连贯性评分,最终根据所有相邻单句语句文本之间确定的所有连贯性评分确定所述文本的语义连贯性,该方法提高了语义信息连贯性评估精度和文本按语义分割的准确性。
本文档来自技高网...【技术保护点】
1.一种文本的动态可变邻近语义连贯性评估方法,其特征在于,包括:
2.根据权利要求1所述的文本的动态可变邻近语义连贯性评估方法,其特征在于,根据所述第一连贯性评分是否趋于连贯,来动态合并相邻的若干条语句,并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分,直到最后一个单句语句文本的连贯性评分被确定包括:
3.根据权利要求1所述的文本的动态可变邻近语义连贯性评估方法,其特征在于,在所述第一连贯性评分为不趋于连贯的情况下,将所述第二单句语句文本与其相邻的下一单句语句文本合并,并确定合并后的语句文本与所述第一单句语句文本之间的第二连贯性评分;
4.根据权利要求3所述的文本的动态可变邻近语义连贯性评估方法,其特征在于,在所述第二连贯性评分为不趋于连贯的情况下,以所述第二单句语句文本作为前置语句,判断与其相邻的下一单句语句文本之间的连贯性评分。
5.根据权利要求1所述的文本的动态可变邻近语义连贯性评估方法,其特征在于,根据所有相邻单句语句文本之间确定的所有连贯性评分即可确定所述文本信息的语义连贯性包括:
6.一种
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述文本的动态可变邻近语义连贯性评估方法。
...【技术特征摘要】
1.一种文本的动态可变邻近语义连贯性评估方法,其特征在于,包括:
2.根据权利要求1所述的文本的动态可变邻近语义连贯性评估方法,其特征在于,根据所述第一连贯性评分是否趋于连贯,来动态合并相邻的若干条语句,并确定动态合并后的语句文本与其相邻的下一单句语句文本之间的连贯性评分,直到最后一个单句语句文本的连贯性评分被确定包括:
3.根据权利要求1所述的文本的动态可变邻近语义连贯性评估方法,其特征在于,在所述第一连贯性评分为不趋于连贯的情况下,将所述第二单句语句文本与其相邻的下一单句语句文本合并,并确定合并后的语句文本与所述第一单句语句文本之间的第二连贯性评分;
4.根据权利要求3所述的文本的动...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。