文本处理方法及装置制造方法及图纸

技术编号:35403899 阅读:22 留言:0更新日期:2022-11-03 10:55
本说明书实施例提供了文本处理方法及装置,该方法的一具体实施方式包括:控制端接收待分段文本;根据文本处理端选取规则,从多个文本处理端中确定出用于对待分段文本进行分段处理的第一文本处理端;将待分段文本发送至第一文本处理端,以使得第一文本处理端根据相应的第一分段规则,对待分段文本进行分段处理;响应于从第一文本处理端接收到针对待分段文本的第一处理结果,根据第一处理结果,获取待分段文本对应的经分段后的目标文本,并输出目标文本。目标文本。目标文本。

【技术实现步骤摘要】
文本处理方法及装置


[0001]本说明书实施例涉及计算机
,具体地,涉及文本处理方法及装置、基于会议的文本处理方法及装置、基于即时通讯的文本处理方法及装置、基于直播的文本处理方法及装置、基于教育的文本处理方法及装置。

技术介绍

[0002]目前,通过语音转换而获得的较长文本,例如至少包括3个句子的文本,通常是未分段的,可读性比较差。
[0003]因此,迫切需要一种合理、可靠的方案,可以解决文本可读性差的问题。

技术实现思路

[0004]本说明书实施例提供了文本处理方法及装置、基于会议的文本处理方法及装置、基于即时通讯的文本处理方法及装置、基于直播的文本处理方法及装置、基于教育的文本处理方法及装置。
[0005]第一方面,本说明书实施例提供了一种文本处理方法,应用于控制端,包括:接收待分段文本;根据文本处理端选取规则,从多个文本处理端中确定出用于对所述待分段文本进行分段处理的第一文本处理端;将所述待分段文本发送至第一文本处理端,以使得第一文本处理端根据相应的第一分段规则,对所述待分段文本进行分段处理;响应于从第一文本处理端接收到针对所述待分段文本的第一处理结果,根据所述第一处理结果,获取所述待分段文本对应的经分段后的目标文本,并输出所述目标文本。
[0006]在一些实施例中,所述文本处理端选取规则包括,对应所述待分段文本所属的第一业务的第一选取规则。
[0007]在一些实施例中,所述第一选取规则包括以下任一项:针对所述第一业务配置的文本处理端候补规则;针对多种业务配置的文本处理端优先级规则,所述第一业务包含在所述多种业务中。
[0008]在一些实施例中,所述根据所述第一处理结果,获取所述待分段文本对应的经分段后的目标文本,包括:若所述第一处理结果包括第一分段信息,则根据所述第一分段信息,获取所述目标文本,其中,所述第一分段信息至少包括添加有分段标记的句子或该句子在所述待分段文本中的位置。
[0009]在一些实施例中,所述根据所述第一分段信息,获取所述目标文本,包括:根据所述第一分段信息,在所述待分段文本中对添加有分段标记的句子进行换行;将经换行后的所述待分段文本确定为所述目标文本。
[0010]在一些实施例中,所述根据所述第一分段信息,获取所述目标文本,包括:确定所述待分段文本中的第一内容是否满足分段条件,所述第一内容包括,以目标句子为起始句子且以所述待分段文本的最后一个句子为结束句子的内容,所述目标句子是在所述待分段文本中位置最靠后且添加有分段标记的句子;若所述第一内容满足所述分段条件,则根据
所述文本处理端选取规则,从所述多个文本处理端中确定出第二文本处理端;将所述第一内容发送至第二文本处理端,以使得第二文本处理端根据相应的第二分段规则,对所述第一内容进行分段处理;响应于从第二文本处理端接收到针对所述第一内容的第二处理结果,根据所述第一分段信息和所述第二处理结果,获取所述目标文本。
[0011]在一些实施例中,所述根据所述第一分段信息,获取所述目标文本,还包括:若所述第一内容不满足所述分段条件,则根据所述第一分段信息,在所述待分段文本中对添加有分段标记的句子进行换行,并将经换行后的所述待分段文本确定为所述目标文本。
[0012]在一些实施例中,所述根据所述第一分段信息和所述第二处理结果,获取所述目标文本,包括:若所述第二处理结果包括第二分段信息,则根据所述第一分段信息和所述第二分段信息,在所述待分段文本中对添加有分段标记的句子进行换行,并将经换行后的所述待分段文本确定为所述目标文本。
[0013]在一些实施例中,所述分段条件包括以下任一项:文字数量达到第一文字数量阈值、句子数量达到第一句子数量阈值。
[0014]在一些实施例中,所述第一分段规则对应匹配条件;以及所述根据所述第一处理结果,获取所述待分段文本对应的经分段后的目标文本,包括:若所述第一处理结果指示所述待分段文本不满足所述匹配条件,或者未从所述待分段文本中匹配出有待换行的句子,则根据所述文本处理端选取规则,从所述多个文本处理端中确定出第二文本处理端;将所述待分段文本发送至第二文本处理端,以使得第二文本处理端根据相应的第二分段规则,对所述待分段文本进行分段处理;响应于从第二文本处理端接收到针对所述待分段文本的第三处理结果,根据所述第三处理结果,获取所述目标文本。
[0015]在一些实施例中,所述匹配条件包括以下任一项:文字数量达到第二文字数量阈值、句子数量达到第二句子数量阈值。
[0016]在一些实施例中,所述接收待分段文本,包括:从语音识别系统接收待分段文本,所述待分段文本通过对目标语音进行转换而获得。
[0017]在一些实施例中,所述目标语音属于以下任一种:会议语音、聊天语音、直播语音、授课语音。
[0018]在一些实施例中,所述第一分段规则包括以下任一项:基于正则表达式的分段规则、基于文本相似度的分段规则。
[0019]在一些实施例中,在所述接收待分段文本之前,所述方法还包括:接收并保存针对所述多个文本处理端分别配置的分段规则。
[0020]在一些实施例中,在所述接收待分段文本之前,所述方法还包括:接收并保存所述文本处理端选取规则。
[0021]在一些实施例中,所述方法还包括:接收针对与文本分段有关的规则的更新指令;根据所述更新指令,执行相应的更新操作。
[0022]在一些实施例中,所述更新指令包括以下任一项:添加指令、删除指令、修改指令。
[0023]在一些实施例中,所述输出所述目标文本,包括:将所述目标文本提供给相应的用户;或者,将所述目标文本发送至相应的下游处理端。
[0024]在一些实施例中,所述下游处理端包括以下任一种处理端:文本翻译端、信息抽取端、文本存储端。
[0025]第二方面,本说明书实施例提供了一种文本处理方法,应用于文本处理端,包括:响应于接收到控制端发送的文本信息,获取针对所述文本处理端配置的分段规则,其中,所述文本信息包括待分段文本,或者所述待分段文本中的第一内容;根据所述分段规则,对所述文本信息进行分段处理,并生成处理结果;将所生成的处理结果返回给所述控制端,以使得所述控制端至少根据所述处理结果,获取所述待分段文本对应的经分段后的目标文本。
[0026]在一些实施例中,所述分段规则对应匹配条件;以及在所述获取针对所述文本处理端配置的分段规则之后,所述方法还包括:确定所述文本信息是否满足所述匹配条件;以及所述根据所述分段规则,对所述文本信息进行分段处理,包括:响应于确定所述文本信息满足所述匹配条件,根据所述分段规则,对所述文本信息进行分段处理。
[0027]在一些实施例中,所述方法还包括:响应于确定所述文本信息不满足所述匹配条件,生成用于指示所述文本信息不满足所述匹配条件的处理结果。
[0028]在一些实施例中,所述分段规则包括基于正则表达式的分段规则;以及所述根据所述分段规则,对所述文本信息进行分段处理,并生成处理结果,包括:利用本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,应用于控制端,包括:接收待分段文本;根据文本处理端选取规则,从多个文本处理端中确定出用于对所述待分段文本进行分段处理的第一文本处理端;将所述待分段文本发送至第一文本处理端,以使得第一文本处理端根据相应的第一分段规则,对所述待分段文本进行分段处理;响应于从第一文本处理端接收到针对所述待分段文本的第一处理结果,根据所述第一处理结果,获取所述待分段文本对应的经分段后的目标文本,并输出所述目标文本。2.根据权利要求1所述的方法,其中,所述根据所述第一处理结果,获取所述待分段文本对应的经分段后的目标文本,包括:若所述第一处理结果包括第一分段信息,则根据所述第一分段信息,获取所述目标文本,其中,所述第一分段信息至少包括添加有分段标记的句子或该句子在所述待分段文本中的位置。3.根据权利要求2所述的方法,其中,所述根据所述第一分段信息,获取所述目标文本,包括:确定所述待分段文本中的第一内容是否满足分段条件,所述第一内容包括,以目标句子为起始句子且以所述待分段文本的最后一个句子为结束句子的内容,所述目标句子是在所述待分段文本中位置最靠后且添加有分段标记的句子;若所述第一内容满足所述分段条件,则根据所述文本处理端选取规则,从所述多个文本处理端中确定出第二文本处理端;将所述第一内容发送至第二文本处理端,以使得第二文本处理端根据相应的第二分段规则,对所述第一内容进行分段处理;响应于从第二文本处理端接收到针对所述第一内容的第二处理结果,根据所述第一分段信息和所述第二处理结果,获取所述目标文本。4.一种文本处理方法,应用于文本处理端,包括:响应于接收到控制端发送的文本信息,获取针对所述文本处理端配置的分段规则,其中,所述文本信息包括待分段文本,或者所述待分段文本中的第一内容;根据所述分段规则,对所述文本信息进行分段处理,并生成处理结果;将所生成的处理结果返回给所述控制端,以使得所述控制端至少根据所述处理结果,获取所述待分段文本对应的经分段后的目标文本。5.一种文本处理方法,应用于控制端,包括:从语音识别系统接收待分段文本,所述待分段文本通过对目标语音进行转换而获得;根据文本处理端选取规则,从多个文本处理端中确定出用于对所述待分段文本进行分段处理的第一文本处理端;将所述待分段文本发送至第一...

【专利技术属性】
技术研发人员:张庆林
申请(专利权)人:阿里巴巴新加坡控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1