实时文本自动添加标点的方法、模型构建方法及装置制造方法及图纸

技术编号:25397902 阅读:46 留言:0更新日期:2020-08-25 23:02
本发明专利技术实施例提供实时文本自动添加标点的方法、模型构建方法及装置,其中,模型构建方法包括:构造包括标注模型和基于强化学习实现的决策模型的实时文本自动添加标点模型,将无标点的实时文本流作为输入流输入标注模型,对于输入流中当前输入标注模型的字符,标注模型输出当前字符是否进行标点添加的标注结果,决策模型从输入流获取当前字符,根据标注模型当前的隐层状态对标注结果进行评估,控制是否将标注结果写入输出流;将标注模型在通用长序列加标点数据集上训练至收敛,将决策模型在包含预设数量个字符‑标点对的数据集上训练至收敛,获得训练好的实时文本自动添加标点模型。能够实现实时场景下对无标点文本流自动、准确的添加标点。

【技术实现步骤摘要】
实时文本自动添加标点的方法、模型构建方法及装置
本专利技术涉及信息处理
,尤其涉及一种实时文本自动添加标点的方法、模型构建方法及装置。
技术介绍
随着社会的进一步发展,连续语音识别(ContinuousSpeechRecognition,简称CSR)技术应用越来越广泛,如智能客服和同声翻译等等。但是,目前的CSR技术得出的文本没有标点符号,这对CSR输出结果的进一步利用和语音识别的下游技术发展带来了很大限制。因此,需要对CSR的输出结果进行自动添加标点符号处理,从而提高结果的可读性,使得CSR技术获得更广阔的应用前景。目前,现有的针对CSR技术输出的无标点文本进行添加标点的方法为:1)将自动添加标点看作序列标注问题,以大量含有标点符号的自然文本为基础生成可用于训练的字符-标点对集合;2)针对领域特点构建特定的神经网络结构,使用字符-标点对集合进行训练,得到对文本自动添加标点符号的模型;3)将CSR输出的无标点文本输入对文本自动添加标点符号的模型,得到包含标点的文本,实现标点符号的添加。但是,现有的针对CSR技术输出的无标点文本进行添加标点的方法的不足主要在于:在演讲和会议等实时场景下,待添加标点的文本无法一次性获得,而是要随着演讲者的发言逐词获取,既实时文本;如果输出包含正确标点识别结果文本的过程相比于演讲者发言有着较大时延,将会使听众无法将声音与文本及时对应,无法实时理解演讲者的语意,从而带来较大的不便。现有的针对CSR技术输出的无标点文本进行添加标点的方法无法在实时场景下及时响应的原因在于:当前方法的训练方式决定了当前方法更适用于对长文本进行标点添加,在实时场景下获取长文本需要一定的时间,从而产生时延;同时如果不使用长文本而直接对短文本进行标点添加,则添加结果质量会显著下降。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种实时文本自动添加标点的方法、模型构建方法及装置。本专利技术实施例提供一种实时文本自动添加标点模型构建方法,包括:构造实时文本自动添加标点模型,所述实时文本自动添加标点模型包括标注模型和基于强化学习实现的决策模型,将无标点的实时文本流作为输入流输入所述标注模型,对于所述输入流中当前输入所述标注模型的字符,所述标注模型输出当前字符是否进行标点添加的标注结果,所述决策模型从输入流获取当前字符,根据所述标注模型当前的隐层状态,对所述标注模型输出的当前字符是否进行标点添加的标注结果进行评估,控制是否将当前字符是否进行标点添加的标注结果写入输出流;以通用长序列加标点数据集作为输入,以所述通用长序列加标点数据集中的每个字符是否进行标点添加的标注结果作为输出,基于机器学习算法,将所述标注模型训练至收敛,以及以包含预设数量个字符-标点对的数据集作为输入,以所述包含预设数量个字符-标点对的数据集中每个字符是否进行标点添加的决策结果作为输出,基于强化学习算法,将所述决策模型训练至收敛,进而获得训练好的实时文本自动添加标点模型。可选地,所述标注模型为双层单向LSTM神经网络模型,所述双层单向LSTM神经网络模型包括第一LSTM单元和第二LSTM单元,其中,所述第一LSTM单元的输入端作为所述双层单向LSTM神经网络模型的输入端,所述第一LSTM单元的输出端与所述第二LSTM单元的输入端连接,所述第二LSTM单元的输出端作为所述双层单向LSTM神经网络模型的输出端。可选地,所述决策模型的主体结构是门控循环单元GRU;其中,令输入流为{x1,x2,...,xn},n为实时文本流中字符的数量,令t时刻需要标注的字符是xt,t=1,...,n,所述决策模型指定所述标注模型的文本读取范围为{x1,x2,...,xq},q=1,...,n,所述标注模型计算xt进行标点添加的标注结果为所述决策模型根据所述标注模型当前的隐层状态,利用决策dθ对进行评估,若符合决策dθ的要求,则将作为t时刻对xt进行标点添加的最终输出结果yt写入输出流,然后对xt+1进行标注;若不符合决策dθ的要求,则令所述标注模型读入xq+1后对xt进行重新标注,直至新的符合决策dθ的要求,将新的作为t时刻对xt进行标点添加的最终输出结果yt写入输出流,然后对xt+1进行标注;其中,将所述标注模型的第一LSTM单元的第一隐层状态向量h1、所述标注模型的第二LSTM单元的第二隐层状态向量h2和待输出标点序列向量sT合并成观测变量ot=[h1;h2;sT],所述决策模型使用自身的门控循环单元GRU对ot进行编码,得到相应的决策dθ(at|a<t,o<t)∝gθ(zt),其中,zt=fθ(zt-1,ot),θ表示GRU模型的模型参数,a<t表示动作序列(a0,a1,…,at-1),o<t表示观测变量序列(o0,o1,…,ot-1),zt是t时刻所述决策模型的隐层状态,zt决定了t时刻的动作at,fθ表示从决策模型隐层状态zt-1到隐层状态zt进行转移时的函数关系,gθ表示决策模型隐层状态zt和GRU模型输出之间的函数关系。可选地,所述以包含预设数量个字符-标点对的数据集作为输入,以所述包含预设数量个字符-标点对的数据集中每个字符是否进行标点添加的决策结果作为输出,基于强化学习算法,将所述决策模型训练至收敛,包括:以包含预设数量个字符-标点对的数据集作为输入,以所述包含预设数量个字符-标点对的数据集中每个字符是否进行标点添加的决策结果作为输出,将所述决策模型的参数进行随机初始化,将所述决策模型在包含预设数量个字符-标点对的数据集上进行多次迭代,每次迭代送入一个字符-标点对并计算t时刻的整体奖励rt,在使得整体奖励rt最大的方向上对所述决策模型的参数进行更新,最终获得收敛的决策模型。可选地,t时刻的整体奖励rt是根据t时刻由加标点质量决定的奖励和t时刻由加标点延迟决定的惩罚通过第一公式计算得到的;所述第一公式为:其中,acc表示加标点的准确性Accuracy,y表示正确添加结果,表示t时刻标注模型计算xt进行标点添加的标注结果,Δacc表示t时刻执行完添加标点动作后带来的Accuracy变化值,L表示待添加标点的文本序列长度;difft表示t时刻执行添加标点动作时需要向后读取的字符数量,是输入序列与输出序列的长度差值,初始状态下difft定义为0,每从输入流中读取一个字符,difft加一,每向输出流中写入一个字符,difft减一;C为预设定值。本专利技术实施例提供一种实时文本自动添加标点的方法,包括:获取目标实时文本流;将所述目标实时文本流输入训练好的实时文本自动添加标点模型,输出随着所述目标实时文本流中文本序列的流动而生成的标点添加结果,最终得到对所述目标实时文本流添加标点后的结果;其中,所述训练好的实时文本自动添加标点模型是以通用长序列加标点数据集作为输入,以所述通用长序列加标点数据集中的每个字符是否进行标点添加的标注结果作为输出,基于机器学习算法,将所述实时文本自动添加标点模型中的标注模型训练至收本文档来自技高网
...

【技术保护点】
1.一种实时文本自动添加标点模型构建方法,其特征在于,包括:/n构造实时文本自动添加标点模型,所述实时文本自动添加标点模型包括标注模型和基于强化学习实现的决策模型,将无标点的实时文本流作为输入流输入所述标注模型,对于所述输入流中当前输入所述标注模型的字符,所述标注模型输出当前字符是否进行标点添加的标注结果,所述决策模型从输入流获取当前字符,根据所述标注模型当前的隐层状态,对所述标注模型输出的当前字符是否进行标点添加的标注结果进行评估,控制是否将当前字符是否进行标点添加的标注结果写入输出流;/n以通用长序列加标点数据集作为输入,以所述通用长序列加标点数据集中的每个字符是否进行标点添加的标注结果作为输出,基于机器学习算法,将所述标注模型训练至收敛,以及以包含预设数量个字符-标点对的数据集作为输入,以所述包含预设数量个字符-标点对的数据集中每个字符是否进行标点添加的决策结果作为输出,基于强化学习算法,将所述决策模型训练至收敛,进而获得训练好的实时文本自动添加标点模型。/n

【技术特征摘要】
1.一种实时文本自动添加标点模型构建方法,其特征在于,包括:
构造实时文本自动添加标点模型,所述实时文本自动添加标点模型包括标注模型和基于强化学习实现的决策模型,将无标点的实时文本流作为输入流输入所述标注模型,对于所述输入流中当前输入所述标注模型的字符,所述标注模型输出当前字符是否进行标点添加的标注结果,所述决策模型从输入流获取当前字符,根据所述标注模型当前的隐层状态,对所述标注模型输出的当前字符是否进行标点添加的标注结果进行评估,控制是否将当前字符是否进行标点添加的标注结果写入输出流;
以通用长序列加标点数据集作为输入,以所述通用长序列加标点数据集中的每个字符是否进行标点添加的标注结果作为输出,基于机器学习算法,将所述标注模型训练至收敛,以及以包含预设数量个字符-标点对的数据集作为输入,以所述包含预设数量个字符-标点对的数据集中每个字符是否进行标点添加的决策结果作为输出,基于强化学习算法,将所述决策模型训练至收敛,进而获得训练好的实时文本自动添加标点模型。


2.根据权利要求1所述的实时文本自动添加标点的方法,其特征在于,所述标注模型为双层单向LSTM神经网络模型,所述双层单向LSTM神经网络模型包括第一LSTM单元和第二LSTM单元,其中,所述第一LSTM单元的输入端作为所述双层单向LSTM神经网络模型的输入端,所述第一LSTM单元的输出端与所述第二LSTM单元的输入端连接,所述第二LSTM单元的输出端作为所述双层单向LSTM神经网络模型的输出端。


3.根据权利要求2所述的实时文本自动添加标点的方法,其特征在于,所述决策模型的主体结构是门控循环单元GRU;其中,令输入流为{x1,x2,…,xn},n为实时文本流中字符的数量,令t时刻需要标注的字符是xt,t=1,...,n,所述决策模型指定所述标注模型的文本读取范围为{x1,x2,...,xq},q=1,...,n,所述标注模型计算xt进行标点添加的标注结果为所述决策模型根据所述标注模型当前的隐层状态,利用决策dθ对进行评估,若符合决策dθ的要求,则将作为t时刻对xt进行标点添加的最终输出结果yt写入输出流,然后对xt+1进行标注;若不符合决策dθ的要求,则令所述标注模型读入xq+1后对xt进行重新标注,直至新的符合决策dθ的要求,将新的作为t时刻对xt进行标点添加的最终输出结果yt写入输出流,然后对xt+1进行标注;
其中,将所述标注模型的第一LSTM单元的第一隐层状态向量h1、所述标注模型的第二LSTM单元的第二隐层状态向量h2和待输出标点序列向量sT合并成观测变量ot=[h1;h2;sT],所述决策模型使用自身的门控循环单元GRU对ot进行编码,得到相应的决策dθ(at|a<t,o<t)∝gθ(zt),其中,zt=fθ(zt-1,ot),θ表示GRU模型的模型参数,a<t表示动作序列(a0,a1,...,at-1),o<t表示观测变量序列(o0,o1,...,ot-1),zt是t时刻所述决策模型的隐层状态,zt决定了t时刻的动作at,fθ表示从决策模型隐层状态zt-1到隐层状态zt进行转移时的函数关系,gθ表示决策模型隐层状态zt和GRU模型输出之间的函数关系。


4.根据权利要求3所述的实时文本自动添加标点的方法,其特征在于,所述以包含预设数量个字符-标点对的数据集作为输入,以所述包含预设数量个字符-标点对的数据集中每个字符是否进行标点添加的决策结果作为输出,基于强化学习算法,将所述决策模型训练至收敛,包括:
以包含预设数量个字符-标点对的数据集作为输入,以所述包含预设数量个字符-标点对的数据集中每个字符是否进行标点添加的决策结果作为输出,将所述决策模型的参数进行随机初始化,将所述决策模型在包含预设数量个字符-标点对的数据集上进行多次迭代,每次迭代送入一个字符-标点对并计算t时刻的整体奖励rt,在使得整体奖励rt最大的方向上对所述决策模型的参数进行更新,最终获得收敛的决策模型。


5.根据权利要求4所述的实时文本自动添加标点的方法,其特征在于,t时刻的整体奖励rt是根据t时刻由加标点质量决定的奖励和t时刻由加标点延迟决定的惩罚通过第一公式计算得到的;
所述第一公式为:



其中,



acc表示加标点的准确性Accuracy,y表示正确添加结果,表示t时刻标注模型计算xt进行标点添加的标注结果,Δacc表示t时刻执行完添加标点动作后带来的Accuracy变化值,L表示待添加标点的文本序列长度;



difft表示t时刻执行添加标点...

【专利技术属性】
技术研发人员:杨群领李鹏冯少辉
申请(专利权)人:北京中科智加科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1