基于深度学习模型进行智能文稿风格改写的方法和设备技术

技术编号:23099658 阅读:21 留言:0更新日期:2020-01-14 20:42
本公开的一示例性方面涉及一种基于深度学习模型进行智能文稿风格改写的方法,包括接收与源风格相关联的源文稿和至少一个目标风格;对于所述源文稿的一个或多个自然句中的每一者:由深度学习模型基于所述源风格生成与所述源文稿的该自然句对应的语义向量;以及由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句;以及顺序合并与所述源文稿的一个或多个自然句对应的一个或多个目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿。本公开还涉及相应的装置等。

The method and equipment of intelligent manuscript style rewriting based on deep learning model

【技术实现步骤摘要】
基于深度学习模型进行智能文稿风格改写的方法和设备
本申请涉及人工智能,尤其涉及基于深度学习的智能文稿改写。
技术介绍
随着当今信息时代自媒体的爆炸式发展,各种媒体的舆论宣传手段日益丰富,读者偏好、品味的日益多样化,给写作宣传、投放工作带来了很大的挑战。同样的一篇文章或一份新闻稿,往往需要针对各类传媒、各类读者的特点来修改成不同风格的文章或新闻稿,以便适应于特定类别、层次、品味等的读者,来提高文章或新闻稿的实际阅读量、读者感兴趣程度乃至影响力。因此,文章的个性化改写具有广泛的现实需求。然而,读者的类别、层次、品味等大相径庭。为了适应具体的读者,本质上同样的文章需要被改写很多遍。这极大地增加了写稿的工作量。因此,本领域需要能够实现对文稿的自动化的智能改写的技术。
技术实现思路
本公开的一示例性方面涉及一种基于深度学习模型进行智能文稿风格改写的方法,包括接收与源风格相关联的源文稿和至少一个目标风格;对于所述源文稿的一个或多个自然句中的每一者:由深度学习模型基于所述源风格生成与所述源文稿的该自然句对应的语义向量;以及由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句;以及顺序合并与所述源文稿的一个或多个自然句对应的一个或多个目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿。根据一示例性实施例,所述深度学习模型包括编码器和解码器,其中与所述源文稿的自然句对应的语义向量由所述深度学习模型的编码器基于所述源风格生成,并且与所述语义向量对应的目标自然句由所述深度学习模型的解码器基于所述至少一个目标风格生成。根据进一步的示例性实施例,该方法还包括对所述源文稿的自然句进行分词,并且其中所述深度学习模型的所述编码器包括多个级联的第一单元模块,其中经分词的自然句中的每个词被按序分别输入到所述多个级联的第一单元模块。根据另一示例性实施例,该方法进一步包括由所述多个级联的第一单元模块基于前一级第一单元的输出和经分词的自然句中输入到本级的词来生成本级的输出,其中第一级第一单元以所述源风格为前一级的输出,并且最后一级第一单元输出与所述源文稿的自然句对应的语义向量。根据又一示例性实施例,所述深度学习模型的所述解码器包括多个级联的第二单元模块,所述方法进一步包括由所述多个级联的第二单元模块基于所述至少一个目标风格分别生成与所述语义向量对应的目标词;以及组合所述多个级联的第二单元模块各种生成的目标词以构成目标自然句。根据一示例性实施例,该方法进一步包括,当所述源文稿的自然句经分词之后所得的词的个数小于所述多个级联的第一单元模块的个数时,用空白来填充多余的第一单元模块的输入。根据一示例性实施例,该方法进一步包括,当所述源文稿的自然句经分词之后所得的词的个数大于所述多个级联的第一单元模块的个数时,对所述自然句进行切分。根据一示例性实施例,所述源风格从外部接收或从所述源文稿直接提取。根据一示例性实施例,该方法进一步包括训练所述深度学习模型,其中训练所述深度学习模型包括设定特征库,所述特征库包括两个或更多个与智能文稿风格改写有关的特征;生成文稿材料库,所述文稿材料库包括与所述特征库中的至少两个特征相关联的文章对;以及基于所述文稿材料库来训练所述深度学习模型。根据进一步的示例性实施例,生成文稿材料库包括以下一项或多项或其任何组合:针对所述特征库中的特定特征:从有特征网站抓取带有所述特定特征的所有文章;基于所述特定特征从搜索引擎上检索相关度高的文章;以及利用机器学习来学习出打标模型,以在从网上爬取的文本里寻找与所述特定特征相关的文章。本公开的其他方面还涉及相应的装置和计算机可读介质。附图说明图1示出了示例循环神经网络(RNN)的示图。图2示出了示例长短期记忆(LSTM)网络的示图。图3示出了根据本公开一示例性方面的分词系统的示图。图4示出了根据本公开一示例性方面的深度学习模型的框图。图5示出了根据本公开一示例性方面的深度学习模型的离线训练方法的流程图。图6示出了根据本公开的一方面的使用经训练的深度学习模型来进行智能文稿改写的方法的框图。图7示出了根据本公开一示例性方面的使用经训练的深度学习模型来进行智能文稿改写的场景的示图。图8示出了根据本公开一示例性方面的基于深度学习的智能文稿改写设备的框图。图9示出了根据本公开的一方面的使用经训练的深度学习模型来进行智能文稿改写的装置的框图。具体实施方式传统的神经网络一般包括输入层、一个或多个隐藏层、以及输出层,其中层与层之间可以是全连接的,但每层之间的节点是无连接的。这种普通的神经网络对于很多问题无能无力。例如在语音识别或是自然语言处理时,假如想要预测句子的下一个单词是什么,一般需要基于前面出现的单词。这是因为一个句子中前后的单词并不是相互独立的。在这种情况下,循环神经网络(RNN)应运而生。为了处理序列数据,RNN使得一个序列当前的输出与之前的输出有关。由此,网络会记忆之前的信息并将其应用于当前输出的计算中。换言之,隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层/前一隐藏层的输出还包括上一时刻本隐藏层的输出。循环神经网络(RNN)最常用于时序数据挖掘。循环神经网络是一类具有记忆能力的神经网络,因此经常被用于具有时间相关性的数据的挖掘。一般而言,循环神经网络中的神经元不仅能接收来自其它神经元的信息,也能够接收自身的信息,从而形成级联的具有环路的网络结构。图1示出了示例简单循环神经网络(RNN)100的示图。如所可见,左边部分表示简化的RNN结构,其中最下方的圈表示输入层,中间的圈表示隐藏层,而最上方的圈表示输出层。输入层中的X表示输入层值向量。隐藏层中的S表示隐藏层值向量。输出层中的O表示输出层值向量。U、V和W分别表示连接相应的层与层之间的权重矩阵。隐藏层值向量S与输入层值向量X的函数关系例如如下式(1)所示:St=f(U·Xt+W·St-1+b)(1)如所可见,时间t的隐藏层值向量St不仅取决于当前的输入层值向量Xt以及连接输入层与隐藏层的权重矩阵U,还取决于前一时间t-1的隐藏层值向量St-1以及相应的权重矩阵W(以及可能还有偏置项b)。另一方面,时间t的输出层值向量Ot与隐藏层值向量St的函数关系例如如下式(2)所示:Ot=g(V·St)(2)如所可见,时间t的输出层值向量Ot取决于当前的隐藏层值向量St以及连接隐藏层与输出层的权重矩阵V。通过把RNN100在时间上展开,便得到图1右边部分的结构。如所可见,比之于例如多层感知机(MLP)等的全连接结构,RNN增加了从隐藏层延迟返回到隐藏层的过程,从而使RNN具有了“记忆”功能。因而尤其适用于处理时序数据。理论上,RNN能够对任何长度的序列数据进行处理。即,输入的序列长度可以是不固定的。但在实践中,为了降低复杂性起见,往往假设当前本文档来自技高网...

【技术保护点】
1.一种基于深度学习模型进行智能文稿风格改写的方法,其特征在于,包括:/n接收与源风格相关联的源文稿和至少一个目标风格;/n对于所述源文稿的一个或多个自然句中的每一者:/n由深度学习模型基于所述源风格生成与所述源文稿的该自然句对应的语义向量;以及/n由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句;以及/n顺序合并与所述源文稿的一个或多个自然句对应的一个或多个目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿。/n

【技术特征摘要】
1.一种基于深度学习模型进行智能文稿风格改写的方法,其特征在于,包括:
接收与源风格相关联的源文稿和至少一个目标风格;
对于所述源文稿的一个或多个自然句中的每一者:
由深度学习模型基于所述源风格生成与所述源文稿的该自然句对应的语义向量;以及
由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句;以及
顺序合并与所述源文稿的一个或多个自然句对应的一个或多个目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿。


2.如权利要求1所述的方法,其特征在于,所述深度学习模型包括编码器和解码器,其中
与所述源文稿的自然句对应的语义向量由所述深度学习模型的编码器基于所述源风格生成,并且
与所述语义向量对应的目标自然句由所述深度学习模型的解码器基于所述至少一个目标风格生成。


3.如权利要求2所述的方法,其特征在于,还包括:
对所述源文稿的自然句进行分词,并且其中
所述深度学习模型的所述编码器包括多个级联的第一单元模块,其中经分词的自然句中的每个词被按序分别输入到所述多个级联的第一单元模块。


4.如权利要求3所述的方法,其特征在于,进一步包括:
由所述多个级联的第一单元模块基于前一级第一单元的输出和经分词的自然句中输入到本级的词来生成本级的输出,其中第一级第一单元以所述源风格为前一级的输出,并且最后一级第一单元输出与所述源文稿的自然句对应的语义向量。


5.如权利要求3所述的方法,其特征在于,所述深度学习模型的所述解码器包括多个级联的第二单元模块,所述方法进一步包括:
由所述多个级联的第二单元模块基于所述至少一个目标风格分别生成与所述语义向量对应的目标词;以及
组合所述多个级联的第二单元模块各种生成的目标词以构成目标自然句。


6.如权利要求3所述的方法,其特征在于,进一步包括,当所述源文稿的自然句经分词之后所得的词的个数小于所述多个级联的第一单元模块的个数时,用空白来填充多余的第一单元模块的输入。


7.如权利要求3所述的方法,其特征在于,进一步包括,当所述源文稿的自然句经分词之后所得的词的个数大于所述多个级联的第一单元模块的个数时,对所述自然句进行切分。


8.如权利要求1所述的方法,其特征在于,所述源风格从外部接收或从所述源文稿直接提取。


9.如权利要求1所述的方法,其特征在于,进一步包括训练所述深度学习模型,其中训练所述深度学习模型包括:
设定特征库,所述特征库包括两个或更多个与智能文稿风格改写有关的特征;
生成文稿材料库,所述文稿材料库包括与所述特征库中的至少两个特征相关联的文章对;以及
基于所述文稿材料库来训练所述深度学习模型。


10.如权利要求9所述的方法,其特征在于,生成文稿材料库包括以下一项或多项或其任何组合:
针对所述特征库中的特定特征:
(i)从有特征网站抓取带有所述特定特征的所有文章;
(ii)基于所述特定特征从搜索引擎上检索相关度高的文章;以及
(iii)利用机器学习来学习出打标模型,以在从网上爬取的文本里寻找与所述特定特征相关的文章。


11.一种基于深度学习模型进行智能文稿风格改写的装置,其特征在于,包括:
用于接收与源风格相关联的源文稿和至少一个目标风格的模块;
对于所述源文稿的一个或多个自然句中的每一者:
用于由深度学习模型基于所述源风格生成与所述源文稿的自然句对应的语义向量的模块;以及
用于由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句的模块;以及
用于顺序合并所述目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿的模块。


12.如权利要求11所述的装置,其特征在于,所述深度学习模型包括编码器和解码器,其中
与所述源文稿的自然句对应的语义向量由所述深度学...

【专利技术属性】
技术研发人员:龙翀王雅芳
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1