基于深度学习模型进行智能文稿风格改写的方法和设备技术

技术编号：23099658 阅读：27 留言：0更新日期：2020-01-14 20:42

本公开的一示例性方面涉及一种基于深度学习模型进行智能文稿风格改写的方法，包括接收与源风格相关联的源文稿和至少一个目标风格；对于所述源文稿的一个或多个自然句中的每一者：由深度学习模型基于所述源风格生成与所述源文稿的该自然句对应的语义向量；以及由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句；以及顺序合并与所述源文稿的一个或多个自然句对应的一个或多个目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿。本公开还涉及相应的装置等。

The method and equipment of intelligent manuscript style rewriting based on deep learning model

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习模型进行智能文稿风格改写的方法和设备
本申请涉及人工智能，尤其涉及基于深度学习的智能文稿改写。
技术介绍
随着当今信息时代自媒体的爆炸式发展，各种媒体的舆论宣传手段日益丰富，读者偏好、品味的日益多样化，给写作宣传、投放工作带来了很大的挑战。同样的一篇文章或一份新闻稿，往往需要针对各类传媒、各类读者的特点来修改成不同风格的文章或新闻稿，以便适应于特定类别、层次、品味等的读者，来提高文章或新闻稿的实际阅读量、读者感兴趣程度乃至影响力。因此，文章的个性化改写具有广泛的现实需求。然而，读者的类别、层次、品味等大相径庭。为了适应具体的读者，本质上同样的文章需要被改写很多遍。这极大地增加了写稿的工作量。因此，本领域需要能够实现对文稿的自动化的智能改写的技术。
技术实现思路
本公开的一示例性方面涉及一种基于深度学习模型进行智能文稿风格改写的方法，包括接收与源风格相关联的源文稿和至少一个目标风格；对于所述源文稿的一个或多个自然句中的每一者：由深度学习模型基于所述源风格生成与所述源文稿的该自然句对应的语义向量；以及由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句；以及顺序合并与所述源文稿的一个或多个自然句对应的一个或多个目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿。根据一示例性实施例，所述深度学习模型包括编码器和解码器，其中与所述源文稿的自然句对应的语义向量由所述深度学习模型的编码器基于所述源风格生成，并且与所述语义向量对应的目标自然...

【技术保护点】
1.一种基于深度学习模型进行智能文稿风格改写的方法，其特征在于，包括：/n接收与源风格相关联的源文稿和至少一个目标风格；/n对于所述源文稿的一个或多个自然句中的每一者：/n由深度学习模型基于所述源风格生成与所述源文稿的该自然句对应的语义向量；以及/n由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句；以及/n顺序合并与所述源文稿的一个或多个自然句对应的一个或多个目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿。/n

【技术特征摘要】
1.一种基于深度学习模型进行智能文稿风格改写的方法，其特征在于，包括：
接收与源风格相关联的源文稿和至少一个目标风格；
对于所述源文稿的一个或多个自然句中的每一者：
由深度学习模型基于所述源风格生成与所述源文稿的该自然句对应的语义向量；以及
由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句；以及
顺序合并与所述源文稿的一个或多个自然句对应的一个或多个目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿。

2.如权利要求1所述的方法，其特征在于，所述深度学习模型包括编码器和解码器，其中
与所述源文稿的自然句对应的语义向量由所述深度学习模型的编码器基于所述源风格生成，并且
与所述语义向量对应的目标自然句由所述深度学习模型的解码器基于所述至少一个目标风格生成。

3.如权利要求2所述的方法，其特征在于，还包括：
对所述源文稿的自然句进行分词，并且其中
所述深度学习模型的所述编码器包括多个级联的第一单元模块，其中经分词的自然句中的每个词被按序分别输入到所述多个级联的第一单元模块。

4.如权利要求3所述的方法，其特征在于，进一步包括：
由所述多个级联的第一单元模块基于前一级第一单元的输出和经分词的自然句中输入到本级的词来生成本级的输出，其中第一级第一单元以所述源风格为前一级的输出，并且最后一级第一单元输出与所述源文稿的自然句对应的语义向量。

5.如权利要求3所述的方法，其特征在于，所述深度学习模型的所述解码器包括多个级联的第二单元模块，所述方法进一步包括：
由所述多个级联的第二单元模块基于所述至少一个目标风格分别生成与所述语义向量对应的目标词；以及
组合所述多个级联的第二单元模块各种生成的目标词以构成目标自然句。

6.如权利要求3所述的方法，其特征在于，进一步包括，当所述源文稿的自然句经分词之后所得的词的个数小于所述多个级联的第一单元模块的个数时，用空白来填充多余的第一单元模块的输入。

7.如权利要求3所述的方法，其特征在于，进一步包括，当所述源文稿的自然句经分词之后所得的词的个数大于所述多个级联的第一单元模块的个数时，对所述自然句进行切分。

8.如权利要求1所述的方法，其特征在于，所述源风格从外部接收或从所述源文稿直接提取。

9.如权利要求1所述的方法，其特征在于，进一步包括训练所述深度学习模型，其中训练所述深度学习模型包括：
设定特征库，所述特征库包括两个或更多个与智能文稿风格改写有关的特征；
生成文稿材料库，所述文稿材料库包括与所述特征库中的至少两个特征相关联的文章对；以及
基于所述文稿材料库来训练所述深度学习模型。

10.如权利要求9所述的方法，其特征在于，生成文稿材料库包括以下一项或多项或其任何组合：
针对所述特征库中的特定特征：
(i)从有特征网站抓取带有所述特定特征的所有文章；
(ii)基于所述特定特征从搜索引擎上检索相关度高的文章；以及
(iii)利用机器学习来学习出打标模型，以在从网上爬取的文本里寻找与所述特定特征相关的文章。

11.一种基于深度学习模型进行智能文稿风格改写的装置，其特征在于，包括：
用于接收与源风格相关联的源文稿和至少一个目标风格的模块；
对于所述源文稿的一个或多个自然句中的每一者：
用于由深度学习模型基于所述源风格生成与所述源文稿的自然句对应的语义向量的模块；以及
用于由所述深度学习模型基于所述至少一个目标风格生成与所述语义向量对应的目标自然句的模块；以及
用于顺序合并所述目标自然句以生成与所述至少一个目标风格相关联的至少一个目标文稿的模块。

12.如权利要求11所述的装置，其特征在于，所述深度学习模型包括编码器和解码器，其中
与所述源文稿的自然句对应的语义向量由所述深度学...

【专利技术属性】
技术研发人员：龙翀，王雅芳，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛;KY

全部详细技术资料下载我是这个专利的主人