一种基于GPT-2模型的网络舆情引导方法及装置制造方法及图纸

技术编号：26845712 阅读：35 留言：0更新日期：2020-12-25 13:08

一种基于GPT‑2模型的网络舆情引导方法及装置，包括：GPT‑2中文网络舆情模型训练模块，用于将网络社交平台中的网络舆情进行去噪处理后输入模型训练模块中，得到一个可以根据指定网络舆情主题预测产生指定数量舆情文本的神经网络模型；引导性网络舆情文本生成模块，用于调用GPT‑2中文网络舆情模型，生成指定数量舆情文本；引导性网络舆情文本投放模块，根据用户填写的舆情平台将生成的引导性网络舆情文本进行舆情发布，从而对于现有热点舆情产生引导；网络舆情引导效果统计模块，用于对引导效果进行评估，从而得出当前引导的效果，同时依据效果来变更引导舆情的发布。所述方法能够自动化生成引导性舆情文本内容，并自动投放到舆情平台上，从而引导舆情。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于GPT-2模型的网络舆情引导方法及装置
本专利技术涉及信息处理
，具体涉及一种基于GPT-2模型的网络舆情引导方法及装置。
技术介绍
随着软硬件的高速发展，互联网已经是每个人最重要的信息来源和社交场所。社交应用等新型社会媒体为信息的在线传播提供了极为迅捷的传播途径。因此，用户通过高速发展的互联网创造了大量的信息，其中在某些社会事件的发生、发展、变化过程中，产生的社会态度，称之为舆情。舆情包括了用户间的传播行为，评价行为，时序行为等等特征。当这些数据及用户活动的主体位于互联网时，所有的数据都以流量的形式传递。此时，社会舆论在网络空间体现为网络舆情。伴随互联网的高速发展，区域网络舆情的不可预知性和混乱性大大增加，对网民，尤其是区域用户产生了大量负面影响和错误信息。区域管理者及有关部门如果能在短时间内获得区域网络舆情预警并辅以正面引导，则可避免一系列负面事件，并有效降低后续事件处理成本。国内的网络舆情的分析和研究方面，有越来越多的企业将目光投向舆情监测系统的开发，包括：方正集团开发的智思服务平台，用于对全网舆情进行分析监控，同时根据舆情的载体来源将舆情划归到不同部门，主要服务于政府，百度集团开发的基于百度搜索引擎的百度舆情系统服务于政企提供了舆情监测、热点及风险事件监控、商机感知等模块，其通过对搜索引擎为入口的舆情进行采集分析相较于其余系统有着先天优势，对于数据的敏感性更加精准同类型的还有新浪集团开发的新浪舆情通平台，采集分析用户的微博内容得到第一手舆情信息，并能很好的和其本身的产品结合。r>对于国外网络舆情课题的状况，在2002年美国就已经开始了相关研究，同年主题监测追踪系统被开发应用。该系统主要面向传统新闻媒体，捕捉它们的产出数据,将其分为未知主题和已知主题，分别对其进行识别与跟踪，涉及信息检测、数据采集等技术。国内外对于舆情监测系统进行了一系列的研究工作，偏重与舆情信息的分析处理，情感倾向的预警监测。研究主体集中在数据的抽取、结构化存储和文本分析上。但是，并没有将目光聚焦在舆情倾向监测之后的引导工作。对于舆情引导的研究基本集中在监测之后的消息警告上，之后的正面引导一般对于严重的负面舆情会由舆情对应的事件产生机构/组织投入人手精力进行引导，对于较轻微的甚至交由时间，让其余的热点舆情慢慢覆盖当前的负面舆情。综上所述，需要提供一种能够自动化生成引导性舆情文本内容并能自动投放的网络舆情引导方法和装置。
技术实现思路
本专利技术的目的是：为了解决上述问题，本专利技术提出了一种基于GPT-2模型的网络舆情引导方法及装置。为了解决上述问题，本专利技术所采用的技术方案是：一种基于GPT-2模型的网络舆情引导方法，其特征在于，包括：GPT-2中文网络舆情模型的训练：将网络社交平台中的话题的主题信息和评论信息进行去噪处理后输入指定的模型训练模块中，得到一个能够根据指定中文网络舆情主题预测产生指定数量舆情文本的神经网络模型，即GPT-2中文网络舆情模型；引导性网络舆情文本的生成：通过调用GPT-2中文网络舆情模型，生成指定数量的引导性网络舆情文本，并将引导性网络舆情文本予以存储，供引导性网络舆情文本投放环节使用；引导性网络舆情文本的投放：根据用户填写的各个重要舆情平台的身份密钥调用或模拟对应舆情平台的舆情发布功能，将生成的引导性网络舆情文本进行舆情发布，从而对现有热点舆情产生引导；网络舆情引导效果的统计：对引导效果进行评估，从而得出当前引导的效果，同时依据效果来变更引导舆情的发布。进一步的，所述GPT-2中文网络舆情模型的训练包括：优化的中文GPT-2预训练模型：基于原始GPT-2模型采用经过整理标注的中文数据集预训练模型；训练数据自动化标注：通过对网络舆情特征数据的信息提取，设立符合GPT-2模型输入的标注规则；中文网络舆情模型自动化训练：将经过自动化标注的舆情数据输入中文网络舆情模型自动化训练。进一步的，所述引导性网络舆情文本的生成包括：网络舆情主题指定：可供输入的网络舆情主题指定，将指定的内容输送至下一个中文网络舆情文本生成模型进行调用；中文网络舆情文本生成模型调用：将网络舆情主题指定的舆情主题输入到中文网络舆情文本生成模型，并指定模型生成文本数量，并将生成舆情文本送至网络舆情文本存储环节；中文网络舆情文本存储：将舆情文本输入存储到数据库中，并供引导性网络舆情文本投放环节使用。进一步的，所述引导性网络舆情文本的投放包括：网络舆情投放平台及账户指定：接收网络舆情投放平台的选择并存储需要用于投放舆情的该平台账户；网络舆情文本投放：调用指定舆情投放平台接口或模拟调用投放平台舆情发布的方法，将舆情通过指定的平台账户投放出去。进一步的，所述网络舆情引导效果的统计包括：网络舆情投放前及投放后舆情正面及负面倾向比例记录：在引导性网络舆情文本投放模块运行前和运行后统计当时舆情正面及负面倾向比例。本专利技术还提供一种基于GPT-2模型的网络舆情引导装置，其特征在于，包括：GPT-2中文网络舆情模型训练模块，用于将网络社交平台中的话题的主题信息和评论信息进行去噪处理后输入指定的模型训练模块中，得到一个可以根据指定中文网络舆情主题预测产生指定数量舆情文本的神经网络模型，供引导性网络舆情文本生成模块调用；引导性网络舆情文本生成模块，用于调用GPT-2中文网络舆情模型，生成指定数量舆情文本，并将舆情文本予以存储并发送到引导性网络舆情文本投放模块；引导性网络舆情文本投放模块，用于根据用户填写的各个重要舆情平台的身份密钥调用或模拟对应舆情平台的舆情发布功能，将生成的引导性网络舆情文本进行舆情发布，从而对于现有热点舆情产生引导；网络舆情引导效果统计模块，用于对引导效果进行评估，从而得出当前引导的效果，同时依据效果来变更引导舆情的发布。进一步的，所述GPT-2中文网络舆情模型训练模块包括：优化的中文GPT-2预训练模型单元，基于原始GPT-2模型采用经过整理标注的中文数据集预训练模型；训练数据自动化标注单元，通过对网络舆情特征数据的信息提取，设立符合GPT-2模型输入的标注规则；中文网络舆情模型自动化训练单元，将经过自动化标注的舆情数据输入中文网络舆情模型自动化训练。进一步的，所述引导性网络舆情文本生成模块包括：网络舆情主题指定单元，可供输入的网络舆情主题指定，将指定的内容输送至下一个中文网络舆情文本生成模型调用单元；中文网络舆情文本生成模型调用单元，将网络舆情主题指定单元的舆情主题输入到中文网络舆情文本生成模型，并指定模型生成文本数量，并将生成舆情文本输入到网络舆情文本存储单元；中文网络舆情文本存储单元，用于将舆情文本输入存储到数据库中，并供引导性网络舆情文本投放模块使用。进一步的，所述引导性网络舆情文本投放模块包括：网络舆情投放平台及账户指定单元，用于接收网络舆情投放平台的选择本文档来自技高网...

【技术保护点】
1.一种基于GPT-2模型的网络舆情引导方法，其特征在于，包括：/nGPT-2中文网络舆情模型的训练：将网络社交平台中的话题的主题信息和评论信息进行去噪处理后输入指定的模型训练模块中，得到一个能够根据指定中文网络舆情主题预测产生指定数量舆情文本的神经网络模型，即GPT-2中文网络舆情模型；/n引导性网络舆情文本的生成：通过调用GPT-2中文网络舆情模型，生成指定数量的引导性网络舆情文本，并将引导性网络舆情文本予以存储，供引导性网络舆情文本投放环节使用；/n引导性网络舆情文本的投放：根据用户填写的各个重要舆情平台的身份密钥调用或模拟对应舆情平台的舆情发布功能，将生成的引导性网络舆情文本进行舆情发布，从而对现有热点舆情产生引导；/n网络舆情引导效果的统计：对引导效果进行评估，从而得出当前引导的效果，同时依据效果来变更引导舆情的发布。/n

【技术特征摘要】
1.一种基于GPT-2模型的网络舆情引导方法，其特征在于，包括：
GPT-2中文网络舆情模型的训练：将网络社交平台中的话题的主题信息和评论信息进行去噪处理后输入指定的模型训练模块中，得到一个能够根据指定中文网络舆情主题预测产生指定数量舆情文本的神经网络模型，即GPT-2中文网络舆情模型；
引导性网络舆情文本的生成：通过调用GPT-2中文网络舆情模型，生成指定数量的引导性网络舆情文本，并将引导性网络舆情文本予以存储，供引导性网络舆情文本投放环节使用；
引导性网络舆情文本的投放：根据用户填写的各个重要舆情平台的身份密钥调用或模拟对应舆情平台的舆情发布功能，将生成的引导性网络舆情文本进行舆情发布，从而对现有热点舆情产生引导；
网络舆情引导效果的统计：对引导效果进行评估，从而得出当前引导的效果，同时依据效果来变更引导舆情的发布。

2.如权利要求1所述的一种基于GPT-2模型的网络舆情引导方法，其特征在于，所述GPT-2中文网络舆情模型的训练包括：
优化的中文GPT-2预训练模型：基于原始GPT-2模型采用经过整理标注的中文数据集预训练模型；
训练数据自动化标注：通过对网络舆情特征数据的信息提取，设立符合GPT-2模型输入的标注规则；
中文网络舆情模型自动化训练：将经过自动化标注的舆情数据输入中文网络舆情模型自动化训练。

3.如权利要求1所述的一种基于GPT-2模型的网络舆情引导方法，其特征在于，所述引导性网络舆情文本的生成包括：
网络舆情主题指定：可供输入的网络舆情主题指定，将指定的内容输送至下一个中文网络舆情文本生成模型进行调用；
中文网络舆情文本生成模型调用：将网络舆情主题指定的舆情主题输入到中文网络舆情文本生成模型，并指定模型生成文本数量，并将生成舆情文本送至网络舆情文本存储环节；
中文网络舆情文本存储：将舆情文本输入存储到数据库中，并供引导性网络舆情文本投放环节使用。

4.如权利要求1所述的一种基于GPT-2模型的网络舆情引导方法，其特征在于，所述引导性网络舆情文本的投放包括：
网络舆情投放平台及账户指定：接收网络舆情投放平台的选择并存储需要用于投放舆情的该平台账户；
网络舆情文本投放：调用指定舆情投放平台接口或模拟调用投放平台舆情发布的方法，将舆情通过指定的平台账户投放出去。

5.如权利要求1所述的一种基于GPT-2模型的网络舆情引导方法，其特征在于，所述网络舆情引导效果的统计包括：
网络舆情投放前及投放后舆情正面及负面倾向比例记录：在引导性网络舆情文本投放模块运行前和运行后统计当时舆情正面及负面倾向比例。

6.一种基于GPT-2模...

【专利技术属性】
技术研发人员：朱国胜，吴善超，
申请(专利权)人：湖北大学，赛尔网络有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人