基于人工智能的谣言识别方法及装置制造方法及图纸

技术编号:15189693 阅读:119 留言:0更新日期:2017-04-19 19:34
本发明专利技术提出了一种基于人工智能的谣言识别方法及装置,其中,方法包括:获取待识别文本;基于词袋BOW模型生成与待识别文本对应的词向量;利用投影矩阵模型将词向量转换为长度为2的向量;将长度为2的向量作为输入,通过回归函数SOFTMAX计算待识别文本为谣言的概率。通过本发明专利技术能够快速地识别互联网信息中的网络谣言,提高网络谣言的识别率和时效性。

【技术实现步骤摘要】

本专利技术涉及互联网
,尤其涉及一种基于人工智能的谣言识别方法及装置。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能技术的发展也带动了其他相关技术的进步,比如网络谣言识别技术。网络谣言是指通过网络介质(比如电子邮箱、聊天软件、社交网站、网络论坛等)传播的没有事实依据的话语,主要涉及突发事件、公共领域、名人要员、颠覆传统、离经叛道等内容。网络谣言的传播极易扰乱正常的社会秩序,对社会造成不良影响。随着互联网技术的不断发展,互联网信息的传播速度越来越快,网络谣言的传播速度也随之加快。因此,如何有效识别互联网信息中的网络谣言,成为互联网
亟待解决的问题。现有的网络谣言识别方法中,通常根据预设的关键词列表来判断网络信息是否为谣言。当互联网信息中存在与关键词列表中的词匹配的词时,则认为该互联网信息为谣言。由于现有的网络谣言识别方法是通过预设关键词进行网络谣言识别的,因而识别率低,且由于关键词列表的滞后性,使现有的网络谣言识别方法识别谣言的时效性差。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于人工智能的谣言识别方法,该方法能够快速地识别互联网信息中的网络谣言,提高网络谣言的识别率和时效性。本专利技术的第二个目的在于提出一种基于人工智能的谣言识别装置。本专利技术的第三个目的在于提出一种终端。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为了实现上述目的,本专利技术第一方面实施例提出了一种基于人工智能的谣言识别方法,包括:获取待识别文本;基于词袋BOW模型生成与待识别文本对应的词向量;利用投影矩阵模型将词向量转换为长度为2的向量;将长度为2的向量作为输入,通过回归函数SOFTMAX计算待识别文本为谣言的概率。本专利技术第一方面实施例提出的基于人工智能的谣言识别方法,通过获取待识别文本,基于词袋模型生成与待识别文本对应的词向量,利用投影矩阵模型将词向量转换为长度为2的向量,并作为输入通过回归函数计算出待识别文本为谣言的概率。由此,能够快速地识别互联网信息中的网络谣言,提高网络谣言的识别率和时效性。为了实现上述目的,本专利技术第二方面实施例提出了一种基于人工智能的谣言识别装置,包括:获取模块,用于获取待识别文本;生成模块,用于基于词袋BOW模型生成与待识别文本对应的词向量;转换模块,用于利用投影矩阵模型将词向量转换为长度为2的向量;计算模块,用于将长度为2的向量作为输入,通过回归函数SOFTMAX计算待识别文本为谣言的概率。本专利技术第二方面实施例提出的基于人工智能的谣言识别装置,通过获取待识别文本,基于词袋模型生成与待识别文本对应的词向量,利用投影矩阵模型将词向量转换为长度为2的向量,并作为输入通过回归函数计算出待识别文本为谣言的概率。由此,能够快速地识别互联网信息中的网络谣言,提高网络谣言的识别率和时效性。为了实现上述目的,本专利技术第三方面实施例提出了一种终端,包括:处理器;用于存储处理器可执行指令的存储器。其中,处理器被配置为执行以下步骤:获取待识别文本;基于词袋BOW模型生成与待识别文本对应的词向量;利用投影矩阵模型将词向量转换为长度为2的向量;将长度为2的向量作为输入,通过回归函数SOFTMAX计算待识别文本为谣言的概率。本专利技术第三方面实施例提出的终端,通过获取待识别文本,基于词袋模型生成与待识别文本对应的词向量,利用投影矩阵模型将词向量转换为长度为2的向量,并作为输入通过回归函数计算出待识别文本为谣言的概率。由此,能够快速地识别互联网信息中的网络谣言,提高网络谣言的识别率和时效性。为了实现上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,用于存储一个或多个程序,当存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行一种基于人工智能的谣言识别方法,方法包括;获取待识别文本;基于词袋BOW模型生成与待识别文本对应的词向量;利用投影矩阵模型将词向量转换为长度为2的向量;将长度为2的向量作为输入,通过回归函数SOFTMAX计算待识别文本为谣言的概率。本专利技术第四方面实施例提出的非临时性计算机可读存储介质,通过获取待识别文本,基于词袋模型生成与待识别文本对应的词向量,利用投影矩阵模型将词向量转换为长度为2的向量,并作为输入通过回归函数计算出待识别文本为谣言的概率。由此,能够快速地识别互联网信息中的网络谣言,提高网络谣言的识别率和时效性。为了实现上述目的,本专利技术第五方面实施例提出了一种计算机程序产品,当计算机程序产品中的指令被处理器执行时,执行一种基于人工智能的谣言识别方法,方法包括:获取待识别文本;基于词袋BOW模型生成与待识别文本对应的词向量;利用投影矩阵模型将词向量转换为长度为2的向量;将长度为2的向量作为输入,通过回归函数SOFTMAX计算待识别文本为谣言的概率。本专利技术第五方面实施例提出的计算机程序产品,通过获取待识别文本,基于词袋模型生成与待识别文本对应的词向量,利用投影矩阵模型将词向量转换为长度为2的向量,并作为输入通过回归函数计算出待识别文本为谣言的概率。由此,能够快速地识别互联网信息中的网络谣言,提高网络谣言的识别率和时效性。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的基于人工智能的谣言识别方法的流程示意图;图2是基于BOW模型生成与待识别文本对应的词向量的流程示意图;图3是以待识别文本为网络文章内容为例对本实施例进行说明的示例图;图4是本专利技术另一实施例提出的基于人工智能的谣言识别方法的流程示意图;图5是训练投影矩阵模型的参数的流程示意图;图6是本专利技术又一实施例提出的基于人工智能的谣言识别方法的流程示意图;图7是本专利技术一实施例提出的基于人工智能的谣言识别装置的结构示意图;图8是本专利技术另一实施例提出的基于人工智能的谣言识别装置的结构示意图;图9是本专利技术又一实施例提出的基于人工智能的谣言识别装置的结构示意图;图10是本专利技术再一实施例提出的基于人工智能的谣言识别装置的结构示意图;图11是本专利技术还一实施例提出的基于人工智能的谣言识别装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本专利技术一实施例提出的基于人工智能的谣言识别方法的流程示意图。如图1所示,本实施例的基于人工智能的谣言识别方法包括:S11:获取待识别文本。本实施例中,为了判断某互联网信息是否为谣言,首先要通过互联网获取该互联本文档来自技高网...

【技术保护点】
一种基于人工智能的谣言识别方法,其特征在于,包括:获取待识别文本;基于词袋BOW模型生成与所述待识别文本对应的词向量;利用投影矩阵模型将所述词向量转换为长度为2的向量;将所述长度为2的向量作为输入,通过回归函数SOFTMAX计算所述待识别文本为谣言的概率。

【技术特征摘要】
1.一种基于人工智能的谣言识别方法,其特征在于,包括:获取待识别文本;基于词袋BOW模型生成与所述待识别文本对应的词向量;利用投影矩阵模型将所述词向量转换为长度为2的向量;将所述长度为2的向量作为输入,通过回归函数SOFTMAX计算所述待识别文本为谣言的概率。2.如权利要求1所述的方法,其特征在于,基于词袋模型BOW生成与所述待识别文本对应的词向量,包括:将所述待识别文本切分为多个分词;获取所述多个分词对应的分词向量;利用所述BOW模型,对所述分词向量进行运算,以生成所述待识别文本对应的词向量。3.如权利要求1所述的方法,其特征在于,利用投影矩阵模型将所述词向量转换为长度为2的向量,包括:利用投影矩阵模型对所述词向量进行投影运算,生成所述词向量对应的矩阵;通过非线性变化函数,对所述矩阵进行运算,生成所述长度为2的向量。4.如权利要求3所述的方法,其特征在于,所述非线性变化函数包括sigmoid函数、正切函数以及激活函数中的一种。5.如权利要求1所述的方法,其特征在于,还包括:训练所述投影矩阵模型的参数。6.如权利要求5所述的方法,其特征在于,训练所述投影矩阵模型的参数,包括:获取样本数据,所述样本数据包括官方报道样本和谣言样本;将所述官方报道样本作为正例,所述谣言样本作为负例,训练生成所述参数,并利用基于梯度的模型优化所述参数。7.如权利要求1所述的方法,其特征在于,还包括:在计算出所述待识别文本为谣言的概率之后,根据所述概率对所述待识别文本进行相应的处理。8.一种基于人工智能的谣言识别装置,其特征在...

【专利技术属性】
技术研发人员:张军
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1