基于人工智能的谣言识别方法及装置制造方法及图纸

技术编号：15189693 阅读：131 留言：0更新日期：2017-04-19 19:34

本发明专利技术提出了一种基于人工智能的谣言识别方法及装置，其中，方法包括：获取待识别文本；基于词袋BOW模型生成与待识别文本对应的词向量；利用投影矩阵模型将词向量转换为长度为2的向量；将长度为2的向量作为输入，通过回归函数SOFTMAX计算待识别文本为谣言的概率。通过本发明专利技术能够快速地识别互联网信息中的网络谣言，提高网络谣言的识别率和时效性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网
，尤其涉及一种基于人工智能的谣言识别方法及装置。
技术介绍
人工智能(ArtificialIntelligence)，英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能技术的发展也带动了其他相关技术的进步，比如网络谣言识别技术。网络谣言是指通过网络介质(比如电子邮箱、聊天软件、社交网站、网络论坛等)传播的没有事实依据的话语，主要涉及突发事件、公共领域、名人要员、颠覆传统、离经叛道等内容。网络谣言的传播极易扰乱正常的社会秩序，对社会造成不良影响。随着互联网技术的不断发展，互联网信息的传播速度越来越快，网络谣言的传播速度也随之加快。因此，如何有效识别互联网信息中的网络谣言，成为互联网
亟待解决的问题。现有的网络谣言识别方法中，通常根据预设的关键词列表来判断网络信息是否为谣言。当互联网信息中存在与关键词列表中的词匹配的词时，则认为该互联网信息为谣言。由于现有的网络谣言识别方法是通过预设关键词进行网络谣言识别的，因而识别率低，且由于关键词列表的滞后性，使现有的网络谣言识别方法识别谣言的时效性差。
技术实现思路
本专利技术的目的旨在至少在一定程度上解决上述的技术问题之一。为此，本专利技术的第一个目的在于提出一种基于人工智能的谣言识别方法，该方法能够快速地识别互联网信息中的网络谣言，提高网络谣言...

【技术保护点】
一种基于人工智能的谣言识别方法，其特征在于，包括：获取待识别文本；基于词袋BOW模型生成与所述待识别文本对应的词向量；利用投影矩阵模型将所述词向量转换为长度为2的向量；将所述长度为2的向量作为输入，通过回归函数SOFTMAX计算所述待识别文本为谣言的概率。

【技术特征摘要】
1.一种基于人工智能的谣言识别方法，其特征在于，包括：获取待识别文本；基于词袋BOW模型生成与所述待识别文本对应的词向量；利用投影矩阵模型将所述词向量转换为长度为2的向量；将所述长度为2的向量作为输入，通过回归函数SOFTMAX计算所述待识别文本为谣言的概率。2.如权利要求1所述的方法，其特征在于，基于词袋模型BOW生成与所述待识别文本对应的词向量，包括：将所述待识别文本切分为多个分词；获取所述多个分词对应的分词向量；利用所述BOW模型，对所述分词向量进行运算，以生成所述待识别文本对应的词向量。3.如权利要求1所述的方法，其特征在于，利用投影矩阵模型将所述词向量转换为长度为2的向量，包括：利用投影矩阵模型对所述词向量进行投影运算，生成所述词向量对应的矩阵；通过非线性变化函数，对所述矩阵进行运算，生成所述长度为2的向量。4.如权利要求3所述的方法，其特征在于，所述非线性变化函数包括sigmoid函数、正切函数以及激活函数中的一种。5.如权利要求1所述的方法，其特征在于，还包括：训练所述投影矩阵模型的参数。6.如权利要求5所述的方法，其特征在于，训练所述投影矩阵模型的参数，包括：获取样本数据，所述样本数据包括官方报道样本和谣言样本；将所述官方报道样本作为正例，所述谣言样本作为负例，训练生成所述参数，并利用基于梯度的模型优化所述参数。7.如权利要求1所述的方法，其特征在于，还包括：在计算出所述待识别文本为谣言的概率之后，根据所述概率对所述待识别文本进行相应的处理。8.一种基于人工智能的谣言识别装置，其特征在...

【专利技术属性】
技术研发人员：张军，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人