基于双向LSTM神经网络的语句识别方法及装置制造方法及图纸

技术编号:14028045 阅读:170 留言:0更新日期:2016-11-19 13:08
本发明专利技术公开了一种基于双向LSTM神经网络的语句识别方法及装置,属于模式识别与自然语言理解技术领域。该方法包括:获取第一输入系统和第二输入系统中语句的第一切词序列x1={x11,x12,……,x1n}和第二切词序列x2={x21,x22,……,x2m};建立两个双向LSTM神经网络模型;将第一切词序列和第二切词序列分别作为两个双向LSTM神经网络模型的第一输入序列和第二输入序列;通过双向LSTM神经网络模型的参数对第一输入序列和第二输入序列进行标准化,以获得标准化后的第一输出和第二输出;比较第一输出y1和第二输出y2,以实现语义识别。该装置通过切词获取单元获取语句切词序列,网络模型建立单元建立模型,并输入选取单元、计算单元、比较单元以实现语义理解。

【技术实现步骤摘要】

本专利技术涉及模式识别与自然语言理解
,特别涉及基于双向LSTM神经网络的语句识别方法及装置
技术介绍
随着互联网信息的爆炸式增长,社区问答(CQA)门户网站,如雅虎问答、Quora的和百度知道,正在快速发展。作为一个分享知识和经验的平台,CQA门户网站已经积累了多个领域的形式多样的数据,并以问题和候选答案的形式组织着。用户通过CQA网站获得答案知识主要包括两个步骤。首先,检索已发布的相似的问题,收集类似问题的候选答案。然后,根据对候选答案进行质量评估,获得与用户查询相比最相关的答案。在用户和CQA网站的交互过程中,句子相似度计算,具体地说是问题相似度计算起着关键性的作用。文本检索会议TREC下的实时问答比赛正是为该研究而发起的一项国际性赛事。TREC全称Text REtrieval Conference,即文本检索会议。它由一系列有关信息检索的研讨会构成,并包含多个子任务。例如,实时问答比赛针对推送的问题流,要求参赛系统实时地给出相应的答案。我们参赛的基本流程包括以下三个部分:用户意图理解、相似问题检索以及答案质量评估和排序。由于强制的实时性和问题的开放性,相似度计算起着举足轻重的作用。然而,由于词的多义性和句子结构的多样性,评估两个句子之间的语义关联度是一个非常复杂的任务。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的基于双向LSTM神经网络的语句识别方法及装置。本专利技术提供一种基于双向LSTM神经网络的语句识别方法,所述方法包括:获取第一输入系统和第二输入系统中语句的第一切词序列x1={x11,x12,……,x1n本文档来自技高网...
基于双向LSTM神经网络的语句识别方法及装置

【技术保护点】
一种基于双向LSTM神经网络的语句识别方法,其特征在于,所述方法包括:获取第一输入系统和第二输入系统中语句的第一切词序列x1={x11,x12,……,x1n}和第二切词序列x2={x21,x22,……,x2m};建立两个双向LSTM神经网络模型;将所述第一切词序列和所述第二切词序列分别作为所述两个双向LSTM神经网络模型的第一输入序列和第二输入序列;通过所述双向LSTM神经网络模型的参数对所述第一输入序列和所述第二输入序列进行标准化,以获得标准化后的第一输出y1和第二输出y2;比较所述第一输出y1和第二输出y2,以实现语义识别;其中,n为所述第一切词序列的元素数量,m为所述第二切词序列的元素数量。

【技术特征摘要】
1.一种基于双向LSTM神经网络的语句识别方法,其特征在于,所述方法包括:获取第...

【专利技术属性】
技术研发人员:安超黄志杰曾琰陈俊良屈银川
申请(专利权)人:北京高地信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1