一种关键词的识别方法及装置制造方法及图纸

技术编号:8803430 阅读:170 留言:0更新日期:2013-06-13 07:26
本发明专利技术公开了一种关键词的识别方法及装置。所述方法包括:获取节目中的语音;将节目中的语音与已有的关键词的读音进行匹配;确定匹配一致的读音所对应的关键词。本发明专利技术还公开了用于实现所述方法的装置。通过采用本发明专利技术的技术方案,可以有效地提高视频中播放的语音中的关键词的识别效率。

【技术实现步骤摘要】

本专利技术涉及网络视频
,尤其涉及一种关键词的识别方法及装置
技术介绍
随着网络视频业务的迅猛发展,网络视频使用越来越普及。例如,现有技术中的网络视频中,为了增强用户的体验度,很多网络视频网站根据视频播放的语音为用户提供了相应的字幕信息。例如,通常情况下的字幕信息出现在屏幕的下方。现有技术中,字幕信息主要是通过将语音进行转化得来的文字。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下问题:通常情况下,将语音转化为文字得来的字幕信息的准确度并不高,视频的字幕信息中的关键词中经常会出现错别字,无法有效识别视频中播放的语音中的关键词。
技术实现思路
本专利技术实施例提供一种关键词的识别方法及装置,用于克服现有技术中视频的字幕信息中的关键词中经常会出现错别字,无法有效识别视频中播放的语音中的关键词的缺陷,有效地提高视频中播放的语音中的关键词的识别效率。第一方面,本专利技术提供一种关键词的识别方法,包括以下步骤:获取节目中的语音;将节目中的语音与已有的关键词的读音进行匹配;确定匹配一致的读音所对应的关键词。可选地,结合上述第一方面,在上述第一方面的第一实现方式中,所述将节目中的语音与已有的关键词的读音进行匹配之前,还包括: 获取所述节目的相关信息;从所述节目的相关信息中提取所述已有的关键词。可选地,结合上述第一方面的第一实现方式,在上述第一方面的第二实现方式中,获取所述节目的相关信息,包括:根据所述节目预告单,获取所述节目的标识信息,根据所述节目的标识信息从网络中搜索所述节目的相关信息。可选地,结合上述第一方面或其第一实现方式或其第二实现方式,在上述第一方面的第三实现方式中,将节目中的语音与已有的关键词的读音进行匹配包括:判断所述节目中的语音与所述已有的关键词的读音是否相同,当相同时,确定所述节目的语音中与所述已有的关键词的读音匹配一致;否则当不同时,确定所述节目的语音中与所述已有的关键词的读音匹配不一致。可选地,结合上述第一方面的第三实现方式,在上述第一方面的第四实现方式中,所述确定匹配一致的读音所对应的关键词之后,还包括:根据所述匹配一致的读音所对应的关键词推送应用。第二方面,本专利技术提供一种关键词的识别装置,包括:获取模块,用于获取节目中的语音;匹配模块,用于将节目中的语音与已有的关键词的读音进行匹配;确定模块,用于确定匹配一致的读音所对应的关键词。可选地,结合上述第二方面,在上述第二方面的第一实现方式中,所述装置还包括提取1 块;所述获取模块,还用于在所述匹配模块将节目中的语音与已有的关键词的读音进行匹配之前,获取所述节目的相关信息;所述提取模块,用于从所述节目的相关信息中提取所述已有的关键词。可选地,结合上述第二方面的第一实现方式,在上述第二方面的第二实现方式中,所述获取模块,具体用于根据所述节目预告单,获取所述节目的标识信息,根据所述节目的标识信息从网络中搜索所述节目的相关信息。可选地,结合上述第二方面或其第一实现方式或其第二实现方式,在上述第二方面的第三实现中,所述匹配模块,具体用于判断所述节目中的语音与所述已有的关键词的读音是否相同,当相同时,确定所述节目的语音中与所述已有的关键词的读音匹配一致;否则当不同时,确定所述节目的语音中与所述已有的关键词的读音匹配不一致。可选地,结合上述第二方面的第三实现方式,在上述第二方面的第四实现方式中,所述装置还包括:推送模块,用于在所述确定模块确定匹配一致的读音所对应的关键词之后,根据所述匹配一致的读音所对应的关键词推送应用。本专利技术实施例的关键词的识别方法及装置,通过获取节目中的语音;将节目中的语音与已有的关键词的读 音进行匹配;确定匹配一致的读音所对应的关键词,从而可以从节目的语音中识别关键词。采用本专利技术实施例的技术方案,可以克服现有技术中视频的字幕信息中的关键词中经常会出现错别字,无法有效识别视频中播放的语音中的关键词的缺陷,直接根据关键词的语音对关键词进行有效地识别,从而可以有效地提高视频中播放的语音中的关键词的识别效率。进一步可选地,本专利技术实施例可以通过获取节目的相关信息;从节目的相关信息中提取已有的关键词,从而可以提闻对节目中的语首中的关键词的识别效率。进一步可选地,本专利技术实施例中,具体可以根据节目预告单,获取节目的标识信息,根据节目的标识信息从网络中搜索节目的相关信息,提供了一种可靠的获取节目的相关信息的方式,且能够有效地保证节目的相关信息的准确性,从而可以提高对节目中的语音中的关键词的识别效率。 进一步可选地,本专利技术实施例中,确定匹配一致的读音所对应的关键词之后,还包括根据所述匹配一致的读音所对应的关键词推送应用,可以有效地保证推送的应用的准确性。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术实施例一提供的关键词的识别方法的流程图。图2为本专利技术实施例二提供的关键词的识别方法的流程图。图3为本专利技术实施例三提供的关键词的识别装置的结构示意图。图4为本专利技术实施例四提供的关键词的识别装置的结构示意图。具体实施例方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。实施例一图1为本专利技术实施例一提供的关键词的识别方法的流程图。如图1所示,本实施例的关键词的识别方法,具体可以包括以下步骤:100、获取节目中的语音;例如具体可以在节目播放时,获取节目播放过程中节目中的语音。101、将节目中的语音与已有的关键词的读音进行匹配;102、确定匹配一致的读音所对应的关键词。具体地,即确定节目中的语音中,与已有的关键词的读音相匹配的读音所对应的关键词即为要识别的关键词,即识别出的关键词与已有关键词相同。本实施例的关键词的识别方法的执行主体具体可以为一关键词的识别装置,例如该关键词的识别装置具体可以设置在网络视频服务器中。本实施例的关键词的识别方法,通过获取节目中的语音;将节目中的语音与已有的关键词的读音进行匹配;确定匹配一致的读音所对应的关键词,从而可以从节目的语音中识别关键词。采用本实施例的技术方案,可以克服现有技术中视频的字幕信息中的关键词中经常会出现错别字,无法有效识别视频中播放的语音中的关键词的缺陷,直接根据关键词的语音对关键词进行有效地识别,从而可以有效地提高视频中播放的语音中的关键词的识别效率。进一步可选地,在上述图1所示实施例的技术方案的基础上,步骤101 “将节目中的语音与已有的关键词的读音进行匹配“之前,上述实施例的关键词的识别方法中的步骤101 “将节目中的语音与已有的关键词的读音进行匹配”之前,还包括如下步骤:(I)获取节目的相关信息;例如,具体可以根据节目预告单,获取节目的标识信息,根据节目的标识信息从网络中搜索节目的相关信息。其中节目的标识信息可以为节目的名称,或者简介等信息。例如当节目预告单的节目名称为水浒本文档来自技高网...

【技术保护点】
一种关键词的识别方法,其特征在于,包括以下步骤:获取节目中的语音;将节目中的语音与已有的关键词的读音进行匹配;确定匹配一致的读音所对应的关键词。

【技术特征摘要】
1.一种关键词的识别方法,其特征在于,包括以下步骤: 获取节目中的语音; 将节目中的语音与已有的关键词的读音进行匹配; 确定匹配一致的读音所对应的关键词。2.如权利要求1所述的方法,其特征在于,将节目中的语音与已有的关键词的读音进行匹配之前,所述方法还包括: 获取所述节目的相关信息; 从所述节目的相关信息中提取所述已有的关键词。3.如权利要求2所述的方法,其特征在于,获取所述节目的相关信息,包括:根据所述节目预告单,获取所述节目的标识信息,根据所述节目的标识信息从网络中搜索所述节目的相关信息。4.如权利要求1-3任一所述的方法,其特征在于,将节目中的语音与已有的关键词的读音进行匹配包括: 判断所述节目中的语音与所述已有的关键词的读音是否相同,当相同时,确定所述节目的语音中与所述已有的关键词的读音匹配一致;否则当不同时,确定所述节目的语音中与所述已有的关键词的读音匹配不一致。5.如权利要求4所述的方法,其特征在于,所述确定匹配一致的读音所对应的关键词之后,所述方法还包括: 根据所述匹配一致的读音所对应的关键词推送应用。6.一种关键词的识别装置,其特征在...

【专利技术属性】
技术研发人员:刘赵杰
申请(专利权)人:天脉聚源北京传媒科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1