本发明专利技术提出一种用于获取节目信息的处理方法和系统,该用于获取节目信息的处理方法包括获取识别模型,所述识别模型是对接收的特征数据进行训练后得到的,所述特征数据是根据音频数据得到的,所述音频数据是从源数据流中获取的;接收要识别的特征数据,并根据所述识别模型对所述要识别的特征数据进行识别,得到识别结果,所述要识别的特征数据是根据要识别的音频数据得到的。该方法能够实现系统根据音频数据主动得到识别结果,降低对用户的依赖,提高效率和准确度。
【技术实现步骤摘要】
本专利技术涉及数据处理
,尤其涉及一种用于获取节目信息的处理方法和系统。
技术介绍
用户如果需要获取电视台节目信息时,可以通过搜索引擎搜索电视节目信息,或者到相关电视台官网浏览电视节目信息等。但是,这些方式都需要用户首先判断出要搜索的电视台,再查询相应的节目信息,主要依赖用户的判断和输入。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的一个目的在于提出一种用于获取节目信息的处理方法,该方法可以实现系统根据音频数据主动得到识别结果,降低对用户的依赖,提高效率和准确度。本专利技术的另一个目的在于提出一种用于获取节目信息的处理系统。为达到上述目的,本专利技术第一方面实施例提出的用于获取节目信息的处理方法,包括:获取识别模型,所述识别模型是对接收的特征数据进行训练后得到的,所述特征数据是根据音频数据得到的,所述音频数据是从源数据流中获取的;接收要识别的特征数据,并根据所述识别模型对所述要识别的特征数据进行识别,得到识别结果,所述要识别的特征数据是根据要识别的音频数据得到的。本专利技术第一方面实施例提出的用于获取节目信息的处理方法,通过获取识别模型,并根据识别模型获取识别结果,可以实现系统根据音频数据主动得到识别结果,降低对用户的依赖,提高效率和准确度。为达到上述目的,本专利技术第二方面实施例提出的用于获取节目信息的处理系统,包括解码器,所述解码器包括:训练模块,用于获取识别模型,所述识别模型是对接收的特征数据进行训练后得到的,所述特征数据是根据音频数据得到的,所述音频数据是从源数据流中获取的;识别模块,用于接收要识别的特征数据,并根据所述识别模型对所述要识别的特征数据进行识别,得到识别结果,所述要识别的特征数据是根据要识别的音频数据得到的。本专利技术第二方面实施例提出的用于获取节目信息的处理系统,通过获取识别模型,并根据识别模型获取识别结果,可以实现系统根据音频数据主动得到识别结果,降低对用户的依赖,提高效率和准确度。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。【附图说明】本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本专利技术一实施例提出的用于获取节目信息的处理方法的流程示意图;图2是本专利技术实施例中获取节目信息的系统结构示意图;图3是本专利技术另一实施例提出的用于获取节目信息的处理方法的流程示意图;图4是本专利技术实施例中特征提取的流程示意图;图5是本专利技术实施例中频域图的示意图;图6是本专利技术实施例中chroma域的示意图;图7是本专利技术实施例中比特图的示意图;图8是本专利技术实施例中训练流程的示意图;图9是本专利技术实施例中识别流程的示意图;图10是本专利技术另一实施例提出的用于获取节目信息的处理系统的结构示意图;图11是本专利技术另一实施例提出的用于获取节目信息的处理系统的结构示意图。【具体实施方式】下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本专利技术一实施例提出的用于获取节目信息的处理方法的流程示意图,该方法包括:Sll:获取识别模型,所述识别模型是对接收的特征数据进行训练后得到的,所述特征数据是根据音频数据得到的,所述音频数据是从源数据流中获取的。本专利技术实施例中,以识别电视台为例,相应的,节目信息是指电视台的节目信息,节目信息例如节目单等。可以理解的是,本专利技术实施例的方法也可以应用到其他基于音频的识别领域,例如也可以用于识别仅存在音频数据的电台,进而获取电台的节目单等。本专利技术实施例中,用于电视台识别的装置位于服务端,该装置可以称为解码器(decoder)。解码器可以基于识别模型,识别要识别的音频数据来自的电视台。一个实施例中,为了提高可靠性,解码器可以采用备份方式,相应的,多个解码器可以组成解码器集群。进一步的,可以在不同的地理区域上设置不同的解码器集群。例如,参见图2,对应北京地区设置一个解码器集群21,对应杭州地区设置另一个解码器集群22,每个解码器集群内包括多个解码器,多个是指至少两个。为了保证实时性,降低延时,同一个解码器集群内的多个解码器位于同一个子网下,例如位于同一个子网下的同一个物理机房内。由于可以采用备份方式,因此,所述获取识别模型,包括: 从自身节点获取识别模型,所述识别模型是自身节点对接收的特征数据进行训练后得到的;或者,从备份节点获取识别模块,所述识别模型是备份节点对接收的特征数据进行训练后得到的。可以理解的是,备份节点可以是专门用于获取并存储识别模型的节点,该备份节点可以不用于识别,或者,备份节点可以与普通节点相同,可以用于获取识别模型以及用于识别。以一个解码器可以作为其他解码器的备份节点为例,当需要从备份节点获取识别模型时,不同解码器可以相互通信,获取其他解码器是否可用或者负载情况等,以确定用于提供识别模型的备份节点。识别模型是解码器对接收的特征数据进行训练后得到的。以电视台的识别为例,参见图3,另一实施例中,该方法还可以包括:S31:接收电视台实时发送的电视信号对应的传输流,并从所述传输流中提取出音频数据;S32:对所述音频数据进行特征提取,获取所述特征数据。参见图2,在每个电视台的机房内,可以设置音频数据提取模块23和特征数据提取模块24。音频数据提取模块23接收电视台实时发送的电视信号对应的传输流(TransportStream, TS),并从所述传输流中提取出音频数据。音频数据例如为高级音频编码(AdvancedAud1 Coding,AAC或者ACC)数据。其中,TS中的视频数据和音频数据可以具有不同的标识信息,从而根据标识信息提取出音频数据。电视台与音频数据提取模块之间可以采用用户数据报协议(User DatagramProtocol,UDP)进行通信。例如,电视台对外开放一个Μ)Ρ端口,电视台通过该UDP端口将TS实时输入到音频数据提取模块。特征数据提取模块24对所述音频数据进行特征提取,获取所述特征数据。本实施例中,音频数据提取模块和特征数据提取模块可以位于同一个物理设备内。由于音频数据的数据量较大,为了降低数据量可以对音频数据进行特征提取,得到数据量较小的特征数据。当然,可以理解的是,如果不考虑数据量等问题,用于识别模型训练的特征数据也可以是音频数据本身。一个实施例中,参见图4,所述对所述音频数据进行特征提取,获取所述特征数据,包括:S41:对所述音频数据进行短时快速傅氏变换(Fast Fourier Transformat1n,FFT),得到所述音频数据对应的频域数据。可以理解的是,在进行特征提取之前,可以将从TS中提取的ACC音频数据进行转换,转换为其他形式的音频数据,以方便处理。本实施例中,假设在提取出ACC音频数据后,先将ACC音频数据转换为脉冲编码调制(Pulse Code Modulat1n, PCM)音频数据。例如,以每帧(通常是0.032秒)为单位,对AC本文档来自技高网...
【技术保护点】
一种用于获取节目信息的处理方法,其特征在于,包括:获取识别模型,所述识别模型是对接收的特征数据进行训练后得到的,所述特征数据是根据音频数据得到的,所述音频数据是从源数据流中获取的;接收要识别的特征数据,并根据所述识别模型对所述要识别的特征数据进行识别,得到识别结果,所述要识别的特征数据是根据要识别的音频数据得到的。
【技术特征摘要】
【专利技术属性】
技术研发人员:李世龙,宋辉,谢延,唐海员,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。