本发明专利技术提供一种音频识别方法,包括步骤:接收音频识别请求;若侦测到当前终端在播放音频片段;则通过硬件抽象层抓取脉冲编码调制数据;将所述脉冲编码调制数据上送至应用程序接口进行识别。本发明专利技术还提供一种终端,包括:请求接收单元,用于接收音频识别请求;音频侦测单元,用于侦测当前终端是否在播放音频片段;脉冲编码调制数据获取单元,用于若侦测到当前终端在播放音频片段;则通过硬件抽象层抓取脉冲编码调制数据;数据上送单元,用于将所述脉冲编码调制数据上送至应用程序接口进行识别。本发明专利技术可以实现内部音频流和外部环境声音的切换和快速识别,且在系统的任意界面下都能被快速调用,增强了用户体验。
【技术实现步骤摘要】
本专利技术涉及移动终端领域,尤其涉及一种音频识别方法以及终端。
技术介绍
现有的一些应用程序(应用程序lication,应用程序),基于频率特征比对、基于频率共振峰识别、加之隐马尔可夫统计模型等高级方法,可以很方便对一段乐曲或哼唱旋律进行识别。方案较为成熟,可以在几秒就给出结果。但在某些场景确显得无能为力。例如用户在本机微博内、微信内或其他应用程序场景内播放的声音片段、视频等,如想识别,用户往往需要再准备另一台手机,打开带有听歌识曲功能的应用程序,将第二台手机对准第一台手机的扬声器进行识别。非常之不便,且操作繁琐,属于用户痛点问题。
技术实现思路
本专利技术的主要目的在于提出一种音频识别方法以及应用该音频识别方法终端,旨在解决无论声音片段来自自身终端内部或是周边环境都能直接识别。为实现上述目的,本专利技术提供一种音频识别方法,其特征在于,包括步骤:接收音频识别请求;若侦测到当前终端在播放音频片段;则通过硬件抽象层(hardware abstraction layer,Hal)抓取脉冲编码调制数据(Pulse Code Modulation,PCM);将所述脉冲编码调制数据上送至应用程序接口(应用程序lication Program Interface,API)进行识别。优选的,若没有侦测到所述当前终端在播放音频片段,则进行环境声音的采集生成环境数据;并将所述环境数据上送至所述应用程序接口进行识别。优选的,还包括步骤:将识别后的识别结果通过消息提示框显示。优选的,还包括步骤:将所述识别后的识别结果保存为文本形式;或执行预设的操作;其中,所述预设的操作包括将所述识别结果送入浏览器搜索框进行搜索,或将所述识别结果送入预设的应用程序(Application,APP)中进行查询或下载。优选的,通过音频焦点(AudioFocus)内的字段来侦测所述当前终端是否在播放声音片段。此外,为实现上述目的,本专利技术还提出一种终端,其特征在于,包括:请求接收单元,用于接收音频识别请求;音频侦测单元,用于侦测当前终端是否在播放音频片段;脉冲编码调制数据获取单元,用于若侦测到当前终端在播放音频片段;则通过硬件抽象层抓取脉冲编码调制数据;数据上送单元,用于将所述脉冲编码调制数据上送至应用程序接口进行识别。优选的,还包括环境数据生成单元,用于若没有侦测到所述当前终端在播放音频片段,则进行环境声音的采集生成环境数据;所述数据上送单元还用于将所述环境数据上送至所述应用程序接口进行识别。优选的,还包括显示单元,用于将识别后的识别结果通过消息提示框显示。优选的,还包括处理单元,用于将识别后的识别结果保存为文本形式;或执行预设的操作;其中,所述预设的操作包括将所述识别结果送入浏览器搜索框进行搜索,或将所述识别结果送入预设的应用程序中进行查询或下载。优选的,所述音频侦测单元用于通过音频焦点内的字段来侦测所述当前终端是否在播放声音片段。本专利技术提出的音频识别方法及应用该音频识别方法的终端,基于移动终端的实时判断,来实现内部音频流和外部环境声音的切换和快速识别。同时不受任何应用程序的限制,在系统的任意界面下都能被快速调用。解决了用户痛点,增强了用户体验。附图说明图1为实现本专利技术各个实施例的移动终端的硬件结构示意图;图2为如图1所示的移动终端的无线通信系统示意图;图3为本专利技术第一实施例的终端的结构示意图;图4为本专利技术第二实施例的终端的结构示意图;图5为本专利技术第三实施例的终端的结构示意图;图6为本专利技术第四实施例的基于UI的音频识别方法的操作流程图;图7为本专利技术第五实施例的基于UI的音频识别方法的操作流程图;图8为本专利技术第六实施例的基于UI的音频识别方法的操作流程图;本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。现在将参考附图描述实现本专利技术各个实施例的移动终端。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本专利技术的说明,其本身并没有特定的意义。因此,\模块\与\部件\可以混合地使用。移动终端可以以各种形式来实施。例如,本专利技术中描述的终端可以包括诸如移动电话、智能电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、导航装置等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。下面,假设终端是移动终端。然而,本领域技术人员将理解的是,除了特别用于移动目的的元件之外,根据本专利技术的实施方式的构造也能够应用于固定类型的终端。图1为实现本专利技术各个实施例的移动终端的硬件结构示意。移动终端100可以包括无线通信单元110、A/V(音频/视频)输入单元120、用户输入单元130、感测单元140、输出单元150、存储器160、接口单元170、控制器180和电源单元190等等。图1示出了具有各种组件的移动终端,但是应理解的是,并不要求实施所有示出的组件。可以替代地实施更多或更少的组件。将在下面详细描述移动终端的元件。无线通信单元110通常包括一个或多个组件,其允许移动终端100与无线通信系统或网络之间的无线电通信。例如,无线通信单元可以包括广播接收模块111、移动通信模块112、无线互联网模块113、短程通信模块114和位置信息模块115中的至少一个。广播接收模块111经由广播信道从外部广播管理服务器接收广播信号和/或广播相关信息。广播信道可以包括卫星信道和/或地面信道。广播管理服务器可以是生成并发送广播信号和/或广播相关信息的服务器或者接收之前生成的广播信号和/或广播相关信息并且将其发送给终端的服务器。广播信号可以包括TV广播信号、无线电广播信号、数据广播信号等等。而且,广播信号可以进一步包括与TV或无线电广播信号组合的广播信号。广播相关信息也可以经由移动通信网络提供,并且在该情况下,广播相关信息可以由移动通信模块112来接收。广播信号可以以各种形式存在,例如,其可以以数字多媒体广播(DMB)的电子节目指南(EPG)、数字视频广播手持(DVB-H)的电子服务指南(ESG)等等的形式而存在。广播接收模块111可以通过使用各种类型的广播系统接收信号广播。特别地,广播接收模块111可以通过使用诸如多媒体广播-地面(DMB-T)、数字多媒体广播-卫星(DMB-S)、数字视频广播-手持(DVB-H),前向链路媒体(MediaFLO@)的数据广播系统、地面数字广播综合服务(ISDB-T)等等的数字广播系统接收数字广播。广播接收模块111可以被构造为适合提供广播信号的各种广播系统以及上述数字广播系统。经由广播接收模块111接收的广播信号和/或广播相关信息可以存储在存储器160(或者其它类型的存储介质)中。移动通信模块112将无线电信号发送到基站(例如,接入点、节点B等等)、外部终端以及服务器中的至少一个和/或从其接收无线电信号。这样的无线电信号可以包括语音通话信号、视频通话信号、或者根据文本和/或多媒体消息发送和/或接收的各种类型的数据。无线互联网模块113支持移动终端的无线互联网接入。该模块可以内部或外部地耦接到终端。该模块所涉及的无线互联网接入技术可以包括WLAN(无本文档来自技高网...
【技术保护点】
一种音频识别方法,其特征在于,包括步骤:接收音频识别请求;若侦测到当前终端在播放音频片段;则通过硬件抽象层抓取脉冲编码调制数据;将所述脉冲编码调制数据上送至应用程序接口进行识别。
【技术特征摘要】
1.一种音频识别方法,其特征在于,包括步骤:接收音频识别请求;若侦测到当前终端在播放音频片段;则通过硬件抽象层抓取脉冲编码调制数据;将所述脉冲编码调制数据上送至应用程序接口进行识别。2.根据权利要求1所述的音频识别方法,其特征在于,若没有侦测到所述当前终端在播放音频片段,则进行环境声音的采集生成环境数据;并将所述环境数据上送至所述应用程序接口进行识别。3.根据权利要求1或2所述的音频识别方法,其特征在于,还包括步骤:将识别后的识别结果通过消息提示框显示。4.根据权利要求1或2所述的音频识别方法,其特征在于,还包括步骤:将识别后的识别结果保存为文本形式;或执行预设的操作;其中,所述预设的操作包括将所述识别结果送入浏览器搜索框进行搜索,或将所述识别结果送入预设的应用程序中进行查询或下载。5.根据权利要求1所述的音频识别方法,其特征在于,通过音频焦点内的字段来侦测所述当前终端是否在播放声音片段。6.一种终端,其特征在于,包括:请求接收单元,用于接收音频识别请求;音频侦测单...
【专利技术属性】
技术研发人员:李光宇,
申请(专利权)人:努比亚技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。