本发明专利技术提供了一种用于获取用户的用户特征信息的方法,其中,该方法包括以下步骤:对于至少一个用户特征对象中的每个用户特征对象,根据所述用户的语音信息,从该用户特征对象的多个预定特征中获得与所述语音信息相匹配的预定特征;根据与所述语音信息相匹配的预定特征,确定所述用户的用户特征信息。根据本发明专利技术的方案,能够根据用户的语音信息,获得该语音信息针对多个用户特征对象的、相匹配的预定特征,从而可获得较全面的用户特征信息,能够便于进行用户的身份识别,如在国家安全领域中,可用于根据来自嫌疑人的录音来获得嫌疑人的用户特征信息,从而缩小嫌疑人范围。
【技术实现步骤摘要】
本专利技术涉及计算机
,尤其涉及一种用于获取用户的用户特征信息的方法和装置。
技术介绍
目前,随着机器学习领域深度学习研究的发展,语音识别技术的应用也越来越广。然而,现有技术中,语音识别技术通常用于准确地识别语音内容,如通过语音识别技术来实现语音触发的交费或搜索功能等。
技术实现思路
本专利技术的目的是提供一种用于获取用户的用户特征信息的方法和装置。根据本专利技术的一个方面,提供一种用于获取用户的用户特征信息的方法,其中,该方法包括以下步骤:对于至少一个用户特征对象中的每个用户特征对象,根据所述用户的语音信息,从该用户特征对象的多个预定特征中获得与所述语音信息相匹配的预定特征;根据与所述语音信息相匹配的预定特征,确定所述用户的用户特征信息。根据本专利技术的另一个方面,还提供了一种用于获取用户的用户特征信息的装置,其中,该装置包括以下装置:匹配装置,用于对于至少一个用户特征对象中的每个用户特征对象,根据所述用户的语音信息,从该用户特征对象的多个预定特征中获得与所述语音信息相匹配的预定特征;确定装置,用于根据与所述语音信息相匹配的预定特征,确定所述用户的用户特征信息。与现有技术相比,本专利技术具有以下优点:能够根据用户的语音信息,获得该语音信息针对多个用户特征对象的、相匹配的预定特征,从而可获得较全面的用户特征信息,能够便于进行用户的身份识别,如在国家安全领域中,可用于根据来自嫌疑人的录音来获得嫌疑人的用户特征信息,从而缩小嫌疑人范围;能够根据与语音信息相对应的语音特征信息和/或文本信息,来从每个用户特征对象的多个预定特征中确定与语音信息相匹配的预定特征,且可基于大数据的语音样本集合和词语样本集合来提高准确性;对于至少一个用户特征对象中的每个用户特征对象,能够结合当前已获得的、与其他用户特征对象相匹配的预定特征,来从该用户特征对象的多个预定特征中确定与语音信息性匹配的预定特征;能够通过采集大量语音样本或词语样本来建立与每个预定特征相对应的语音样本集合或词语样本集合,以用于与语音信息进行匹配,来获得更准确全面的用户特征信息。【附图说明】通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为本专利技术一个实施例的用于获取用户的用户特征信息的方法的流程示意图;图2为本专利技术一个实施例的用于获取用户的用户特征信息的装置的结构示意图;图3为本专利技术一个示例的用户特征对象与预定特征之间的对应关系的示意图。附图中相同或相似的附图标记代表相同或相似的部件。【具体实施方式】下面结合附图对本专利技术作进一步详细描述。图1为本专利技术一个实施例的用于获取用户的用户特征信息的方法的流程示意图。其中,本实施例的方法主要通过计算机设备来实现;所述计算机设备包括用户设备和网络设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机;所述网络设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。所述用户设备包括但不限于PC机、平板电脑、智能手机、PDA, IPTV等。需要说明的是,所述用户设备、网络设备和网络仅为举例,其他现有的或今后可能出现的计算机设备如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。根据本实施例的方法包括步骤SI和步骤S2。在步骤SI中,对于至少一个用户特征对象中的每个用户特征对象,计算机设备根据用户的语音信息,从该用户特征对象的多个预定特征中获得与该语音信息相匹配的预定特征。其中,所述用户特征对象包括任何在描述用户特征时能够作为目标的对象;优选地,所述用户特征对象包括但不限于:用户的性别、年龄、地域、性格、职业等。其中,一个用户特征对象包括多个预定特征,该多个预定特征用于表示对该用户特征对象进行预定划分所得到的特征。例如,图3为本专利技术一个示例的用户特征对象与预定特征之间的对应关系的示意图;其中,用户特征对象“性别”的预定特征包括:男性、女性,用户特征对象“年龄”的预定特征包括:0岁-15岁、15岁-30岁、30岁-50岁、50岁以上,用户特征对象“地域”的预定特征包括:华北地区、东北地区、华东地区、华中地区、华南地区、西南地区、西北地区,用户特征对象“性格”的预定特征包括:外向型、内向型、均衡型,用户特征对象“职业”的预定特征包括:技能型、事务型、研究型、艺术型、经管型、社交型。其中,计算机设备可采用多种方式获取用户的语音信息。例如,计算机设备直接获取存储在该计算机设备中的、用户的语音信息。又例如,计算机设备为网络设备,该网络设备接收用户通过用户设备上传至该网络设备的语音信息。具体地,对于至少一个用户特征对象中的每个用户特征对象,计算机设备根据用户的语音信息,从该用户特征对象的多个预定特征中获得与该语音信息相匹配的预定特征的实现方式包括但不限于:I)所述步骤SI进一步包括步骤Sll-1和步骤SI 1-2。在步骤Sll-1中,计算机设备根据所述语音信息,获得与所述语音信息对应的语音特征信息。其中,所述语音特征信息包括任何与语音的特征相关的信息;优选地,所述语音特征信息包括但不限于:a)与语音对应的声波频率相关的信息,如语音的音调、音高等。b)与声音对应的声波振幅相关的信息,如语音的响度、音强等。c)与语音对应的声波周期相关的信息,如语音的音长等。d)与语音对应的波形特性相关的信息,如语音的音色等。需要说明的是,上述语音特征信息仅为举例,而非对本专利技术的限制,本领域技术人员应能理解,任何与语音的特征相关的信息,均应包含在本专利技术所述的语音特征信息的范围内。具体地,计算机设备可采用多种方式根据所述语音信息,获得与所述语音信息对应的语音特征信息。例如,计算机设备直接对用户的语音信息进行语音分析处理(如快速傅里叶变换等),来提取语音信息中的语音特征信息。又例如,计算机设备将语音信息作为语音模型(该语音模型为通过样本训练获得的用于提取语音特征信息的模型)的输入,来获得该语音信息对应的语音特征信息。需要说明的是,上述举例仅为更好地说明本专利技术的技术方案,而非对本专利技术的限制,本领域技术人员应该理解,任何根据所述语音信息,获得与所述语音信息对应的语音特征信息的实现方式,均应包含在本专利技术的范围内。在步骤S11-2中,对于所述至少一个用户特征对象中的每个用户特征对象,计算机设备根据所述语音特征信息,以及与该用户特征对象的每个预定特征相对应的语音样本集合,获得与所述语音特征信息相匹配的预定特征。其中,所述语音样本集合用于集合多个语音样本,所述语音样本集合可表现多种形式,如文件形式、数据库形式、向量集形式等。其中,对于用户特征对象的每个预定特征,与该预定特征相对应的语音样本集合中包括与该预定特征相对应的至少一个语音样本。例如,用户特征对象“性别”包括以下预定特征:男性、女性;预定特征“男性”对应的语音样本集合中包括来自男性用户的多个语音样本,预定特征“女性”对应的语音样本集合中包括来自女性用户的多个语音样本。又例如,用户特征对象“性格”的预定特征包括:外向型、内向型、均衡型,预定特征“本文档来自技高网...
【技术保护点】
一种用于获取用户的用户特征信息的方法,其中,该方法包括以下步骤:对于至少一个用户特征对象中的每个用户特征对象,根据所述用户的语音信息,从该用户特征对象的多个预定特征中获得与所述语音信息相匹配的预定特征;根据与所述语音信息相匹配的预定特征,确定所述用户的用户特征信息。
【技术特征摘要】
【专利技术属性】
技术研发人员:白凯,李军,陈敬林,罗云峰,靳茵茵,韩基超,罗建鼎,白振龙,李江利,
申请(专利权)人:百度在线网络技术北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。