System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于远场语音模块的智能交互系统及方法技术方案_技高网

基于远场语音模块的智能交互系统及方法技术方案

技术编号:44942561 阅读:1 留言:0更新日期:2025-04-12 01:18
本发明专利技术公开了基于远场语音模块的智能交互系统及方法,涉及语音识别技术领域,本系统通过捕获用户的语音输入信号,根据不同网络状态形成不同的处理反馈机制;结合声学模型和语言模型,对预处理后的语音输入信号进行识别和优化,形成最终的处理文本;开启自保护机制,基于大数据训练,形成下一周期的第一应答指令数据;使用系统设定的周期方式,推测形成下一周期的第二应答指令数据;设立存储空间,存储第一应答指令数据与第二应答指令数据中的重合应答指令数据,从而形成离线状态下的语音应答预测,既能够保证在断网环境下实现目的性语音交互以及在隐私环境下实现语音控制,也能够降低配置离线语音的存储,提高语音交互的便携性。

【技术实现步骤摘要】

本专利技术涉及语音识别,具体是基于远场语音模块的智能交互系统及方法


技术介绍

1、远场语音是指在较远距离(通常1米以上)进行语音采集和处理的技术,随着人工智能、物联网、边缘计算等技术的不断发展,远场语音技术的高扩展性使其能够与多种先进技术结合,从而支持更广泛的应用场景和更复杂的功能。在智能工厂、医疗以及安防等领域,远场语音交互均能为

2、用户带来更智能、更便捷的交互体验。

3、然而,从目前来讲,各类互联网设备的接入,虽然极大丰富了语音交互的功能和可玩性,但随之带来的隐私问题、网络问题也层出不穷,例如,在网络不稳定或断网环境下,各类语音交互设备均丧失其基础功能或延迟巨大;又或者在安防角度、智慧工厂以及室内家居等场景下,过度的互联网设备的接入导致大量数据在互联网中传输,隐私性无法保证,如何能在联网环境下自由配置离线语音控制,能够在断网环境下实现目的性语音交互以及在隐私环境下实现语音控制,是目前面临的问题之一。


技术实现思路

1、本专利技术的目的在于提供基于远场语音模块的智能交互系统及方法,以解决现有技术中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:基于远场语音模块的智能交互方法,所述方法包括以下步骤:

3、捕获用户的语音输入信号,对语音输入信号进行初步处理,形成预处理后的语音输入信号,检测网络状态,根据不同网络状态形成不同的处理反馈机制;

4、接收预处理后的语音输入信号,结合声学模型和语言模型,对预处理后的语音输入信号进行识别和优化,形成最终的处理文本;

5、调用最终的处理文本,开启自保护机制,使用系统设定的周期方式,调用大数据库中的历史应答指令数据,基于大数据训练,形成下一周期的第一应答指令数据;

6、获取当前时间数据,使用系统设定的周期方式,推测形成下一周期的第二应答指令数据;

7、设立存储空间,存储第一应答指令数据与第二应答指令数据中的重合应答指令数据,唤醒本地语音识别引擎,建立本地控制逻辑,形成离线语音控制;

8、分别对处于不同状态下的处理文本形成智能交互。

9、根据上述技术方案,所述对语音输入信号进行初步处理包括:

10、对接收到的语音输入信号进行降噪,去除背景杂音,同时将音频信号归一化到相同的音量水平,形成预处理后的语音输入信号;

11、所述检测网络状态包括:对网络状态进行测试,包括在线网络与离线网络。

12、根据上述技术方案,所述对预处理后的语音输入信号进行识别和优化包括:

13、基于声学模型建模形成语音特征与音素的关系;

14、基于语言模型分析预测词序列概率,形成最终的处理文本。

15、根据上述技术方案,所述基于大数据训练,形成下一周期的第一应答指令数据包括:

16、获取相邻周期的应答指令数据,在历史数据中,以每两个相邻周期的应答指令数据作为一组分析数据;

17、选择当前周期的任一项应答指令数据,记任一项应答指令数据为数据a,对数据a在历史数据的分析数据中搜索,选择出历史数据中数据a的所有下一周期应答指令数据,进行一次标记;

18、选择当前周期的所有应答指令数据作为一个应答数据组,对应答数据组在历史数据的分析数据中搜索,选择出历史数据中存在应答数据组的所有下一周期应答指令数据,进行一次标记;

19、对所有标记的数据进行二次标记,所述标记包括:

20、对任一组历史数据的分析数据,计算数据a或应答数据组的占用数据比例:或,其中,e代表占用数据比例,代表当前周期应答指令数据的总数量;代表应答数据组的应答指令数据的总数量;

21、将占用数据比例e标记在对应的选择出的下一周期应答指令数据上,对所有的下一周期应答指令数据进行调整,相同的下一周期应答指令数据设置为同一组,同时计算每一组内标记的e的总和,作为同一组下一周期应答指令数据的输出值,系统设置阈值,对输出值超出阈值的组进行提取,选取提取出的组对应的下一周期应答指令数据作为下一周期的第一应答指令数据。

22、根据上述技术方案,所述推测形成下一周期的第二应答指令数据包括:

23、基于时钟模块获取时间信息数据,基于历史数据下各时间信息数据的应答指令数据,选取当前时间信息数据所在的时间周期,以每一天作为一个周期循环范围,获取同一时间周期下的应答指令数据,对相同的应答指令数据进行归类,对任一类别,记当前类别下的应答指令数据的总数量为类别输出,若存在,则判断对应的应答指令数据为推测形成下一周期的第二应答指令数据,其中,代表第i各类别下的类别输出;代表同一时间周期下的所有应答指令数据的总数量;h代表同一时间周期下形成的类别数量。

24、根据上述技术方案,所述唤醒本地语音识别引擎,建立本地控制逻辑,形成离线语音控制包括:

25、在系统内部嵌入开源的语音识别引擎,根据识别结果调用控制逻辑,根据控制逻辑调用相应的硬件控制代码,实现离线语音控制。

26、基于远场语音模块的智能交互系统,所述智能交互系统包括:

27、语音采集与预处理模块,用于负责捕获用户的语音输入信号,对语音输入信号进行初步处理,形成预处理后的语音输入信号,检测网络状态,根据不同网络状态形成不同的处理反馈机制;

28、后处理与反馈模块,用于接收预处理后的语音输入信号,结合声学模型和语言模型,对预处理后的语音输入信号进行识别和优化,形成最终的处理文本;

29、特征扩展模块,用于调用最终的处理文本,开启自保护机制,使用系统设定的周期方式,调用大数据库中的历史应答指令数据,基于大数据训练,形成下一周期的第一应答指令数据;

30、时间推测模块,用于获取当前时间数据,使用系统设定的周期方式,推测形成下一周期的第二应答指令数据;

31、离线语音控制模块,用于设立存储空间,存储第一应答指令数据与第二应答指令数据中的重合应答指令数据,唤醒本地语音识别引擎,建立本地控制逻辑,形成离线语音控制;

32、智能交互模块,用于基于处理文本形成智能交互。

33、根据上述技术方案,所述语音采集与预处理模块中包括:

34、自动网络状态识别,包括在线网络与离线网络,在网络正常时,以在线网络进行工作,在网络异常情况下,关闭在线网络入口,以离线网络进行工作;

35、手动网络状态识别,用于管理员设置相应的口令,能够手动调整至离线网络。

36、根据上述技术方案,所述时间推测模块还连接有时钟模块,所述时钟模块提供时间信息数据;

37、所述时钟模块还包含时钟数据库,所述时钟数据库内存储有历史数据中任一项应答指令对应的时间信息数据。

38、与现有技术相比,本专利技术的有益效果是:本申请在语音交互飞速发展的时代,提出以保护隐私为主,同时能够解决断网或者网络干扰带来的离线语音控制问题,极大丰富语音交本文档来自技高网...

【技术保护点】

1.基于远场语音模块的智能交互方法,其特征在于:所述方法包括以下步骤:

2.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:所述对语音输入信号进行初步处理包括:

3.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:所述对预处理后的语音输入信号进行识别和优化包括:

4.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:所述基于大数据训练,形成下一周期的第一应答指令数据包括:

5.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:所述推测形成下一周期的第二应答指令数据包括:

6.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:所述唤醒本地语音识别引擎,建立本地控制逻辑,形成离线语音控制包括:

7.基于远场语音模块的智能交互系统,其特征在于:所述智能交互系统包括:

8.根据权利要求7所述的基于远场语音模块的智能交互系统,其特征在于:所述语音采集与预处理模块中包括:

9.根据权利要求7所述的基于远场语音模块的智能交互系统,其特征在于:所述时间推测模块还连接有时钟模块,所述时钟模块提供时间信息数据;

...

【技术特征摘要】

1.基于远场语音模块的智能交互方法,其特征在于:所述方法包括以下步骤:

2.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:所述对语音输入信号进行初步处理包括:

3.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:所述对预处理后的语音输入信号进行识别和优化包括:

4.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:所述基于大数据训练,形成下一周期的第一应答指令数据包括:

5.根据权利要求1所述的基于远场语音模块的智能交互方法,其特征在于:...

【专利技术属性】
技术研发人员:张国虎田现增杨志文丁黎
申请(专利权)人:南京嘉浩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1