【技术实现步骤摘要】
一种基于人工智能的随身机器人的实现方法及系统
[0001]本专利技术涉及人工智能领域,具体而言,涉及一种基于人工智能的随身机器人的实现方法及系统。
技术介绍
[0002]人工智能(AI,Artificial Intelligence),是指利用计算机等现代化工具来模拟人类或者其它生物的思维和行动的技术。随着AI技术的日渐进步,AI技术已被应用于生产生活的各个方面,包括:计算机科学、金融贸易、医药、诊断、重工业、运输、远程通讯、在线和电话服务、法律、科学发现、玩具和游戏、音乐等诸多方面。当AI技术被应用于游戏应用程序或者一些仿真模拟系统中时,会生成一个与人或者其它生物具有相似行为的虚拟主体,该主体即为AI智能体。当AI技术被应用于医药领域时,能够帮助扫描数据图像,计算并从X光断层图发现疾病,例如发现肿块。当AI技术被应用于重工业领域时,能够被做成各种形式的机器人,帮助人类做一些繁琐、劳累的工作,提高工业生产效率。
[0003]但目前大部分机器人公司都致力于研究“人型机器人”,致力于将机器人的手脚做得灵活,运动做得类人和流畅,而实际上只有机器人拥有了类似于人类的常识,机器人才可能产生类似于人类的思维活动。因而机器人如何建立类似于人类的知识网络,并利用知识网络对信息进行分析以指导自己的行为,仍然是一个值得研究的问题。
技术实现思路
[0004]本专利技术的目的在于提供一种基于人工智能的随身机器人的实现方法及系统,其能够通过对使用者的生活日常行为的学习,根据使用者的实际情况,为使用者出谋划策。 >[0005]为解决上述技术问题,本专利技术采用的技术方案为:
[0006]第一方面,本申请提供一种基于人工智能的随身机器人的实现方法,其包括:
[0007]采集使用者的自身信息、周围的环境信息和人物信息,形成对应的语音数据和图像数据并存储于记忆池中;
[0008]利用预置的特征提取模型对语音数据和图像数据进行特征提取,并保留上述特征在时间和空间上的相对位置关系,形成关系网络;
[0009]获取新输入的数据提取出特征,并在上述关系网络中搜索相关的特征并激活;
[0010]将新输入的数据与记忆池中激活的相关记忆数据的特征进行重组,基于重组结果建立对新输入的数据的响应,并转换为对应的输出形式。
[0011]进一步的,上述对语音数据的特征提取包括:
[0012]利用高通滤波器在时域上对语音数据进行预加重处理,并进行分帧加窗处理,截取短时音频片段;
[0013]对短时音频片段进行短时傅里叶变换,获取傅里叶变换的模,得到频谱特征;
[0014]利用梅尔滤波器组对频谱特征进行滤波,并进行对数操作,得到滤波器组特征;
[0015]对滤波器组特征进行倒谱分析和离散傅里叶逆变换,得到梅尔倒谱系数特征,并
基于梅尔倒谱系数特征通过一阶差分操作来获取音频的动态特征。
[0016]进一步的,上述对图像数据的特征提取包括:
[0017]对图像进行灰度化处理,并采用Gamma校正法对图像进行颜色空间的标准化处理;
[0018]计算处理后的图像中每个像素的梯度,并将图像划分成若干细胞单元,并统计每个细胞单元的梯度方向直方图,得到梯度向量;
[0019]将细胞单元组合成块,并分别将每一个块内的细胞单元的梯度向量串联起来形成HOG特征并进行归一化;
[0020]对所有重叠的块进行HOG特征收集,结合形成最终的特征向量。
[0021]进一步的,上述将新输入的数据与记忆池中激活的相关记忆数据的特征进行重组,基于重组结果建立对新输入的数据的响应的步骤包括:
[0022]基于记忆池中激活的相关记忆数据的特征,利用所激活的信息来预测潜在响应信息;
[0023]将新输入的数据与记忆池中激活的相关记忆数据的特征进行重组,并在预测的潜在响应信息范围内,按照趋利避害的原则,搜索最优响应路径。
[0024]第二方面,本申请提供一种基于人工智能的随身机器人的实现系统,其包括:
[0025]信息采集模块,用于采集使用者的自身信息、周围的环境信息和人物信息,形成对应的语音数据和图像数据并存储于记忆池中;
[0026]特征提取模块,用于利用预置的特征提取模型对语音数据和图像数据进行特征提取,并保留上述特征在时间和空间上的相对位置关系,形成关系网络;
[0027]信息理解模块,用于获取新输入的数据提取出特征,并在上述关系网络中搜索相关的特征并激活;
[0028]响应输出模块,用于将新输入的数据与记忆池中激活的相关记忆数据的特征进行重组,基于重组结果建立对新输入的数据的响应,并转换为对应的输出形式。
[0029]第三方面,本申请提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当上述一个或多个程序被上述处理器执行时,实现如上述第一方面中任一项上述的方法。
[0030]第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项上述的方法。
[0031]相对于现有技术,本专利技术至少具有如下优点或有益效果:
[0032]本申请提供一种基于人工智能的随身机器人的实现方法及系统,首先,采集使用者的自身信息、周围的环境信息和人物信息,形成对应的语音数据和图像数据并存储于记忆池中。然后,利用预置的特征提取模型对语音数据和图像数据进行特征提取,并保留上述特征在时间和空间上的相对位置关系,形成关系网络。之后,获取新输入的数据提取出特征,并且在关系网络中搜索相关的特征并激活。最后,将新输入的数据与记忆池中激活的相关记忆数据的特征进行重组,基于重组结果建立对新输入的数据的响应,并转换为对应的输出形式。从而通过对使用者的生活日常行为的学习,根据使用者的实际情况,为使用者出谋划策。
附图说明
[0033]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0034]图1为本专利技术提供的一种基于人工智能的随身机器人的实现方法一实施例的步骤框图;
[0035]图2为本专利技术提供的一种基于人工智能的随身机器人的实现方法一实施例中对语音数据进行特征提取的流程示意图;
[0036]图3为本专利技术提供的一种基于人工智能的随身机器人的实现方法一实施例中对图像数据进行特征提取的流程示意图;
[0037]图4为本专利技术提供的一种基于人工智能的随身机器人的实现系统一实施例的结构框图;
[0038]图5为本专利技术实施例提供的一种电子设备的结构框图。
[0039]图标:1、存储器;2、处理器;3、通信接口;11、信息采集模块;12、特征提取模块;13、信息理解模块;14、响应输出模块。
具体实施方式
...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能的随身机器人的实现方法,其特征在于,包括:采集使用者的自身信息、周围的环境信息和人物信息,形成对应的语音数据和图像数据并存储于记忆池中;利用预置的特征提取模型对语音数据和图像数据进行特征提取,并保留所述特征在时间和空间上的相对位置关系,形成关系网络;获取新输入的数据提取出特征,并在所述关系网络中搜索相关的特征并激活;将新输入的数据与记忆池中激活的相关记忆数据的特征进行重组,基于重组结果建立对新输入的数据的响应,并转换为对应的输出形式。2.如权利要求1所述的一种基于人工智能的随身机器人的实现方法,其特征在于,对语音数据的特征提取包括:利用高通滤波器在时域上对语音数据进行预加重处理,并进行分帧加窗处理,截取短时音频片段;对短时音频片段进行短时傅里叶变换,获取傅里叶变换的模,得到频谱特征;利用梅尔滤波器组对频谱特征进行滤波,并进行对数操作,得到滤波器组特征;对滤波器组特征进行倒谱分析和离散傅里叶逆变换,得到梅尔倒谱系数特征,并基于梅尔倒谱系数特征通过一阶差分操作来获取音频的动态特征。3.如权利要求1所述的一种基于人工智能的随身机器人的实现方法,其特征在于,对图像数据的特征提取包括:对图像进行灰度化处理,并采用Gamma校正法对图像进行颜色空间的标准化处理;计算处理后的图像中每个像素的梯度,并将图像划分成若干细胞单元,并统计每个细胞单元的梯度方向直方图,得到梯度向量;将细胞单元组合成块,并分别将每一个块内的细胞单元的梯度向量串联起来形成HOG特征并进行归一化;对所有重叠的块进行HOG特征收集,结合形成最终的特征向量。...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。