一种基于AI大模型的视觉交互多功能机器人制造技术

技术编号：44959299 阅读：9 留言：0更新日期：2025-04-12 01:28

本发明专利技术公开了一种基于AI大模型的视觉交互多功能机器人，该产品具备独立操作及作为电脑配件的双重功能。在独立模式下，机器人通过按键唤醒、指定唤醒词或实时监听对话三种方式激活语音对话，将语音转换为文字，利用哈希算法处理后发送至大模型，并实时将大模型的回答转换为语音反馈。其创新之处在于情绪识别与表情同步能力，通过情感人工智能算法分析用户语音中的情绪特征，并实时调整表情以实现情感共鸣，提升用户体验。连接至电脑时，机器人可控制鼠标移动、点击操作，通过人脸识别解锁电脑，手势控制应用打开及模拟键盘输入，同时支持语音控制播放电影、快进、全屏等操作，显著提高工作效率和用户互动的趣味性。

全部详细技术资料下载

【技术实现步骤摘要】

(一)本专利技术属于智能机器人领域，具体是涉及ai大模型对话跟视觉交互的多功能桌面机器人。

技术介绍

0、(二)
技术介绍

1、当前市场上的桌面机器人种类繁多，然而它们在功能性和实用性方面存在一定的局限性。尽管部分高端产品具备一定的实用性，但其高昂的价格使得它们难以普及。大多数桌面机器人仅能进行基础的互动，尚未达到作为生产力助手以提升工作效率的实际效用。因此，我们面临的挑战在于如何开发出既经济实惠又具备高实用性的桌面机器人，以满足市场对于提高工作效率的需求。

技术实现思路

0、(三)
技术实现思路

1、本专利技术主要是针对上述问题去让桌面机器人有陪伴性跟实用性，本专利技术采用了以下技术放方案：

2、在语音转文字方面，我采用了一种创新算法，该算法能够在语音识别过程中，通过独特的文本拼接方法与人工智能大型模型进行交互，以确保转写内容的连贯性和完整性。此外，该算法支持实时语音转写，实现了边说边传输的功能，从而显著提升了与人工智能对话的流畅度和响应速度。

3、情绪识别技术旨在通过分析用户的语音、面部表情等来识别其情绪状态。这种技术可以使得机器人或计算机系统能够理解用户的情感，并据此调整其反应，以实现更自然的人机交互。表情同步机制则是指机器人根据识别到的情绪自动调整其面部表情，以匹配用户的情绪，增强情感共鸣。

4、利用机器学习学会多种手势进行交互，可以读取到手指的各种信息包括位置方向速度轨迹等可以使手指传达出更加丰富的信息使交互更加智能

本文档来自技高网...

【技术保护点】

1.一种基于AI大模型的视觉交互多功能机器人，其特征在于，包括：

2.根据权利要求1所述的机器人，其特征在于，所述情感分析模块进一步包括：一个面部识别子功能，用于捕捉用户的面部表情；

3.根据权利要求1所述的机器人，其特征在于，所述用户习惯学习单元包括：一个习惯记录器，用于记录用户在一定时间内的电脑使用行为；

4.根据权利要求1所述的机器人，其特征在于，所述手势识别单元能够学习并执行以下操作：

5.一种使用如权利要求1至4任一项所述的基于AI大模型的视觉交互多功能机器人的方法，其特征在于，包括以下步骤：

【技术特征摘要】

1.一种基于ai大模型的视觉交互多功能机器人，其特征在于，包括：

2.根据权利要求1所述的机器人，其特征在于，所述情感分析模块进一步包括：一个面部识别子功能，用于捕捉用户的面部表情；

3.根据权利要求1所述的机器人，其特征在于，所述用户习惯学习单元包括：...

【专利技术属性】
技术研发人员：胡鸿志，张龙，黄浩楠，林书越，魏玉龙，黄益金，李高杰，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人