信息交互方法和装置制造方法及图纸

技术编号：27227703 阅读：55 留言：0更新日期：2021-02-04 11:50

本公开的实施例公开了信息交互方法和装置。该方法的一具体实施方式包括：响应于接收到用户发起的点读请求，获取待识别图像和用户输入的语音信息，其中，待识别图像是对用户指向的点读对象进行拍摄所获得的图像，点读对象包括目标数量个文字；对待识别图像进行识别，获得包括目标数量个文字的目标文本；对语音信息进行识别，获得用于表征用户的用户意图的意图信息；基于意图信息，获取及输出目标文本所对应的音频。该实施方式可以基于用户的手势和语音进行点读，有助于在点读时识别出用户的真实意图，进而输出与用户的真实意图相匹配的音频，提高了信息交互的准确性。提高了信息交互的准确性。提高了信息交互的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
信息交互方法和装置

[0001]本公开的实施例涉及计算机
，尤其涉及信息交互方法和装置。

技术介绍

[0002]点读是针对学生设计的、用于辅助学生学习的一种技术。现有技术中已经存在用于学生点读的点读设备，例如点读机、点读笔等。
[0003]具体的，用户在学习过程中，遇到不认识的字或词时，可以通过手势指向不认识的字或词，进而点读设备可以对用户的手势进行识别，以确定用户指向的对象，进而获取及播放用户指向的对象的读音。

技术实现思路

[0004]本公开的实施例提出了信息交互方法和装置。
[0005]第一方面，本公开的实施例提供了一种信息交互方法，该方法包括：响应于接收到用户发起的点读请求，获取待识别图像和用户输入的语音信息，其中，待识别图像是对用户指向的点读对象进行拍摄所获得的图像，点读对象包括目标数量个文字；对待识别图像进行识别，获得包括目标数量个文字的目标文本；对语音信息进行识别，获得用于表征用户的用户意图的意图信息；基于意图信息，获取及输出目标文本所对应的音频。
[0006]在一些实施例中，基于意图信息，获取及输出目标文本所对应的音频包括：响应于意图信息表征用户的用户意图为识别文字，获取及输出目标文本包括的文字所对应的音频。
[0007]在一些实施例中，基于意图信息，获取及输出目标文本所对应的音频包括：响应于意图信息表征用户的用户意图为识别词汇，确定目标文本是否包括词汇；响应于目标文本包括词汇，获取及输出目标文本包括的词汇所对应的音频。
[0008]在一些...

【技术保护点】

【技术特征摘要】
1.一种信息交互方法，包括：响应于接收到用户发起的点读请求，获取待识别图像和所述用户输入的语音信息，其中，所述待识别图像是对所述用户指向的点读对象进行拍摄所获得的图像，所述点读对象包括目标数量个文字；对所述待识别图像进行识别，获得包括所述目标数量个文字的目标文本；对所述语音信息进行识别，获得用于表征所述用户的用户意图的意图信息；基于所述意图信息，获取及输出所述目标文本所对应的音频。2.根据权利要求1所述的方法，其中，所述基于所述意图信息，获取及输出所述目标文本所对应的音频包括：响应于所述意图信息表征所述用户的用户意图为识别文字，获取及输出所述目标文本包括的文字所对应的音频。3.根据权利要求1所述的方法，其中，所述基于所述意图信息，获取及输出所述目标文本所对应的音频包括：响应于所述意图信息表征所述用户的用户意图为识别词汇，确定所述目标文本是否包括词汇；响应于所述目标文本包括词汇，获取及输出所述目标文本包括的词汇所对应的音频。4.根据权利要求3所述的方法，其中，所述基于所述意图信息，获取及输出所述目标文本所对应的音频还包括：响应于所述目标文本不包括词汇，获取及输出所述目标文本包括的文字所对应的音频。5.根据权利要求1-4之一所述的方法，其中，在所述获取及输出所述目标文本所对应的音频之后，所述方法还包括：获取所述用户针对获取到的音频输入的跟读音频；对所述跟读音频和所输出的、所述目标文本所对应的音频进行匹配，获得匹配结果及输出。6.一种信息交互装置，包括：第一获取单元，被配置成响应于接收到用户发起的点读请求，获取待识别图像和所述用户输入的语音信息，其中，所述待识别图像是对所述用户指向的点读对象进行拍...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人