录入信息的方法和装置制造方法及图纸

技术编号：33392268 阅读：42 留言：0更新日期：2022-05-11 23:10

本公开提供了录入信息的方法和装置，涉及人工智能领域，尤其涉及语音技术领域。具体实现方案为：获取语音数据；将所述语音数据转换成文本信息，并将所述文本信息切词后得到词序列；将所述词序列与表单中预定的字段名称进行匹配；将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。该实施方式允许通过说话、口述的方式记录信息，并进一步解析用于口述内容中的关键信息，以完成自动地信息录入。息录入。息录入。

全部详细技术资料下载

【技术实现步骤摘要】
录入信息的方法和装置

[0001]本公开涉及人工智能领域，尤其涉及语音
，具体为一种录入信息的方法和装置。

技术介绍

[0002]传统的表格录入一般使用键盘和鼠标等输入装置。在一些在输入时无法解放双手的使用场景下，这种表格录入方式存在不便。例如，社区调查员一边通电话、一边通过键盘记录关键信息，十分不便，现有方案语音识别后的结果无法自动进一步整理，重点信息不突出，人工二次审核成本高；电力路线巡检工作人员在高空巡检高压电线路，但文字记录巡检结果不便记录、滞后记录工单则可能导致信息遗漏；某品牌汽车售后客服话务员每天接通约300通电话，录入用户投诉的经销商、车辆型号、车辆年份、投诉问题，期待解决的时间、用户情绪等字段信息，重复性工作耗时长、易出错。

技术实现思路

[0003]本公开提供了一种录入信息的方法、装置、设备、存储介质以及计算机程序产品。
[0004]根据本公开的第一方面，提供了一种录入信息的方法，包括：获取语音数据；将所述语音数据转换成文本信息，并将所述文本信息切词后得到词序列；将所述词序列与表单中预定的字段名称进行匹配；将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。
[0005]根据本公开的第二方面，提供了一种录入信息的装置，包括：获取单元，被配置成获取语音数据；转换单元，被配置成将所述语音数据转换成文本信息，并将所述文本信息切词后得到词序列；匹配单元，被配置成将所述词序列与表单中预定的字段名称进行匹配；填充单元，被配置成将匹配成功的字段名称之后的预定长度...

【技术保护点】

【技术特征摘要】
1.一种录入信息的方法，包括：获取语音数据；将所述语音数据转换成文本信息，并将所述文本信息切词后得到词序列；将所述词序列与表单中预定的字段名称进行匹配；将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。2.根据权利要求1所述的方法，其中，所述方法还包括：将所述词序列中未填入表单的词和非字段词作为目标文本，将所述表单中未填充的字段词作为问题输入预先训练的阅读理解模型，从所述目标文本中查找到问题的答案填入所述表单。3.根据权利要求1或2所述的方法，其中，所述方法还包括：若所述表单中目标字段填写的内容与预设词典中的规范词同音，则用规范词替换目标字段填写的内容。4.根据权利要求1所述的方法，其中，所述方法还包括：响应于检测到表单中补录字段，输出包括补录字段名称的补录通知信息。5.根据权利要求4所述的方法，其中，所述方法还包括：响应于接收到补录请求，将补录的语音转换成补录文本；将所述补录文本与补录字段的名称进行匹配；将匹配成功的字段的名称之后的内容填入表单中相应字段的位置。6.根据权利要求2所述的方法，其中，所述方法还包括：根据填充完的表单生成所述文本信息的标注信息构造训练样本；基于所述训练样本重新训练所述阅读理解模型。7.一种录入信息的装置，包括：获取单元，被配置成获取语音数据；转换单元，被配置成将所述语音数据转换成文本信息，并将所述文本信息切词后得到词序列；匹配单元，被配置成将所述词序列与表单中预定的字段名称进行匹配；填充单元，被配置成将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。8.根据权利要求7所述的装置，其中，所述装置还包括理解单元，被配置成：将所述词序列中未填入...

【专利技术属性】
技术研发人员：张禹，王雅婷，韩磊，刘凯，李婷婷，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人