录入信息的方法和装置制造方法及图纸

技术编号:33392268 阅读:42 留言:0更新日期:2022-05-11 23:10
本公开提供了录入信息的方法和装置,涉及人工智能领域,尤其涉及语音技术领域。具体实现方案为:获取语音数据;将所述语音数据转换成文本信息,并将所述文本信息切词后得到词序列;将所述词序列与表单中预定的字段名称进行匹配;将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。该实施方式允许通过说话、口述的方式记录信息,并进一步解析用于口述内容中的关键信息,以完成自动地信息录入。息录入。息录入。

【技术实现步骤摘要】
录入信息的方法和装置


[0001]本公开涉及人工智能领域,尤其涉及语音
,具体为一种录入信息的方法和装置。

技术介绍

[0002]传统的表格录入一般使用键盘和鼠标等输入装置。在一些在输入时无法解放双手的使用场景下,这种表格录入方式存在不便。例如,社区调查员一边通电话、一边通过键盘记录关键信息,十分不便,现有方案语音识别后的结果无法自动进一步整理,重点信息不突出,人工二次审核成本高;电力路线巡检工作人员在高空巡检高压电线路,但文字记录巡检结果不便记录、滞后记录工单则可能导致信息遗漏;某品牌汽车售后客服话务员每天接通约300通电话,录入用户投诉的经销商、车辆型号、车辆年份、投诉问题,期待解决的时间、用户情绪等字段信息,重复性工作耗时长、易出错。

技术实现思路

[0003]本公开提供了一种录入信息的方法、装置、设备、存储介质以及计算机程序产品。
[0004]根据本公开的第一方面,提供了一种录入信息的方法,包括:获取语音数据;将所述语音数据转换成文本信息,并将所述文本信息切词后得到词序列;将所述词序列与表单中预定的字段名称进行匹配;将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。
[0005]根据本公开的第二方面,提供了一种录入信息的装置,包括:获取单元,被配置成获取语音数据;转换单元,被配置成将所述语音数据转换成文本信息,并将所述文本信息切词后得到词序列;匹配单元,被配置成将所述词序列与表单中预定的字段名称进行匹配;填充单元,被配置成将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。
[0006]根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
[0007]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行第一方面所述的方法。
[0008]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面所述的方法。
[0009]本公开的实施例提供的录入信息的方法和装置,允许通过说话、口述的方式记录信息,并进一步解析用于口述内容中的关键信息,以完成自动的信息录入,并带有信息补录功能。
[0010]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特
征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0011]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0012]图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
[0013]图2是根据本公开的录入信息的方法的一个实施例的流程图;
[0014]图3是根据本公开的录入信息的方法的又一个实施例的流程图;
[0015]图4a、4b是根据本公开的录入信息的方法的一个应用场景的示意图;
[0016]图5是根据本公开的录入信息的装置的一个实施例的结构示意图;
[0017]图6是适于用来实现本公开的实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0018]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0019]图1示出了可以应用本公开的录入信息的方法或录入信息的装置的实施例的示例性系统架构100。
[0020]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0021]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如表单类应用、网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
[0022]终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有麦克风并且支持语音录入的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
[0023]服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上运行的语音录入软件提供支持的后台服务器。后台服务器可以采集用户填个写的表单信息,进行分析生成样本,用于训练阅读理解模型。终端设备可在本地安装阅读理解模型,在本地采集语音并在本地进行语音识别后填表。终端设备也可将语音发送到服务器,由服务器进行语音识别后填表,完成的表单再返回给终端设备。
[0024]需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可
以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。服务器也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。
[0025]需要说明的是,本公开的实施例所提供的录入信息的方法可以由终端设备101、102、103执行,也可以由服务器105执行。相应地,录入信息的装置可以设置于终端设备101、102、103中,也可以设置于服务器105中。在此不做具体限定。
[0026]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0027]继续参考图2,示出了根据本公开的录入信息的方法的一个实施例的流程200。该录入信息的方法,包括以下步骤:
[0028]步骤201,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种录入信息的方法,包括:获取语音数据;将所述语音数据转换成文本信息,并将所述文本信息切词后得到词序列;将所述词序列与表单中预定的字段名称进行匹配;将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。2.根据权利要求1所述的方法,其中,所述方法还包括:将所述词序列中未填入表单的词和非字段词作为目标文本,将所述表单中未填充的字段词作为问题输入预先训练的阅读理解模型,从所述目标文本中查找到问题的答案填入所述表单。3.根据权利要求1或2所述的方法,其中,所述方法还包括:若所述表单中目标字段填写的内容与预设词典中的规范词同音,则用规范词替换目标字段填写的内容。4.根据权利要求1所述的方法,其中,所述方法还包括:响应于检测到表单中补录字段,输出包括补录字段名称的补录通知信息。5.根据权利要求4所述的方法,其中,所述方法还包括:响应于接收到补录请求,将补录的语音转换成补录文本;将所述补录文本与补录字段的名称进行匹配;将匹配成功的字段的名称之后的内容填入表单中相应字段的位置。6.根据权利要求2所述的方法,其中,所述方法还包括:根据填充完的表单生成所述文本信息的标注信息构造训练样本;基于所述训练样本重新训练所述阅读理解模型。7.一种录入信息的装置,包括:获取单元,被配置成获取语音数据;转换单元,被配置成将所述语音数据转换成文本信息,并将所述文本信息切词后得到词序列;匹配单元,被配置成将所述词序列与表单中预定的字段名称进行匹配;填充单元,被配置成将匹配成功的字段名称之后的预定长度的内容填入表单中相应字段的位置。8.根据权利要求7所述的装置,其中,所述装置还包括理解单元,被配置成:将所述词序列中未填入...

【专利技术属性】
技术研发人员:张禹王雅婷韩磊刘凯李婷婷
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1