System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
所属的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。与上述方法实施例基于同一专利技术构思,本申请实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器120。在该实施例中,电子设备的结构可以如图18所示,包括存储器1801,通讯模块1803以及一个或多个处理器1802。存储器1801,用于存储处理器1802执行的计算机程序。存储器1801可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。存储器1801可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器1801也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,hdd)或固态硬盘(solid-state drive,ssd);或者存储器1801是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器1801可以是上述存储器的组合。处理器1802,可以包括一个或多个中央处理单元(central processing unit,cpu)
...【技术保护点】
1.一种文本纠错方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述对所述目标文本进行至少一轮的纠错处理,得到纠错后文本,还包括:
3.如权利要求1所述的方法,其特征在于,通过如下方式确定所述第一预测概率和所述第二预测概率满足预设的阈值条件:
4.如权利要求1所述的方法,其特征在于,所述目标纠错信息包括目标纠错操作;所述基于所述目标编辑操作和所述目标纠错信息中的至少一种,对当前目标文本中的相应词元进行纠错,包括:
5.如权利要求4所述的方法,其特征在于,所述根据比较结果对当前目标文本中的相应词元进行纠错,包括:
6.如权利要求5所述的方法,其特征在于,所述基于所述目标纠错信息,对当前目标文本中的相应词元进行纠错,包括:
7.如权利要求5所述的方法,其特征在于,所述基于所述目标编辑操作,对当前目标文本中的相应词元进行纠错,包括:
8.如权利要求1所述的方法,其特征在于,第一轮纠错处理时的当前目标文本为初始获得的所述待纠错的目标文本;后续每轮纠错处理时的当前目标文本为通过上一
9.如权利要求1~8任一项所述的方法,其特征在于,所述检错子网络为包含两个多层感知器的多分类子网络;将所述词元的文本嵌入特征输入所述已训练的纠错模型中的检错子网络进行多分类,预测得到所述词元对应的目标编辑操作和所述目标编辑操作对应的第一预测概率:
10.如权利要求1~8任一项所述的方法,其特征在于,所述纠错子网络为包含两个多层感知器的多分类子网络;将所述词元的文本嵌入特征输入所述已训练的纠错模型中的纠错子网络进行多分类,预测得到所述词元对应的目标纠错信息和所述目标纠错信息对应的第二预测概率,包括:
11.一种纠错模型训练方法,其特征在于,所述方法包括:
12.如权利要求11所述的方法,其特征在于,所述检错子网络为包含两个多层感知器的多分类子网络;将所述词元的文本嵌入特征输入所述待训练的纠错模型中的检错子网络进行多分类,预测得到所述词元对应的第一样本概率,包括:
13.如权利要求11所述的方法,其特征在于,所述纠错子网络为包含两个多层感知器的多分类子网络;将所述词元的文本嵌入特征输入所述待训练的纠错模型中的纠错子网络进行多分类,预测得到所述词元对应的第二样本概率,包括:
14.如权利要求11所述的方法,其特征在于,所述基于所述各训练样本各自对应的第一样本概率、第二样本概率、第三样本概率和相应的样本标签,对所述待训练的纠错模型进行参数调整,包括:
15.如权利要求11~14任一项所述的方法,其特征在于,所述训练样本集中的病句文本通过如下方式构造生成:
16.如权利要求15所述的方法,其特征在于,所述根据获得的词性,对所述正确文本中指定词性的词元进行调整,包括如下至少一种:
17.一种文本纠错装置,其特征在于,包括:
18.一种纠错模型训练装置,其特征在于,包括:
19.一种电子设备,其特征在于,其包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~10中任一所述方法的步骤或权利要求11~16中任一所述方法的步骤。
20.一种计算机可读存储介质,其特征在于,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1~10中任一所述方法的步骤或权利要求11~16中任一所述方法的步骤。
...【技术特征摘要】
1.一种文本纠错方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述对所述目标文本进行至少一轮的纠错处理,得到纠错后文本,还包括:
3.如权利要求1所述的方法,其特征在于,通过如下方式确定所述第一预测概率和所述第二预测概率满足预设的阈值条件:
4.如权利要求1所述的方法,其特征在于,所述目标纠错信息包括目标纠错操作;所述基于所述目标编辑操作和所述目标纠错信息中的至少一种,对当前目标文本中的相应词元进行纠错,包括:
5.如权利要求4所述的方法,其特征在于,所述根据比较结果对当前目标文本中的相应词元进行纠错,包括:
6.如权利要求5所述的方法,其特征在于,所述基于所述目标纠错信息,对当前目标文本中的相应词元进行纠错,包括:
7.如权利要求5所述的方法,其特征在于,所述基于所述目标编辑操作,对当前目标文本中的相应词元进行纠错,包括:
8.如权利要求1所述的方法,其特征在于,第一轮纠错处理时的当前目标文本为初始获得的所述待纠错的目标文本;后续每轮纠错处理时的当前目标文本为通过上一轮纠错处理获得的纠错后文本。
9.如权利要求1~8任一项所述的方法,其特征在于,所述检错子网络为包含两个多层感知器的多分类子网络;将所述词元的文本嵌入特征输入所述已训练的纠错模型中的检错子网络进行多分类,预测得到所述词元对应的目标编辑操作和所述目标编辑操作对应的第一预测概率:
10.如权利要求1~8任一项所述的方法,其特征在于,所述纠错子网络为包含两个多层感知器的多分类子网络;将所述词元的文本嵌入特征输入所述已训练的纠错模型中的纠错子网络进行多分类,预测得到所述词元对应的目标纠错信息和所述目标纠错信息对应的第二预测概率...
【专利技术属性】
技术研发人员:杨善明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。