一种错别词识别方法及装置制造方法及图纸

技术编号:31236445 阅读:15 留言:0更新日期:2021-12-08 10:19
本申请实施例提供了一种错别词识别方法及装置。可以先接收并在页面的第一显示区域中显示用户输入的目标文本。可以对目标文本进行错别词识别,并在页面的第二显示区域中显示所述目标文本对应的错别词对列表。其中,错别词对列表可以包括一个或多个错别词对,每个错别词对可以包括目标文本中的错别词和用于对错别词进行纠错的正确词,错别词可以包括实体词和/或非实体词,实体词和非实体词是基于不同方式从目标文本中识别得到的。这样,可以准确地从目标文本中找到存在错误的错别词,并通过第二显示区域显示给用户,使得用户能够看到目标文本中存在的错别词。如此,用户能够方便快捷地对目标文本中的错别词进行处理。捷地对目标文本中的错别词进行处理。捷地对目标文本中的错别词进行处理。

【技术实现步骤摘要】
一种错别词识别方法及装置


[0001]本申请涉及计算机领域,尤其涉及一种错别词识别方法及装置。

技术介绍

[0002]随着计算机技术的发展,越来越多的人选择利用计算机代替手写对文本进行处理。这样,由于计算机具有便于修改等特点,利用计算机可以高效地对文本进行撰写、编辑和修改等操作,大大提高了办公效率。但是,计算机中的文本由用户手动输入,用户在输入或编辑文本时难免会存在疏漏,导致文本存在错别词。因此,亟需一种能够识别文本中错别词的方法。

技术实现思路

[0003]为了解决现有技术,本申请实施例提供了一种错别词识别方法及装置。
[0004]第一方面,本申请实施例提供了一种错别词识别方法,所述方法包括:
[0005]接收并在页面的第一显示区域中显示用户输入的目标文本;
[0006]在所述页面的第二显示区域显示所述目标文本对应的错别词对列表;其中,所述错别词对列表包括一个或多个错别词对,所述错别词对包括所述目标文本中的错别词和用于对所述错别词进行纠错的正确词,所述错别词包括实体词和/或非实体词,所述实体词和所述非实体词基于不同方式从所述目标文本中识别得到。
[0007]第二方面,本申请实施例提供了一种错别词识别方法,所述方法包括:
[0008]获取目标文本;
[0009]将所述目标文本输入到错字纠错模型中,得到纠错文本,所述纠错文本为所述目标文本中的错别词被纠正之后的正确文本,所述错字纠错模型根据错误句对训练得到,所述错误句对包括错误句和正确句,所述错误句为包括错别词的句子,所述正确句为不包括错别词的句子;
[0010]比对所述目标文本和所述纠错文本,得到第一错别词对列表,所述第一错别词对列表包括所述目标文本中的第一错别词以及所述纠错文本中与所述第一错别词对应的第一正确词,所述第一错别词为非实体词;
[0011]从所述目标文本中识别多个实体词,根据所述多个实体词中任意两个实体词的相似度确定第二错别词对列表,所述第二错别词列表包括第二错别词和第二正确词,所述第二错别词和所述第二正确词均为实体词;
[0012]根据所述第一错别词对列表和所述第二错别词对列表得到所述目标文本的错别词对列表。
[0013]第三方面,本申请实施例提供了、一种错别词识别装置,所述装置包括:
[0014]获取模块,用于接收并在页面的第一显示区域中显示用户输入的目标文本;
[0015]显示模块,用于在所述页面的第二显示区域显示所述目标文本对应的错别词对列表;其中,所述错别词对列表包括一个或多个错别词对,所述错别词对包括所述目标文本中
的错别词和用于对所述错别词进行纠错的正确词,所述错别词包括实体词和/或非实体词,所述实体词和所述非实体词基于不同方式从所述目标文本中识别得到。
[0016]第四方面,本申请实施例提供了一种错别词识别装置,所述装置包括:
[0017]获取模块,用于获取目标文本;
[0018]纠错模块,用于将所述目标文本输入到错字纠错模型中,得到纠错文本,所述纠错文本为所述目标文本中的错别词被纠正之后的正确文本,所述错字纠错模型根据错误句对训练得到,所述错误句对包括错误句和正确句,所述错误句为包括错别词的句子,所述正确句为不包括错别词的句子;
[0019]第一比对模块,用于比对所述目标文本和所述纠错文本,得到第一错别词对列表,所述第一错别词对列表包括所述目标文本中的第一错别词以及所述纠错文本中与所述第一错别词对应的第一正确词,所述第一错别词为非实体词;
[0020]第二比对模块,用于从所述目标文本中识别多个实体词,根据所述多个实体词中任意两个实体词的相似度确定第二错别词对列表,所述第二错别词列表包括第二错别词和第二正确词,所述第二错别词和所述第二正确词均为实体词;
[0021]确定模块,用于根据所述第一错别词对列表和所述第二错别词对列表得到所述目标文本的错别词对列表。
[0022]第五方面,本申请实施例提供了一种电子设备,所述电子设备包括:
[0023]一个或多个处理器;存储器,用于存储一个或多个程序;
[0024]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本申请实施例任一所述的错别字识别方法。
[0025]第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例任一所述的错别字识别方法。
附图说明
[0026]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0027]图1为本申请实施例提供的一种错别字识别方法的流程示意图;
[0028]图2为本申请实施例提供的客户端的显示界面的一种示意图;
[0029]图3

A为本申请实施例提供的客户端的显示界面的另一种示意图;
[0030]图3

B为本申请实施例提供的客户端的显示界面的再一种示意图;
[0031]图4为本申请实施例提供的客户端的显示界面的又一种示意图;
[0032]图5为本申请实施例提供的客户端的显示界面的另一种示意图
[0033]图6为本申请实施例提供的客户端的显示界面的再一种示意图
[0034]图7为本申请实施例提供的一种错别字识别方法的流程示意图
[0035]图8为本申请实施例提供的错别字识别装置的一种结构示意图;
[0036]图9为本申请实施例提供的错别字识别装置的一种结构示意图;
[0037]图10为本申请实施例提供的电子设备的一种结构示意图。
具体实施方式
[0038]下面将参照附图更详细地描述本申请的实施例。虽然附图中显示了本申请的某些实施例,然而应当理解的是,本申请可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本申请。应当理解的是,本申请的附图及实施例仅用于示例性作用,并非用于限制本申请的保护范围。
[0039]应当理解,本申请的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本申请的范围在此方面不受限制。
[0040]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0041]需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种错别词识别方法,其特征在于,所述方法包括:接收并在页面的第一显示区域中显示用户输入的目标文本;在所述页面的第二显示区域显示所述目标文本对应的错别词对列表;其中,所述错别词对列表包括一个或多个错别词对,所述错别词对包括所述目标文本中的错别词和用于对所述错别词进行纠错的正确词,所述错别词包括实体词和/或非实体词,所述实体词和所述非实体词基于不同方式从所述目标文本中识别得到。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于所述用户触发的错别词修改指令,确定所述错别词修改指令对应的目标错别词;将所述目标文本中的所述目标错别词修改为对应的目标正确词。3.根据权利要求2所述的方法,其特征在于,在将所述目标文本中的所述错别词修改为对应的所述正确词之前,所述方法还包括:响应于所述用户在所述第二显示区域触发的错别词修改指令,跳转到所述目标文本中的所述目标错别词的显示位置,并突出显示所述目标错别词;或,响应于所述用户点击所述错别词触发的跳转指令,跳转到所述目标文本中的所述目标错别词的显示位置,并突出显示所述目标错别词。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:响应于所述用户触发的错别词一键修改指令,将所述错别词对列表包括的所述一个或多个错别词修改为对应的正确词。5.根据权利要求1所述的方法,其特征在于,所述目标文本包括N个段落,对应地,所述第二显示区域包括N个显示子区域,N为大于1的整数;所述在所述页面的第二显示区域显示所述目标文本的错别词对列表,包括:在所述第二显示区域的各所述显示子区域显示该子区域对应的所述段落的错别词对列表。6.根据权利要求1所述的方法,其特征在于,所述第二显示区域包括第一子显示区域和第二子显示区域,所述第一子显示区域用于显示包括所述实体词的错别词对,所述第二子显示区域用于显示包括所述非实体词的错别词对。7.根据权利要求1所述的方法,其特征在于,所述错别词包括第一错别词,所述方法还包括:在所述第一显示区域中高亮显示所述第一错别词;响应于所述用户对所述第一错别词触发的显示指令,显示所述第一错别词对应的第一正确词;响应于所述用户触发的修改操作,将所述目标文本中的所述第一错别词替换为所述第一正确词;删除所述错别词对列表中的所述第一错别词和所述第一正确词。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述第二显示区域显示所述错别词在所述目标文本中出现的频次。9.一种错别词识别方法,其特征在于,所述方法包括:获取目标文本;
将所述目标文本输入到错字纠错模型中,得到纠错文本,所述纠错文本为所述目标文本中的错别词被纠正之后的正确文本,所述错字纠错模型根据错误句对训练得到,所述错误句对包括错误句和正确句,所述错误句为包括错别词的句子,所述正确句为不包括错别词的句子;比对所述目标文本和所述纠错文本,得到第一错别词对列表,所述第一错别词对列表包括所述目标文本中的第一错别词以及所述纠错文本中与所述第一错别词对应的第一正确词,所述第一错别词为非实体词;从所述目标文本中识别多个实体词,根据所述多个实体词中任意两个实体词的相似度确定第二错别词对列表,所述第二错别词列表包括第二错别词和第二正确词,所述第二错别词和所述第二正确词均为实体词;根据所述第一错别词对列表和所述第二错别词对列表得到所述目标文本的错别词对列表。10.根据权利要求9所述的方法,其特征在于,所述比对所述目标文本和所述纠错文本,得到第一错别词对列表包括:比对所述目标文本和所述纠错文本,得到第一错...

【专利技术属性】
技术研发人员:李萌张少华李勇乐李昊
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1