【技术实现步骤摘要】
一种错别词识别方法及装置
[0001]本申请涉及计算机领域,尤其涉及一种错别词识别方法及装置。
技术介绍
[0002]随着计算机技术的发展,越来越多的人选择利用计算机代替手写对文本进行处理。这样,由于计算机具有便于修改等特点,利用计算机可以高效地对文本进行撰写、编辑和修改等操作,大大提高了办公效率。但是,计算机中的文本由用户手动输入,用户在输入或编辑文本时难免会存在疏漏,导致文本存在错别词。因此,亟需一种能够识别文本中错别词的方法。
技术实现思路
[0003]为了解决现有技术,本申请实施例提供了一种错别词识别方法及装置。
[0004]第一方面,本申请实施例提供了一种错别词识别方法,所述方法包括:
[0005]接收并在页面的第一显示区域中显示用户输入的目标文本;
[0006]在所述页面的第二显示区域显示所述目标文本对应的错别词对列表;其中,所述错别词对列表包括一个或多个错别词对,所述错别词对包括所述目标文本中的错别词和用于对所述错别词进行纠错的正确词,所述错别词包括实体词和/或非实体词,所述实体词和所述非实体词基于不同方式从所述目标文本中识别得到。
[0007]第二方面,本申请实施例提供了一种错别词识别方法,所述方法包括:
[0008]获取目标文本;
[0009]将所述目标文本输入到错字纠错模型中,得到纠错文本,所述纠错文本为所述目标文本中的错别词被纠正之后的正确文本,所述错字纠错模型根据错误句对训练得到,所述错误句对包括错误句和正确句,所述错误句为包括错 ...
【技术保护点】
【技术特征摘要】
1.一种错别词识别方法,其特征在于,所述方法包括:接收并在页面的第一显示区域中显示用户输入的目标文本;在所述页面的第二显示区域显示所述目标文本对应的错别词对列表;其中,所述错别词对列表包括一个或多个错别词对,所述错别词对包括所述目标文本中的错别词和用于对所述错别词进行纠错的正确词,所述错别词包括实体词和/或非实体词,所述实体词和所述非实体词基于不同方式从所述目标文本中识别得到。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:响应于所述用户触发的错别词修改指令,确定所述错别词修改指令对应的目标错别词;将所述目标文本中的所述目标错别词修改为对应的目标正确词。3.根据权利要求2所述的方法,其特征在于,在将所述目标文本中的所述错别词修改为对应的所述正确词之前,所述方法还包括:响应于所述用户在所述第二显示区域触发的错别词修改指令,跳转到所述目标文本中的所述目标错别词的显示位置,并突出显示所述目标错别词;或,响应于所述用户点击所述错别词触发的跳转指令,跳转到所述目标文本中的所述目标错别词的显示位置,并突出显示所述目标错别词。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:响应于所述用户触发的错别词一键修改指令,将所述错别词对列表包括的所述一个或多个错别词修改为对应的正确词。5.根据权利要求1所述的方法,其特征在于,所述目标文本包括N个段落,对应地,所述第二显示区域包括N个显示子区域,N为大于1的整数;所述在所述页面的第二显示区域显示所述目标文本的错别词对列表,包括:在所述第二显示区域的各所述显示子区域显示该子区域对应的所述段落的错别词对列表。6.根据权利要求1所述的方法,其特征在于,所述第二显示区域包括第一子显示区域和第二子显示区域,所述第一子显示区域用于显示包括所述实体词的错别词对,所述第二子显示区域用于显示包括所述非实体词的错别词对。7.根据权利要求1所述的方法,其特征在于,所述错别词包括第一错别词,所述方法还包括:在所述第一显示区域中高亮显示所述第一错别词;响应于所述用户对所述第一错别词触发的显示指令,显示所述第一错别词对应的第一正确词;响应于所述用户触发的修改操作,将所述目标文本中的所述第一错别词替换为所述第一正确词;删除所述错别词对列表中的所述第一错别词和所述第一正确词。8.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述第二显示区域显示所述错别词在所述目标文本中出现的频次。9.一种错别词识别方法,其特征在于,所述方法包括:获取目标文本;
将所述目标文本输入到错字纠错模型中,得到纠错文本,所述纠错文本为所述目标文本中的错别词被纠正之后的正确文本,所述错字纠错模型根据错误句对训练得到,所述错误句对包括错误句和正确句,所述错误句为包括错别词的句子,所述正确句为不包括错别词的句子;比对所述目标文本和所述纠错文本,得到第一错别词对列表,所述第一错别词对列表包括所述目标文本中的第一错别词以及所述纠错文本中与所述第一错别词对应的第一正确词,所述第一错别词为非实体词;从所述目标文本中识别多个实体词,根据所述多个实体词中任意两个实体词的相似度确定第二错别词对列表,所述第二错别词列表包括第二错别词和第二正确词,所述第二错别词和所述第二正确词均为实体词;根据所述第一错别词对列表和所述第二错别词对列表得到所述目标文本的错别词对列表。10.根据权利要求9所述的方法,其特征在于,所述比对所述目标文本和所述纠错文本,得到第一错别词对列表包括:比对所述目标文本和所述纠错文本,得到第一错...
【专利技术属性】
技术研发人员:李萌,张少华,李勇乐,李昊,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。