使用互联网语料库的自动的上下文相关的语言校正和增强制造技术

技术编号:12298732 阅读:90 留言:0更新日期:2015-11-11 09:40
一种计算机辅助语言校正系统,其包括使用互联网语料库的利用上下文特征序列功能的拼写校正功能、误用词校正功能、语法校正功能和词汇增强功能。

【技术实现步骤摘要】
【专利说明】使用互联网语料库的自动的上下文相关的语言校正和増强 本申请是申请日为2008年7月31日并且申请号为200880101405. 7的中国专利 申请的分案申请。 相关申请的参考 参考 2007 年 8 月 1 日提交的、题目为"METHODS FOR CONTEXT SENSITIVE ERROR DETECTION AND CORRECTION"、申请号为60/953, 209的美国临时专利申请,以引用方式将其 公开并入本文,并且依照37CFR I. 78(a) (4)和(5) (i)要求其优先权。
本专利技术总体上涉及计算机辅助语言校正。
技术介绍
认为以下公开代表技术的当前状态: 美国专利号为 5, 659, 77I ;5, 9〇7, 839 ;6, 4M, 983 ;7, 2%,Ol9 ;5, %6, 73925 和 4, 674, 065的专利 美国公开专利申请号为2006/0247914和2007/0106937的申请。
技术实现思路
本专利技术尝试提供用于计算机辅助语言校正的改进的系统和功能。 因此,根据本专利技术的优选实施例提供了一种计算机辅助语言校正系统,其包括备 选词生成器,基于输入句子,生成为所述句子中的多个词的中每一个提供多个备选词的基 于文本的表示,选择器,用于至少部分地基于互联网语料库,针对所述句子中的所述多个词 的每一个,在至少所述多个备选词中进行选择,以及校正生成器,用于基于所述选择器做出 的选择来提供校正输出。 优选地,所述选择器用于,基于以下校正功能中的至少一个来做出所述选择:拼写 校正、误用词校正、语法校正和词汇增强。 根据本专利技术的优选实施例,所述选择器用于,基于以下校正功能中的至少两个来 做出所述选择:拼写校正、误用词校正、语法校正和词汇增强。此外,所述选择器用于,基于 校正的以下时间顺序中的至少一项来做出所述选择:先于误用词校正、语法校正和词汇增 强的至少一个的拼写校正,以及先于词汇增强的误用词校正和语法校正。 此外或可选地,由以下功能中的一个来提供所述输入句子:词处理器功能、机器翻 译功能、语音到文本转换功能、光学字符识别功能,以及即时通信功能,并且所述选择器用 于,基于以下校正功能中的至少一个来做出所述选择:误用词校正、语法校正以及词汇增 强。 优选地,所述校正生成器包括校正语言输入生成器,用于在不需要用户干预的情 况下,基于所述选择器做出的选择,提供校正语言输出。此外或可选地,所述语法校正功能 包括标点、动词变形、单数/复数、冠词和介词校正功能中的至少一个。 根据本专利技术的优选实施例,所述语法校正功能包括替换、插入和省略校正功能中 的至少一个。 优选地,所述选择器包括基于上下文计分功能,用于至少部分地基于在互联网语 料库中上下文特征序列(CFS)出现的频率,排序所述多个备选词。此外,所述基于上下文计 分功能,还用于至少部分地基于在所述互联网语料库中标准化CFS出现的频率,排序所述 多个备选词。 根据本专利技术的另一个优选实施例还提供了一种计算机辅助语言校正系统,其包括 以下中的至少一个:拼写校正功能、误用词校正功能、语法校正功能、词汇增强功能,以及与 以下各项中的至少一个协作并且使用互联网语料库的上下文特征序列功能:所述拼写校正 功能;所述误用词校正功能、语法校正功能和所述词汇增强功能。 优选地,所述语法校正功能包括标点、动词变形、单数/复数、冠词和介词校正功 能中的至少一个。此外或可选地,所述语法校正功能包括替换、插入和省略校正功能中的至 少一个。 根据本专利技术的优选实施例,所述计算机辅助语言校正系统包括以下各项中的至少 两个:所述拼写校正功能、所述误用词校正功能、所述语法校正功能、所述词汇增强功能,并 且所述上下文特征序列功能与以下各项中的至少两个进行协作并且使用互联网语料库:所 述拼写校正功能、所述误用词校正功能、所述语法校正功能和所述词汇增强功能。 优选地,所述计算机辅助语言校正系统还包括以下各项中的至少三个:所述拼写 校正功能、所述误用词校正功能、所述语法校正功能、所述词汇增强功能,并且所述上下文 特征序列功能与以下各项中的至少三个进行协作并且使用互联网语料库:所述拼写校正功 能;所述误用词校正功能,所述语法校正功能和所述词汇增强功能。 根据本专利技术的优选实施例,所述的计算机辅助语言校正系统还包括:所述拼写校 正功能、所述误用词校正功能、所述语法校正功能,和所述词汇增强功能,并且所述上下文 特征序列功能与以下各项功能进行协作并且使用互联网语料库:所述拼写校正功能;所述 误用词校正功能,所述语法校正功能和所述词汇增强功能。 优选地,所述校正生成器包括校正语言生成器,用于在不需要用户干预的情况下, 基于所述选择器做出的选择,用于提供校正语言输出。 根据本专利技术的另一个优选实施例,还提供了一种计算机辅助语言校正系统,其包 括:备选词生成器,基于语言输入,生成为所述句子中的多个词中的每一个提供多个备选词 的基于文本的表示;选择器,用于至少部分地基于为所述语言输入中的所述多个词中的至 少一些选择的所述多个备选词中的多个之间的关系,为所述语言输入中的所述多个词中的 每一个,在至少所述多个备选词之间进行选择;校正生成器,用于基于由所述选择器做出的 选择,来提供校正输出。 优选地,所述语言输入包括输入句子和输入文本中的至少一个。此外或可选地,所 述语言输入是语音并且所述生成器将语音中的所述语言输入转换为为所述语言输入中的 多个词提供多个备选词的基于文本的表示。 根据本专利技术的优选实施例,所述语言输入是以下各项中的至少一个:文本输入、光 学字符识别功能的输出、机器翻译功能的输出,以及词处理功能的输出,并且所述生成器将 文本中的所述语言输入转换为为语言输入中的多个词提供多个备选词的基于文本的表示。 优选地,所述选择器,用于至少基于以下校正功能中的两个,做出所述选择:拼写 错误、误用词校正、语法校正,以及词汇增强。此外,所述选择器用于,基于校正的以下时间 顺序中的至少一个来做出所述选择:先于误用词校正、语法校正和词汇增强中的至少一个 的拼写校正,以及先于词汇增强的误用词校正和语法校正。 根据本专利技术的优选实施例,所述语言输入是语音并且所述选择器用于基于以下校 正功能中的至少一个来做出所述选择:误用词校正、语法校正,以及词汇增强。 优选地,所述选择器用于通过执行以下功能中的至少两个来做所述选择:选择包 括比初始选择的所述语言输入中的所有所述多个词少的第一组词或词的组合;之后对所述 第一组词或词的组合的元素进行排序以建立选择的优先级;之后为了所述第一组词的元 素,当在所述多个备选词之间选择时,选择其它词而不是所有所述多个词作为上下文来影 响所述选择。此外或可选地,所述选择器用于通过执行以下功能来做所述选择:当选择具有 至少两个词的元素时,结合用于所述至少两个词彼此的所述多个备选词的每一个来评估用 于所述至少两个词的每一个的所述多个备选词的每一个。 根据本专利技术的优选实施例,所述校正生成器包括校正语言输入生成器,用于在不 需要用户干预的情况下,基于所述选择器做出的选择,提供校正语言输出。 根据本专利技术的另一个优选实施例,还提供了一种计算机辅助语言校正系统,其包 括:误用本文档来自技高网...

【技术保护点】
一种计算机辅助语言校正系统,包括:以下各项中的至少一个:拼写校正功能;误用词校正功能;语法校正功能;以及词汇增强功能;以及与以下各项中的至少一个协作并且使用互联网语料库的上下文特征序列功能:所述拼写校正功能、所述误用词校正功能、语法校正功能和所述词汇增强功能。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:Y·卡罗夫赞格威尔A·赞格威尔
申请(专利权)人:金格软件有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1