生成对于电子文档和显示的级联文本格式化制造技术

技术编号:36768902 阅读:12 留言:0更新日期:2023-03-08 21:35
在本文中描述了用于在电子发布和显示媒体中使用和实现级联文本格式化的方法的各种示例。在示例中,一种用于分析和重新格式化文本流的方法,包括:在自然语言处理(NLP)解析器中获得人类可读文本流,以识别适当语句中的词性和关键短语;根据相应的词性和关键短语标注所识别的词性;通过将预定义的规则应用于词性和关键短语,生成用于适当语句的显示的文本级联布置,其中,根据预定义的规则,适当语句的这样的显示提供打断和级联,包括缩进;以及输出包括文本级联布置的适当语句的电子显示。还公开了利用这样的文本级联布置和相关格式来转换文本、格式化文本和显示文本的方法的其他示例。例。例。

【技术实现步骤摘要】
【国外来华专利技术】生成对于电子文档和显示的级联文本格式化
[0001]优先权声明
[0002]本申请要求2020年4月7日提交的美国临时专利申请第63/006,633号的优先权的权益,该美国临时专利申请通过引用整体并入本文。

技术介绍

[0003]在文档发布和用户界面显示的
中,可以采用各种方法来尝试数字文本内容的智能输出和格式化。一种这样的文档布置方法涉及使用级联文本格式化。级联文本格式化将传统的块状文本转换为级联模式,目的是帮助读者识别语法结构并提高阅读理解能力。在一项研究中,每周阅读以级联格式格式化的文本少于一小时的学生在其整体英语语言艺术成就和其写作技能方面表现出微小但统计上显著的提高。参见Tate等人,2019年,Visual

Syntactic Text Format:Improving Adolescent Literacy,Visual

Syntactic Text Format:Improving Adolescent Literacy,Journal of Scientific Studies of Reading,第23卷,2019年第4期。
[0004]级联文本格式旨在帮助阅读中的视觉和句法处理两者。视觉上,眼睛通常在每次注视时仅捕捉有限宽度的文本字符,在大约9个到15个字符的范围内。由于这种有限的视场,当读者试图跨页移动他们的阅读视场和向下移动多行同类块文本时,注意力处理会变得紧张。级联文本显示格式通过以下方式减少了这个问题:i)将文本分成更短的行(例如大约8个到30个字符宽),这些行适合于一个或两个注视眼距;以及ii)使用引导眼睛从一行到另一行的不同的缩进模式。
[0005]级联文本格式还有助于读者识别语句的句法结构。句法比一个短语接另一个短语的简单连结序列更复杂;相反,它是分层次的。人脑通过将语言单元嵌套在其他单元中的递归过程来构建语句的能力是使人类语言能够表示无限多种含义的基本特征。因此,当解析书面形式的自然语言时,读者的大脑必须不仅仅是简单地将语句“分块”成一串更小的单元。相反,读者的大脑需要确定每个短语如何被嵌套在更大的短语和从句结构中,以及每个嵌套短语如何与包含它的更大短语相关。因此,这种级联解析模式已经被设计成使得读者在查看特定短语时能够同时感知到该短语上方和下方的短语的相对缩进。这些组合的视觉和句法效果也使得“脑海”在阅读时能够构建和检查更大且更持久的语句视觉图像。
[0006]用于生成级联文本的现有方法涉及使用人类创作的手写规则,例如使用应用于识别词性和短语边界的手动规则。虽然理论上手写规则可以被设计成适应大范围的文本和句法结构,但是设计这些规则所需的时间和精力对可扩展性提出了挑战。需要高水平可扩展性的应用包括,例如,来自各种各样的源或涉及各种各样的句法形式的文本的按需或实时处理。特别是,挑战包括给定语言中的以前没有遇到的句法,或甚至是具有不同句法的不同语言。因此,在数字发布、图形用户界面和动态电子显示的
中,需要消除对手写或手动规则或者重新格式化和显示文本的人工监督的依赖的新的方法。
附图说明
[0007]为了容易识别任何特定元素或动作的讨论,附图标记中的一个或多个最高有效数字是指该元素首先被引入的图号。
[0008]图1示出了根据一个实施方式的用于准备以级联格式显示的人类可读文本的语句的环境和系统。
[0009]图2示出了根据一个实施方式的用于以级联格式显示人类可读文本的基于插件的混合应用和离线终端用户应用的示例。
[0010]图3示出了根据一个实施方式的用于以级联格式显示人类可读文本的语句的文本转换的示例。
[0011]图4示出了根据一个实施方式的以级联格式渲染文本的过程。
[0012]图5示出了根据一个实施方式的用于训练和使用机器学习模型来生成人类可读文本的级联格式的过程。
[0013]图6示出了根据一个实施方式的使用自然语言处理生成级联人类可读文本的示例。
[0014]图7示出了根据一个实施方式的使用自然语言处理生成级联人类可读文本的方法。
[0015]图8示出了根据一个实施方式的使用自然语言处理基于反馈输入调整级联人类可读文本的示例。
[0016]图9示出了根据一个实施方式的使用自然语言处理基于反馈输入调整级联人类可读文本的方法。
[0017]图10示出了根据一个实施方式的使用自然语言处理从捕捉到的图像生成级联人类可读文本的示例。
[0018]图11示出了根据一个实施方式的使用自然语言处理从捕捉到的图像生成级联人类可读文本的方法。
[0019]图12示出了根据一个实施方式的使用自然语言处理在护目镜设备中将人类可读文本从第一显示格式转换为第二显示格式的示例。
[0020]图13示出了根据一个实施方式的使用自然语言处理在护目镜设备中将人类可读文本从第一显示格式转换为第二显示格式的方法。
[0021]图14示出了根据一个实施方式的在创作文本时使用自然语言处理生成级联人类可读文本的示例。
[0022]图15示出了根据一个实施方式的在创作文本时使用自然语言处理生成级联人类可读文本的方法。
[0023]图16示出了根据一个实施方式的接收对级联格式的修改的示例。
[0024]图17示出了根据一个实施方式的用于诊断影响阅读能力的医学状况的方法。
[0025]图18示出了根据一个实施方式的基于反馈输入使用自然语言处理对级联人类可读文本进行个性化的示例。
[0026]图19示出了根据一个实施方式的基于反馈输入使用自然语言处理对级联人类可读文本进行个性化的方法。
[0027]图20示出了根据一个实施方式的基于反馈输入使用自然语言处理来双显示级联
人类可读文本的示例。
[0028]图21示出了根据一个实施方式的基于反馈输入使用自然语言处理来双显示级联人类可读文本的方法。
[0029]图22示出了根据一个实施方式的用于文本的自然语言处理的依存关系树的示例。
[0030]图23示出了根据一个实施方式的使用自然语言处理为级联人类可读文本标注的超文本标记语言(HTML)代码的示例。
[0031]图24是示出了在其上可以实现一个或更多个实施方式的机器示例的框图。
具体实施方式
[0032]如本文中所述,提供了用于生成级联文本显示——包括在图形用户界面、数字出版物和文件以及电子显示输出内——的计算机实现系统和方法的各种实施方式。根据一个实施方式,采用机器学习(ML)来自动学习句法规则,以通过分析典型现实世界示例的大型语料库来生成句法信息。从该学习阶段生成的一个或多个ML模型又被用于自动生成文本分段的句法和其他信息,这些信息又可以全部或部分地与显式规则(例如,手写或手动规则)结合使用,以生成块文本的级联文本格式。
[0033]根据一个实施方式,许多不同分类的机器学习算法可以被应用于自然语言处理任务,以支持级联文本显示的生成。这些算法将从输入数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种包括指令的计算机可读存储介质,所述指令在执行时将计算系统的硬件处理电路系统配置成执行用于实现对于电子显示的级联文本格式化的操作,所述操作包括:在自然语言处理(NLP)解析器中处理人类可读文本流,以识别语句中的词性和关键短语;根据相应的词性和所述关键短语来标注所识别的词性;通过将预定义的规则应用于所述词性和所述关键短语来生成用于所述语句的显示的文本级联布置,其中,通过使用所述预定义的规则,所述语句的显示提供打断和级联,包括缩进;以及输出包括所述文本级联布置的所述语句的电子显示。2.根据权利要求1所述的计算机可读存储介质,其中,输出所述电子显示包括以限定所述文本级联布置的格式创建电子文档。3.根据权利要求1所述的计算机可读存储介质,其中,输出所述电子显示包括建立限定所述文本级联布置的图形显示。4.根据权利要求1所述的计算机可读存储介质,所述操作还包括建立所述语句的一个或更多个编码分段,所述一个或更多个编码分段中的每一个包括所述文本级联布置内的某个位置的文本和元数据。5.根据权利要求1所述的计算机可读存储介质,其中,所述NLP解析器包括神经网络。6.根据权利要求1所述的计算机可读存储介质,其中,所述NLP解析器使用概率方法来解析所述语句。7.根据权利要求1所述的计算机可读存储介质,所述操作还包括在显示设备的显示器上显示所述文本级联布置。8.根据权利要求7所述的计算机可读存储介质,其中,所述显示设备提供图形显示器或用户佩戴的视觉显示器。9.根据权利要求8所述的计算机可读存储介质,其中,所述用户佩戴的视觉显示器由以下之一提供:AV头戴式耳机、VR头戴式耳机、智能眼镜或智能隐形眼镜。10.根据权利要求1所述的计算机可读存储介质,所述操作还包括:在所述自然语言处理(NLP)解析器中处理所述文本以识别语句中的实体;标注所识别的实体;以及通过将规则应用于所述实体来进一步开发所述文本级联布置。11.一种用于在电子发布和显示媒体内实现级联文本格式化的方法,包括:在自然语言处理(NLP)解析器中处理人类可读文本流,以识别语句中的词性和关键短语;根据相应的词性和所述关键短语标注所识别的词性;通过将预定义的规则应用于所述词性和所述关键短语来生成用于所述语句的显示的文本级联布置,其中,通过使用所述预定义的规则,所述语句的显示提供打断和级联,包括缩进;以及输出包括所述文本级联布置的所述语句的电子显示。12.根据权利要求11所述的方法,其中,输出所述电子显示包括以限定所述文本级联布置的格式创建电子文档。
13.根据权利要求11所述的方法,其中,输出所述电子显示包括建立限定所述文本级联布置的图形显示。14.根据权利要求11所述的方法,还包括建立所述语句的一个或更多个编码分段,所述一个或更多个编码分段中的每一个包括所述文本级联布置内的某个位置的文本和元数据。15.根据权利要求11所述的方法,其中,所述NLP解析器包括神经网络。16.根据权利要求11所述的方法,其中,所述NLP解析器使用概率方法来解析所述语句。17.根据权利要求11所述的方法,还包括在显示设备的显示器上显示所述文本级联布置。18.根据权利要求17所述的方法,其中,所述显示设备提供图形显示器或用户佩戴的视觉显示器。19.根据权利要求18所述的方法,其中,所述用户佩戴的视觉显示器由以下之一提供:AV头戴式耳机、VR头戴式耳机、智能眼镜或智能隐形眼镜。20.根据权利要求11所述的方法,还包括:在所述自然语言处理(NLP)解析器中处理所述文本以识别语句中的实体;标注所识别的实体;以及通过将规则应用于所述实体来进一步开发所述文本级联布置。21.一种计算系统,包括:存储包括文本的图像的存储器;以及执行指令的处理电路系统,所述指令使所述处理电路系统利用如下操作将成像文本字符串从第一显示格式转换成第二显示格式:识别所述图像中的所述文本并生成机器可读文本字符串;在自然语言处理(NLP)解析器中处理所述文本字符串,以识别所述文本字符串中的词性;根据词性标注所识别的词性;通过将预定义的规则应用于所述词性来生成用于所述文本字符串的显示的文本级联布置,其中,通过使用所述预定义的规则,所述文本字符串的显示提供打断和级联,包括缩进;以及输出包括所述文本级联布置的所述文本字符串的电子显示。22.根据权利要求21所述的计算系统,其中,输出所述电子显示包括以限定所述文本级联布置的格式创建电子文档。23.根据权利要求21所述的计算系统,其中,输出所述电子显示包括建立限定所述文本级联布置的图形显示。24.根据权利要求21所述的计算系统,所述操作还包括建立所述文本字符串的一个或更多个编码分段,所述一个或更多个编码分段中的每一个包括所述文本级联布置内的某个位置的文本和元数据。25.根据权利要求21所述的计算系统,其中,所述NLP解析器包括神经网络。26.根据权利要求21所述的计算系统,其中,所述NLP解析器使用概率方法来解析语句。27.根据权利要求21所述的计算系统,其中,所述文本字符串包含文本的语句,并且其中,所述打断和所述缩进被应用于所述语句。
28.根据权利要求21所述的计算系统,所述操作还包括:在自然语言处理(NLP)解析器中处理所述文本字符串,以识别所述文本字符串中的关键短语和实体;标注所识别的关键短语和实体;以及通过将规则应用于所述关键短语和所述实体来进一步开发所述文本级联。29.根据权利要求21所述的计算系统,其中,所述电子显示由显示设备提供,所述显示设备提供图形显示器或用户佩戴的视觉显示器。30.根据权利要求29所述的计算系统,其中,所述用户佩戴的视觉显示器由以下之一提供:AV头戴式耳机、VR头戴式耳机、智能眼镜或智能隐形眼镜。31.一种用于将成像文本字符串从第一显示格式转换成第二显示格式的方法,包括:从成像设备获得图像,所述图像捕捉所述成像设备的视场内的文本;识别所述图像中的所述文本并生成机器可读文本字符串;在自然语言处理(NLP)解析器中处理所述文本字符串,以识别所述文本字符串中的词性;根据词性标注所识别的词性;通过将预定义的规则应用于所述词性来生成用于所述文本字符串的显示的文本级联布置,其中,通过使用所述预定义的规则,所述文本字符串的显示提供打断和级联,包括缩进;以及输出包括所述文本级联布置的所述文本字符串的电子显示。32.根据权利要求31所述的方法,其中,输出所述电子显示包括以限定所述文本级联布置的格式创建电子文档。33.根据权利要求31所述的方法,其中,输出所述电子显示包括建立限定所述文本级联布置的图形显示。34.根据权利要求31所述的方法,还包括建立所述文本字符串的一个或更多个编码分段,所述一个或更多个编码分段中的每一个包括所述文本级联布置内的某个位置的文本和元数据。35.根据权利要求31所述的方法,其中,所述NLP解析器包括神经网络。36.根据权利要求31所述的方法,其中,所述NLP解析器使用概率方法来解析语句。37.根据权利要求31所述的方法,其中,所述文本字符串包含文本的语句,并且其中,所述打断和所述缩进被应用于所述文本字符串。38.根据权利要求31所述的方法,还包括:在自然语言处理(NLP)解析器中处理所述文本字符串,以识别所述文本字符串中的关键短语和实体;标注所识别的关键短语和实体;以及通过将规则应用于所述关键短语和所述实体来进一步开发所述文本级联。39.根据权利要求31所述的方法,其中,所述电子显示由显示设备提供,所述显示设备提供图形显示器或用户佩戴的视觉显示器。40.根据权利要求39所述的方法,其中,所述用户佩戴的视觉显示器由以下之一提供:AV头戴式耳机、VR头戴式耳机、智能眼镜或智能隐形眼镜。
41.一种用于在能够由用户操作的护目镜设备中将文本从第一显示格式转换成第二显示...

【专利技术属性】
技术研发人员:迈克尔
申请(专利权)人:凯斯凯德阅读有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1