本申请公开了一种中文阅读辅助方法、装置及存储介质,所述方法包括:响应于辅助阅读指令,获取待辅助阅读的中文文本信息;对所述中文文本信息进行词语切分,得到词语表单;基于所述词语表单进行语义连接度分析,得到关键度评分;响应于所述辅助阅读指令中指示的辅助类型,在所述词语表单和/或关键度评分中确定目标辅助信息,并按照预设规则对所述目标辅助信息进行辅助提示,能够基于待辅助阅读的中文文本信息,按照辅助阅读指令自动进行辅助提示,降低人工参与度,提高辅助阅读的普适性。提高辅助阅读的普适性。提高辅助阅读的普适性。
【技术实现步骤摘要】
中文阅读辅助方法、装置及存储介质
[0001]本公开一般涉及语义分析
,具体涉及一种中文阅读辅助方法、装置及存储介质。
技术介绍
[0002]随着电子文本(电子书文本、网页文本、社交软件文本等)的普及,电子文本的视觉辅助功能逐渐增多,如调节字体大小、行间距和背景色等。这些设置的目的是为了让读者的阅读更舒适,从而提高阅读体验和效率。
[0003]这些设置只是试图在初级视觉输入层面满足读者需求。然而,读者阅读时有更高的认知需求和特点,例如,在阅读电子文档是,为了高效获取有用信息,读者常常会快速搜索文本中的信息,例如关键句,相关技术中关键句通常是由后台人工标注的,大大增加了文本处理的人工成本,不具有普适性。
技术实现思路
[0004]鉴于现有技术中的上述缺陷或不足,期望提供一种中文阅读辅助方法、装置及存储介质,能够基于待辅助阅读的中文文本信息,按照辅助阅读指令自动进行辅助提示,降低人工参与度,提高辅助阅读的普适性。
[0005]第一方面,本申请实施例提供了一种中文阅读辅助方法,包括:
[0006]响应于辅助阅读指令,获取待辅助阅读的中文文本信息;
[0007]对所述中文文本信息进行词语切分,得到词语表单;
[0008]基于所述词语表单进行语义连接度分析,得到关键度评分;
[0009]响应于所述辅助阅读指令中指示的辅助类型,在所述词语表单和/或关键度评分中确定目标辅助信息,并按照预设规则对所述目标辅助信息进行辅助提示。
[0010]在一些实施例中,所述对所述中文文本信息进行词语切分,得到词语表单,包括:
[0011]将所述中文文本信息转换为字符串变量;
[0012]针对所述字符串变量中的每个字,从所述字符串变量中提取当前字对应的组块;
[0013]将所述组块与预设语料库进行匹配,确定所述当前字对应的当前词语,并从所述语料库中提取所述当前词语对应的属性信息生成所述当前词语对应的词语表单。
[0014]在一些实施例中,所述组块包括预设长度范围,所述方法包括:
[0015]按照所述预设长度范围从大到小依次获取多个所述当前字对应的组块;
[0016]按照所述组块长度从大到小依次与所述预设语料库进行匹配;
[0017]在识别到所述组块与所述预设语料库中任一候选词语匹配时,确定所述候选词语为所述组块对应的所述当前词语,并停止对所述当前字的匹配操作。
[0018]在一些实施例中,所述关键度评分包括当前词语对应的关键度评分,所述基于所述词语表单进行语义连接度分析,得到关键度评分,包括:
[0019]基于所述词语表单,构建语义连接矩阵,其中,所述语义连接矩阵根据是否具有相
邻关系确定元素值;
[0020]针对所述词语表单中任一当前词语,根据所述语义连接矩阵确定所述当前词语对应的关键度评分。
[0021]在一些实施例中,所述基于所述词语表单,构建语义连接矩阵,包括:
[0022]基于所述词语表单构建N阶初始矩阵;
[0023]针对任一所述当前词语,将在所述字符串变量中位于所述当前词语前一位置的词语按照第一规则进行赋值,其他词语则按照第二规则进行赋值,得到所述语义连接矩阵。
[0024]在一些实施例中,所述根据所述语义连接矩阵确定所述词语对应的关键度评分,包括:
[0025]针对任一所述当前词语,将其在所述语义连接矩阵中对应的值进行求和,得到所述当前词语对应的所述关键度评分。
[0026]在一些实施例中,所述关键度评分包括当前句对应的关键度评分,所述方法还包括:
[0027]针对每个当前句子,基于所述当前词语对应的关键度评分确定每个句子中包含的关键词语;
[0028]获取所述当前句子中包含的所述关键词语的数量,将所述关键词语的数量作为所述当前句子对应的关键度评分。
[0029]在一些实施例中,所述辅助阅读指令中指示的辅助类型包括词性、关键词和关键句中的至少一种。
[0030]第二方面,本申请实施例提供了一种中文阅读辅助装置,包括:
[0031]获取模块,用于基于辅助阅读指令,获取待辅助阅读的中文文本信息;
[0032]第一分析模块,用于对所述中文文本信息进行词语切分,得到词语表单;
[0033]第二分析模块,用于基于所述词语表单进行语义连接度分析,得到关键度评分;
[0034]辅助模块,用于基于所述辅助阅读指令中指示的辅助类型,在所述词语表单和/或关键度评分中确定目标辅助信息,并按照预设规则对所述目标辅助信息进行辅助提示。
[0035]第三方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例描述的方法。
[0036]本申请提出的中文阅读辅助方法、装置和存储介质,响应于辅助阅读指令,获取待辅助阅读的中文文本信息,对中文文本信息进行词语切分得到词语表单,以确定中文文本信息中各词语的词性,然后基于词语表单进行语义连接度分析,得到关键度评分,以确定中文文本信息中的关键词和关键句,响应于辅助阅读指令中指示的辅助类型,在词语表单和/或关键度评分中确定目标辅助信息,并按照预设规则对目标辅助信息进行辅助提示。由此,本申请能够自动化的是被中文文本信息中的关键词和关键句,通过辅助提示的方式有效进行阅读辅助,能够帮助用户快速进行中文文本阅读和定位,提高阅读速度和质量。
[0037]本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0038]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它
特征、目的和优点将会变得更明显:
[0039]图1为本申请实施例提出的一种中文阅读辅助方法的流程图;
[0040]图2为本申请实施例提出的另一种中文阅读辅助方法的流程图
[0041]图3为本申请实施例提出的一种中文阅读辅助装置的方框示意图;
[0042]图4为用来实现本申请实施例的电子设备或服务器的计算机系统的结构示意图。
具体实施方式
[0043]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与专利技术相关的部分。
[0044]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0045]图1为本申请实施例提出的一种中文阅读辅助方法的流程图。
[0046]其中,需要说明的是,本实施例的中文阅读辅助方法的执行主体为中文阅读辅助装置,中文阅读辅助装置可以由软件和/或硬件的方式实现,该实施例中的中文阅读辅助装置可以配置在电子设备中,也可以配置在用于对电子设备进行控制的服务器中,该服务器与电子本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种中文阅读辅助方法,其特征在于,包括:响应于辅助阅读指令,获取待辅助阅读的中文文本信息;对所述中文文本信息进行词语切分,得到词语表单;基于所述词语表单进行语义连接度分析,得到关键度评分;响应于所述辅助阅读指令中指示的辅助类型,在所述词语表单和/或关键度评分中确定目标辅助信息,并按照预设规则对所述目标辅助信息进行辅助提示。2.根据权利要求1所述的方法,其特征在于,所述对所述中文文本信息进行词语切分,得到词语表单,包括:将所述中文文本信息转换为字符串变量;针对所述字符串变量中的每个字,从所述字符串变量中提取当前字对应的组块;将所述组块与预设语料库进行匹配,确定所述当前字对应的当前词语,并从所述语料库中提取所述当前词语对应的属性信息生成所述当前词语对应的词语表单。3.根据权利要求2所述的方法,其特征在于,所述组块包括预设长度范围,所述方法包括:按照所述预设长度范围从大到小依次获取多个所述当前字对应的组块;按照所述组块长度从大到小依次与所述预设语料库进行匹配;在识别到所述组块与所述预设语料库中任一候选词语匹配时,确定所述候选词语为所述组块对应的所述当前词语,并停止对所述当前字的匹配操作。4.根据权利要求1所述的方法,其特征在于,所述关键度评分包括当前词语对应的关键度评分,所述基于所述词语表单进行语义连接度分析,得到关键度评分,包括:基于所述词语表单,构建语义连接矩阵,其中,所述语义连接矩阵根据是否具有相邻关系确定元素值;针对所述词语表单中任一当前词语,根据所述语义连接矩阵确定所述当前词语对应的关键度评分。5.根据权利要求4所述的方法,其特征在于,所述基于所述词语...
【专利技术属性】
技术研发人员:周蔚,
申请(专利权)人:周蔚,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。