System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于AI和个性化知识库的文档辅助阅读系统技术方案_技高网

一种基于AI和个性化知识库的文档辅助阅读系统技术方案

技术编号:44020889 阅读:13 留言:0更新日期:2025-01-15 01:04
本发明专利技术公开了一种基于AI和个性化知识库的文档辅助阅读系统,涉及文档辅助阅读技术领域,解决了解决现有技术中没有对用户进行个性化分析导致系统提供不必要的辅助信息,影响用户阅读体验的技术问题;本发明专利技术通过将阅读文档转换为阅读文本,并将用户的历史记录转换为历史文本,提炼历史文本中历史搜索文本中的搜索词汇,并结合历史浏览文本,得到历史搜索词汇,并统计历史搜索词汇的出现次数与搜索次数,得到历史搜索记录;提炼阅读文本中的解读词汇,并与历史搜索记录进行匹配,根据解读词汇在历史搜索记录中的出现次数和搜索次数得到解读词汇的掌握状态,基于解读词汇的掌握状态生成辅助标签添加到重点词汇处完成辅助阅读。

【技术实现步骤摘要】

本专利技术属于文档辅助阅读领域,具体是一种基于ai和个性化知识库的文档辅助阅读系统。


技术介绍

1、阅读较为专业或不熟悉领域的文字内容,往往需要了解相关背景知识,特别是专业术语的含义,才能够较为顺利地开展阅读,并且理解所阅读的内容;阅读传统纸质文字内容和书籍时,当遇到不了解的专业术语,人们往往需要通过各种方法查询相关的知识;在线阅读电子内容时,则可以利用计算机帮助实时获得辅助阅读的相关知识。

2、申请号为cn2023102436014的专利技术专利公开了基于领域知识库的专业文档智能辅助阅读方法,该专利技术通过构建领域本体知识库,根据领域本体知识库搭建阅读智能辅助平台,通过自然语言处理技术识别领域概念,并获取数据源的关系数据库,抽取关系数据库中的关联知识与阅读智能辅助平台进行结合,生成语义关联知识,根据语义关联知识为文档进行实时注解与相关背景知识的填充;该方法在进行辅助阅读时,由于只对当前文档的关系数据进行分析,用户在阅读时遇到的一些难以理解的词汇或者知识时,在过去的阅读中,通过自行搜索相关知识,可能已经掌握了对应的资料,在后续进行阅读时,并不需要重新系统对其进行辅助阅读,导致系统频繁提供不必要的辅助信息,减少用户的阅读干扰,影响用户的阅读体验。

3、本专利技术提供了一种基于ai和个性化知识库的文档辅助阅读系统,以解决以上技术问题。


技术实现思路

1、本专利技术旨在至少解决现有技术中存在的技术问题之一;为此,本专利技术提出了一种基于ai和个性化知识库的文档辅助阅读系统,用于解决现有技术中没有对用户进行个性化分析导致系统提供不必要的辅助信息,影响用户阅读体验的技术问题。

2、为实现上述目的,本专利技术的第一方面提供了一种基于ai和个性化知识库的文档辅助阅读系统,包括:数据库、文档转换模块、文档解析模块和阅读辅助模块;

3、文档转换模块:用于将接收到的阅读文档转换为阅读文本;收集用户的历史记录并转换为历史文本;

4、文档解析模块:用于对历史文本进行解析并提炼得到历史搜索记录;提炼阅读文本中的解读词汇,基于历史搜索记录与解读词汇得到用户对解读词汇的掌握状态;

5、阅读辅助模块:用于基于掌握状态生成解读词汇对应的辅助标签添加到重点词汇处。

6、优选的,所述对历史文本进行解析并提炼得到历史搜索记录,包括:

7、提取历史文本;其中,历史文本包括历史搜索文本与历史浏览文本;

8、通过自然语言处理技术提炼历史搜索文本中的搜索词汇,并记录搜索词汇的搜索次数;将搜索词汇与历史浏览文本进行匹配得到历史搜索词汇,并统计搜索词汇在历史浏览文本中的出现次数,将历史搜索文本中历史搜索词汇的出现次数和搜索次数整合得到历史搜索记录。

9、优选的,所述将搜索词汇与历史浏览文本进行匹配得到历史搜索词汇,包括:

10、a1:提取搜索词汇与历史浏览文本;

11、a2:判断搜索词汇是否在历史浏览文本中出现;是,则将对应的搜索词汇标记为历史搜索词汇;否,则跳转至a3;

12、a3;判断搜索词汇是否与历史浏览文本中的词汇语义相同;是,则将对应搜索词汇标记为历史搜索词汇;否,则将对应搜索词汇标记为无关词汇。

13、优选的,所述基于历史搜索记录与解读词汇得到用户对解读词汇的掌握状态,包括:

14、s1:提取历史搜索记录与解读词汇;

15、s2:判断历史搜索记录中的历史搜索词汇是否包含解读词汇;是,则跳转至s3;否,则将对应的解读词汇标记为新晋词汇;

16、s3:根据与解读词汇对应历史搜索词汇的出现次数和搜索次数得到解读词汇的掌握状态。

17、优选的,所述根据与解读词汇对应历史搜索词汇的出现次数和搜索次数得到解读词汇的掌握状态,包括:

18、b1:提取历史搜索词汇的出现次数和搜索次数;

19、b2:判断搜索次数是否大于1;是,则跳转至b3;否,则跳转至b4;

20、b3:判断出现次数是否大于搜索次数;是,则将解读词汇的掌握状态标记为已掌握;否,则将对应解读词汇的掌握状态标记为难掌握;

21、b4:判断出现次数是否大于搜索次数;是,则将对应解读词汇的掌握状态标记为完全掌握;否,则将对应解读词汇的掌握状态标记为已掌握;

22、b5:对于掌握状态为已掌握的解读词汇,设置掌握系数,将出现次数与搜索次数的比值与掌握系数相乘得到解读词汇的掌握值;其中,掌握系数通过根据用户对词汇的了解能力设置;

23、b6:设置掌握阈值;判断解读词汇的掌握值是否大于等于掌握阈值;是,则将对应解读词汇的掌握状态标记为具体掌握;否,则将对应解读词汇的掌握状态标记为粗略掌握;其中,掌握阈值根据专家对于用户的平均理解经验进行设定。

24、优选的,所述掌握系数通过根据用户对词汇的了解能力设置,包括:

25、统计出现次数大于搜索次数的历史搜索词汇并标记为历史掌握词汇,并提取历史掌握词汇的出现时间和搜索时间,并将最临近当前时间的出现时间标记为末端出现时间,将最临近当前时间的搜索时间标记为末端搜索时间;

26、判断末端出现时间是否大于末端搜索时间;是,则将对应历史掌握词汇标记为已掌握词汇;否,则将对应历史掌握词汇标记为未掌握词汇;

27、将已掌握词汇占历史掌握词汇的比例标记为掌握系数。

28、优选的,所述基于掌握状态生成解读词汇对应的辅助标签添加到重点词汇处,包括:

29、提取掌握状态;

30、将掌握状态为难掌握与粗略掌握的解读词汇标记为辅助阅读词汇,通过自然语言处理技术得到阅读文本的文本类型,在数据库中匹配文本类型对应的专业资料库,将辅助阅读词汇输入专业资料库得到辅助阅读词汇对应的相关资料,将相关资料输入标签文件中得到辅助标签,将辅助标签添加到重点词汇处。

31、与现有技术相比,本专利技术的有益效果是:

32、1.本专利技术通过将阅读文档转换为阅读文本,并将用户的历史记录转换为历史文本,提炼历史文本中历史搜索文本中的搜索词汇,并结合历史浏览文本,得到历史搜索词汇,并统计历史搜索词汇的出现次数与搜索次数,得到历史搜索记录,快速回顾过去搜索过的重要词汇和内容,节省时间,提高工作效率;提炼阅读文本中的解读词汇,并与历史搜索记录进行匹配,根据解读词汇在历史搜索记录中的出现次数和搜索次数得到解读词汇的掌握状态,基于解读词汇的掌握状态生成辅助标签添加到重点词汇处完成辅助阅读,能够根据用户的掌握状态,提供个性化的辅助信息,为用户提供更符合其需求的服务和内容,提升阅读体验。

33、2.本专利技术通过将历史搜索词汇的出现次数与搜索次数进行比较,得到对应解读词汇的掌握状态,并对掌握状态为已掌握的解读词汇进行分析,比较解读词汇的末端出现时间和末端搜索时间,计算掌握系数,结合掌握系数、出现次数和搜索次数得到解读词汇的掌握值,将掌握值与预设的掌握阈值进行比较,得到解读词汇本文档来自技高网...

【技术保护点】

1.一种基于AI和个性化知识库的文档辅助阅读系统,其特征在于,包括:数据库、文档转换模块、文档解析模块和阅读辅助模块;

2.根据权利要求1所述的一种基于AI和个性化知识库的文档辅助阅读系统,其特征在于,所述对历史文本进行解析并提炼得到历史搜索记录,包括:

3.根据权利要求2所述的一种基于AI和个性化知识库的文档辅助阅读系统,其特征在于,所述将搜索词汇与历史浏览文本进行匹配得到历史搜索词汇,包括:

4.根据权利要求1所述的一种基于AI和个性化知识库的文档辅助阅读系统,其特征在于,所述基于历史搜索记录与解读词汇得到用户对解读词汇的掌握状态,包括:

5.根据权利要求4所述的一种基于AI和个性化知识库的文档辅助阅读系统,其特征在于,所述根据与解读词汇对应历史搜索词汇的出现次数和搜索次数得到解读词汇的掌握状态,包括:

6.根据权利要求5所述的一种基于AI和个性化知识库的文档辅助阅读系统,其特征在于,所述掌握系数通过根据用户对词汇的了解能力设置,包括:

7.根据权利要求1所述的一种基于AI和个性化知识库的文档辅助阅读系统,其特征在于,所述基于掌握状态生成解读词汇对应的辅助标签添加到重点词汇处,包括:

...

【技术特征摘要】

1.一种基于ai和个性化知识库的文档辅助阅读系统,其特征在于,包括:数据库、文档转换模块、文档解析模块和阅读辅助模块;

2.根据权利要求1所述的一种基于ai和个性化知识库的文档辅助阅读系统,其特征在于,所述对历史文本进行解析并提炼得到历史搜索记录,包括:

3.根据权利要求2所述的一种基于ai和个性化知识库的文档辅助阅读系统,其特征在于,所述将搜索词汇与历史浏览文本进行匹配得到历史搜索词汇,包括:

4.根据权利要求1所述的一种基于ai和个性化知识库的文档辅助阅读系统,其特征在于,所述基于历史搜索记录...

【专利技术属性】
技术研发人员:朱国正马冰马升徐寒
申请(专利权)人:合肥马道信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1