System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本技术属于人工智能,具体为ai技术将知识隐藏于文本文件独立或组合阅读的方法。
技术介绍
1、传统电子文件在阅读时,阅读的内容仅限于文件本身,不能对文件本身做一些拓展或者关联匹配,并且相对于网页而言,需要在维护的时候添加备注,不能自动备注、标记或者判断;并且文件阅读都是在线匹配查询,不能够离线查看。
技术实现思路
1、本专利技术的目的在于提供ai技术将知识隐藏于文本文件独立或组合阅读的方法,以解决上述
技术介绍
中提出的一个或多个问题。
2、为实现上述目的,本专利技术提供如下技术方案:基于ai技术将知识隐藏于文本文件独立或组合阅读的方法,包括以下步骤:
3、步骤s1:设置知识匹配库;
4、步骤s2:分析判断上传的文件类型,若文件类型不为标准的ofd文件,则转换为标准的ofd文件;
5、步骤s3:利用nlp对文件进行分析,获取文件所属领域类型,若不能判断文件的领域类型,则匹配知识匹配库中的通用数据;
6、步骤s4:根据文件领域类型,解析并获取文件内容信息,得到需要扩展的文本队列,将文本队列输入到知识模型中,获取到一一对应的 key、value键值对模型;
7、步骤s5:记录原文的内容(key)以及原文的解释说明(value)之间的关联关系信息按照格式进行排版,形成知识库xml文件,生成ofd的拓展文件包,生成新的ofd文件,新的ofd文件可用于在线或离线传输并阅读;
8、步骤s6:利用ofd阅读器加载ofd
9、优选的,所述知识匹配库的字段包括所属领域、书面的描述、具体的含义与内容解释、出处、内容描述。
10、优选的,所述步骤s2中分析判断上传的文件类型,如果是pdf、ppt、pptx、doc、docx、xls、xlxs、cad、true、dlf文件时,将其转换为ofd文件;如果是图片或者扫描件文件时,将文件进行ocr生成双层的ofd文件;如果是音频、视频等文件,则将其作为资源填充到ofd的框架中,并将其中的文字识别出来,作为音视频的字幕同步进行展示。
11、优选的,所述文件所属领域类型包括医疗行业、科技行业、教育行业、政法、化学;所述通用数据是指:不同领域之间相同的行业解释信息。
12、优选的,所述步骤s4中分析文件的具体步骤为:
13、步骤s41:解析文件内容信息,对词组,词条、相关语句进行语义分析;
14、步骤s42:获得需要进行扩展的文本队列;
15、步骤s43:将上述文本队列输入到知识模型中,获取到一一对应的key、value模型;
16、步骤s44:将步骤s43中生成的扩展文本保存生成新的ofd文件。
17、优选的,所述扩展文本为用于记录原文的内容以及原文的解释说明之间的关联关系。
18、优选的,所述步骤s5中采用ofd阅读器进行阅读的具体步骤如下:
19、步骤s51:利用ofd阅读器加载ofd原文基本内容,并判断原文是否存在拓展文件;
20、步骤s52:若原文存在拓展文件,则解析拓展文件,并将原文中指定内容进行标识显示,指定内容包括原文的单词,词条,语句;
21、步骤s53:并将扩展文件中内容以多种形式展示在ofd原文中,展现形式包括鼠标悬浮展示,ofd原文右侧批注内容描述;
22、步骤s54:在原文中绘制菜单展示全文中包含的名字及解释。
23、优选的,对知识匹配库中的内容操作包括编辑、修改、擦除;ofd原文展现的拓展文件内容根据知识匹配库的更新进行实时更新调整。
24、优选的,在阅读过程中,能够选择不同模式,控制展示内容是否动态显示或隐藏。
25、优选的,当原文ofd文件是组合文件时,组合文件目录上能够展示是否存在隐藏知识的内容信息。
26、与现有技术相比,本专利技术的有益效果是:
27、(1)本专利技术利用ai技术和ofd拓展文件有效地进行了融合,创造了一种将知识隐藏在文件中的方法,通过这种技术对文件进行加工使得原来的文件附着了大量的知识内容,提升了阅读者的阅读体验,提高了阅读效率;
28、(2)本专利技术通过ofd转换技术可以将各类文件进行转换,能够使得将知识隐藏在文件中的范围扩大,适用于更多的文件类型;
29、(3)本专利技术支持离线阅读,文件在经过加工以后可以将知识附着在文件上,无需其他在线的知识库或者任何后台的支持。
本文档来自技高网...【技术保护点】
1.基于AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:所述知识匹配库的字段包括所属领域、书面的描述、具体的含义与内容解释、出处、内容描述。
3.根据权利要求1所述的基于AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:所述步骤S2中分析判断上传的文件类型,如果是PDF、PPT、PPTX、DOC、DOCX、XLS、XLXS、CAD、True、DLF文件时,将其转换为OFD文件;如果是图片或者扫描件文件时,将文件进行OCR生成双层的OFD文件;如果是音频、视频等文件,则将其作为资源填充到OFD的框架中,并将其中的文字识别出来,作为音视频的字幕同步进行展示。
4.根据权利要求1所述的基于AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:所述文件所属领域类型包括医疗行业、科技行业、教育行业、政法、化学;所述通用数据是指:不同领域之间相同的行业解释信息。
5.根据权利要求1所述的基于AI技术将知识隐
6.根据权利要求5所述的AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:所述步骤S44中扩展文本为用于记录原文的内容以及原文的解释说明之间的关联关系。
7.根据权利要求1所述的AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于,所述步骤S5中采用OFD阅读器进行阅读的具体步骤如下:
8.根据权利要求1所述的AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:对知识匹配库中的内容操作包括编辑、修改、擦除;OFD原文展现的拓展文件内容根据知识匹配库的更新进行实时更新调整。
9.根据权利要求7所述的AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:在阅读过程中,能够选择不同模式,控制展示内容是否动态显示或隐藏。
10.根据权利要求1所述的AI技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:当原文OFD文件是组合文件时,组合文件目录上能够展示是否存在隐藏知识的内容信息。
...【技术特征摘要】
1.基于ai技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于ai技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:所述知识匹配库的字段包括所属领域、书面的描述、具体的含义与内容解释、出处、内容描述。
3.根据权利要求1所述的基于ai技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:所述步骤s2中分析判断上传的文件类型,如果是pdf、ppt、pptx、doc、docx、xls、xlxs、cad、true、dlf文件时,将其转换为ofd文件;如果是图片或者扫描件文件时,将文件进行ocr生成双层的ofd文件;如果是音频、视频等文件,则将其作为资源填充到ofd的框架中,并将其中的文字识别出来,作为音视频的字幕同步进行展示。
4.根据权利要求1所述的基于ai技术将知识隐藏于文本文件独立或组合阅读的方法,其特征在于:所述文件所属领域类型包括医疗行业、科技行业、教育行业、政法、化学;所述通用数据是指:不同领域之间相同的行业解释信息。
5.根据权利要求1所述的基于ai技...
【专利技术属性】
技术研发人员:蔡亚军,于晓丽,何冉冉,何中,
申请(专利权)人:江苏中威科技软件系统有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。