技术资料的快速阅读和处理方法技术

技术编号:24093522 阅读:15 留言:0更新日期:2020-05-09 09:10
本发明专利技术涉及一种技术资料的快速阅读和处理方法,尤其涉及一种以技术图片为导向、引导用户快速阅读和处理技术资料的方法;本发明专利技术是以技术图片为主线,利用OCR(Optical Character Recognition)识别技术对技术图片中的标注进行识别;并将其与文字描述进行关联;用户通过对技术图片进行查看的同时、进行选择操作,即可以快速检索到与用户关注的技术特征对应的文字描述,从而实现对技术资料的快速阅读。

Fast reading and processing of technical data

【技术实现步骤摘要】
技术资料的快速阅读和处理方法
本专利技术涉及一种技术资料的快速阅读和处理方法,尤其涉及一种以技术图片为导向、引导用户快速阅读和处理技术资料的方法,属于文件处理的

技术介绍
技术资料范围很广,包括教材、技术书籍、论文、学术报告、专利、设计资料、技术标准、技术档案、产品说明书等等。在进行学习、科研、技术创新、技术审核等过程中,都会涉及到对大量技术资料的阅读、理解;面对大量的技术资料时,阅读的效率往往难以保证,而尽可能提高阅读的效率则是一个有待解决的问题。
技术实现思路
技术资料中包括文字描述和技术图片;技术图片包括原理图、设计图、流程图、统计图、数据表格等等;而技术图片通常是对
技术实现思路
的高度概括,其中会包含概括性的标注,所述的标注是索引编码或文字或索引编码与文字的组合;索引编码通常出现在原理图、设计图中,概括性的文字通常出现在流程图、统计图、数据表格中;本专利技术是以技术图片为主线,利用OCR(OpticalCharacterRecognition)识别技术对技术图片中的标注进行识别;并将其与文字描述进行关联;用户通过对技术图片进行查看的同时、进行选择操作,即可以快速检索到与用户关注的技术特征对应的文字描述,从而实现对技术资料的快速阅读。具体的,本专利技术的第一技术方案是:包括技术资料和阅读系统;技术资料中至少包括文字描述和技术图片,技术图片中包含概括性的标注,所述的标注是索引编码或文字或索引编码与文字的组合;当用户通过阅读系统阅读技术资料时,采用以下步骤:S101、阅读系统显示技术资料中的技术图片,用户查看技术图片、对技术资料的
技术实现思路
形成概括性的认识;S102、用户根据其需要选择技术图片中的标注,阅读系统提取标注的内容,然后根据标注的内容对技术资料的文字描述进行检索;需要说明的是,其中:当标注为索引编码时,首先根据索引编码对技术资料的文字描述进行检索,获取与该索引编码对应的索引编码说明;然后按照索引编码,或/和,索引编码说明的文字内容对技术资料的文字描述进行检索;当标注为概括性的文字时,按照文字内容对技术资料的文字描述进行检索;S103、若用户选择的标注为索引编码时,阅读系统根据S102的检索结果显示与该索引编码对应的索引编码说明;通过该步骤的转换操作,使得用户可以快速了解索引编码的含义、通常适用于原理图、设计图;另外,对于索引编码说明的显示方法是多种多样的;S104、当用户需要详细了解与该标注相关的技术资料的文字描述时,由阅读系统根据S102的检索结果,显示与该标注相关的文字描述的节选段落;S105、当用户需要对一幅或多幅技术图片中的若干个标注的关联性进行分析时,则用户根据其需要选定相关技术图片中的若干个标注,由阅读系统提取若干个标注的内容;然后阅读系统根据用户选择的若干个标注的内容对技术资料的文字描述进行复合检索;然后阅读系统根据复合检索的结果,显示与用户选择的若干个标注全部相关或部分相关的文字描述的节选段落,以便于用户有选择性的快速浏览。本专利技术的第二技术方案是:包括技术资料和阅读系统;技术资料中至少包括文字描述和技术图片,技术图片中包含概括性的索引编码;阅读系统对技术资料进行预处理,至少完成提取技术图片中的各个索引编码的内容和位置、并根据索引编码在文字描述中提取与索引编码对应的索引编码说明;当用户通过阅读系统阅读技术资料时,采用以下步骤:S201、用户浏览一幅或多幅技术图片,阅读系统显示技术图片、并生成索引编码列表,所述的索引编码列表至少是用户所选择的技术图片中所包含的索引编码的汇总集合或精选集合;需要说明的是,索引编码列表可以进行精选、即当索引编码数量较多时挑选重要的数据进行监控;索引编码列表可以进行扩展,例如直接使用从文字描述中提取与索引编码汇总表;S202、当用户选择任意一幅技术图片中的任意一个索引编码时,阅读系统将用户选择的索引编码的所在区域做“选中增强显示”;S203、阅读系统根据用户选择的索引编码,在文字描述中检索用户选择的索引编码与索引编码列表中的用户未选择的索引编码的段落关联性,并按照关联性的高低排序;然后根据关联性排序结果,对各个技术图片中的各个用户未选择的索引编码的所在区域做“关联性差异化增强显示”、从而直观的体现关联性的差异;S204、用户在一次操作中选择一幅或多幅技术图片中的若干个索引编码时,阅读系统根据用户选择的若干个索引编码,在文字描述中检索用户选择的若干个索引编码与索引编码列表中的用户未选择的索引编码的段落关联性,并按照关联性的高低排序;然后根据关联性排序结果,对各个技术图片中的各个用户未选择的索引编码的所在区域做“关联性差异化增强显示”、从而直观的体现关联性的差异;S205、用户进行索引编码选择的操作过程包括增加选中、部分取消选中、全部取消选中,阅读系统根据用户的选择分别执行S203或S204的操作;S206、用户根据“关联性差异化增强显示”的显示效果,快速找出与用户已选择的一个或多个索引编码关联性较高的用户未选择的索引编码,从而加快对技术资料理解的过程。需要说明的是,其中:所述的“选中增强显示”包括在索引编码的所在区域画边框、加深区域颜色、闪烁显示;所述的“关联性差异化增强显示”是按照已选择的索引编码与未选择的索引编码的关联性的高低,对未选择的索引编码的区域进行差异化的增强显示;已选择的索引编码与未选择的索引编码同时出现在文字描述各个段落中的关联次数越多,即已选择的索引编码与未选择的索引编码的关联性越高;可以按照关联性的高低顺序由深变浅的对各个未选择的索引编码区域填充不同的颜色实现差异化的增强显示;或者直接显示关联次数;当然还可以采用其他的差异化的增强显示手段。进一步的,由于技术资料的格式多种多样,包括DOC、PPT、WPS、PDF、JPG、CAJ等等;因此,有必要一个设置预处理环节,对不同格式的技术资料的内容进行整理;采用现有技术中方法即可以对上述文件格式中的文字和图片进行整理和提取;具体过程是:阅读系统对技术资料进行预处理,即对技术资料中的文字描述和技术图片进行拆分和整理、并存储预处理结果;当用户通过阅读系统阅读技术资料时,阅读系统能够直接利用预处理结果为用户提供服务;所述的预处理包括:对技术资料中的多段文字描述进行分段、整理、识别;对技术资料中的一幅或多幅技术图片进行截取、编排、整理;当阅读系统以文字描述为主导对技术资料进行预处理时,采用以下方法:S301、对文字描述进行解析,提取其中的索引编码和索引编码说明,形成索引编码汇总表;S302、根据索引编码汇总表对各个技术图片进行自动分析,包括图片分割、索引编码提取、识别;S303、完成各个技术图片中的索引编码的定位、并与文字描述建立关联索引;即根据所述的与技术图片相关联的索引编码汇总表,执行预检索操作,将各个索引编码或索引编码说明与其在文字描述中出现的段落位置进行关联;使得用户在使用过程中,能够直接运用预检索操作的检索结果。<本文档来自技高网
...

【技术保护点】
1.技术资料的快速阅读和处理方法,其特征在于,包括技术资料和阅读系统;技术资料中至少包括文字描述和技术图片,技术图片中包含概括性的标注,所述的标注是索引编码或文字或索引编码与文字的组合;当用户通过阅读系统阅读技术资料时,采用以下步骤:/nS101、阅读系统显示技术资料中的技术图片,用户查看技术图片、对技术资料的技术内容形成概括性的认识;/nS102、用户根据其需要选择技术图片中的标注,阅读系统提取标注的内容,然后根据标注的内容对技术资料的文字描述进行检索;/nS103、若用户选择的标注为索引编码时,阅读系统根据S102的检索结果显示与该索引编码对应的索引编码说明;/nS104、当用户需要详细了解与该标注相关的技术资料的文字描述时,由阅读系统根据S102的检索结果,显示与该标注相关的文字描述的节选段落;/nS105、当用户需要对一幅或多幅技术图片中的若干个标注的关联性进行分析时,则用户根据其需要选定相关技术图片中的若干个标注,由阅读系统提取若干个标注的内容;然后阅读系统根据用户选择的若干个标注的内容对技术资料的文字描述进行复合检索;然后阅读系统根据复合检索的结果,显示与用户选择的若干个标注全部相关或部分相关的文字描述的节选段落,以便于用户有选择性的快速浏览。/n...

【技术特征摘要】
1.技术资料的快速阅读和处理方法,其特征在于,包括技术资料和阅读系统;技术资料中至少包括文字描述和技术图片,技术图片中包含概括性的标注,所述的标注是索引编码或文字或索引编码与文字的组合;当用户通过阅读系统阅读技术资料时,采用以下步骤:
S101、阅读系统显示技术资料中的技术图片,用户查看技术图片、对技术资料的技术内容形成概括性的认识;
S102、用户根据其需要选择技术图片中的标注,阅读系统提取标注的内容,然后根据标注的内容对技术资料的文字描述进行检索;
S103、若用户选择的标注为索引编码时,阅读系统根据S102的检索结果显示与该索引编码对应的索引编码说明;
S104、当用户需要详细了解与该标注相关的技术资料的文字描述时,由阅读系统根据S102的检索结果,显示与该标注相关的文字描述的节选段落;
S105、当用户需要对一幅或多幅技术图片中的若干个标注的关联性进行分析时,则用户根据其需要选定相关技术图片中的若干个标注,由阅读系统提取若干个标注的内容;然后阅读系统根据用户选择的若干个标注的内容对技术资料的文字描述进行复合检索;然后阅读系统根据复合检索的结果,显示与用户选择的若干个标注全部相关或部分相关的文字描述的节选段落,以便于用户有选择性的快速浏览。


2.技术资料的快速阅读和处理方法,其特征在于:包括技术资料和阅读系统;技术资料中至少包括文字描述和技术图片,技术图片中包含概括性的索引编码;阅读系统对技术资料进行预处理,至少完成提取技术图片中的各个索引编码的内容和位置、并根据索引编码在文字描述中提取与索引编码对应的索引编码说明;当用户通过阅读系统阅读技术资料时,采用以下步骤:
S201、用户浏览一幅或多幅技术图片,阅读系统显示技术图片、并生成索引编码列表,所述的索引编码列表至少是用户所选择的技术图片中所包含的索引编码的汇总集合或精选集合;
S202、当用户选择任意一幅技术图片中的任意一个索引编码时,阅读系统将用户选择的索引编码的所在区域做“选中增强显示”;
S203、阅读系统根据用户选择的索引编码,在文字描述中检索用户选择的索引编码与索引编码列表中的用户未选择的索引编码的段落关联性,并按照关联性的高低排序;然后根据关联性排序结果,对各个技术图片中的各个用户未选择的索引编码的所在区域做“关联性差异化增强显示”、从而直观的体现关联性的差异;
S204、用户在一次操作中选择一幅或多幅技术图片中的若干个索引编码时,阅读系统根据用户选择的若干个索引编码,在文字描述中检索用户选择的若干个索引编码与索引编码列表中的用户未选择的索引编码的段落关联性,并按照关联性的高低排序;然后根据关联性排序结果,对各个技术图片中的各个用户未选择的索引编码的所在区域做“关联性差异化增强显示”、从而直观的体现关联性的差异;
S205、用户进行索引编码选择的操作过程包括增加选中、部分取消选中、全部取消选中,阅读系统根据用户的选择分别执行S203或S204的操作;
S206、用户根据“关联性差异化增强显示”的显示效果,快速找出与用户已选择的一个或多个索引编码关联性较高的用户未选择的索引编码,从而加快对技术资料理解的过程。


3.根据权利要求1或2所述的技术资料的快速阅读和处理方法,其特征在于:阅读系统对技术资料进行预处理,即对技术资料中的文字描述和技术图片进行拆分和整理、并存储预处理结果;当用户通过阅读系统阅读技术资料时,阅读系统能够直接利用预处理结果为用户提供服务;所述的预处理包括:对技术资料中的多段文字描述进行分段、整理、识别;对技术资料中的一幅或多幅技术图片进行截取、编排、整理;
当阅读系统以文字描述为主导对技术资料进行预处理时,采用以下方法:
S301、对文字描述进行解析,提取其中的索引编码和索引编码说明,形成索引编码汇总表;
S302、根据索引编码汇总表对各个技术图片进行自...

【专利技术属性】
技术研发人员:朱杰
申请(专利权)人:南京酷朗电子有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1