本发明专利技术公开了一种基于OCR的文档生成方法,包括以下步骤:导入模板,模板内容转化为HTML元素,展示于预览页面;在输入页面进行操作,标题分级组件用于确定标题样式,标题组件用于输入标题内容,文案组件用于输入文案内容,文件识别组件用于识别鼠标拖拽的文件,文件上传组件选择上传文件,文字识别组件将所述文件识别组件内的文件转化为文字内容,点击确定组件输入页面内容展示于预览页面;导出组件将所述预览页面内容导出为文本文件。解决普通的文档编写工作中的冗余步骤,省去页面切换,复制粘贴、页面排版的步骤,同时支持图片、语音和视频引用以及图片文字识别、语音文字识别和视频文字识别功能,为操作者提供更便捷的操作,提高文档编写效率。提高文档编写效率。提高文档编写效率。
【技术实现步骤摘要】
一种基于OCR的文档生成方法
[0001]本专利技术涉及应用程序方法领域,特别涉及一种基于OCR的文档生成方法。
技术介绍
[0002]传统的操作手册包括:引言、软件概述、软件使用说明、运行说明、操作命令一览表及用户操作举例等。通常由相关的开发人员进行编写,编写过程中需要参照一定的规范,通常会有固定的模板,同时需要提供图文说明。这就需要编写人员,频繁的截图,并且同时进行系统操作与文档编写工作,操作起来较为麻烦。
[0003]现有技术中文档生成方法存在许多问题:切换页面频繁,复制粘贴频繁,页面排版复杂,不支持图片、语音和视频引用,不支持图片文字识别、语音文字识别和视频文字识别等。
[0004]例如,一种在中国专利文献上公开的“文档生成方法及相关装置”,其公告号:CN110008461A,其申请日:2019年4月16日,解决现有技术中由于需要开发人员与业务人员进行沟通后通过编程构建和修改文档模板,才能生成文档,导致耗时长,效率低下的问题,但是存在操作繁琐,排版麻烦,不支持图片、语音和视频引用,不支持图片文字识别、语音文字识别和视频文字识别等。
技术实现思路
[0005]针对现有技术的不足,本专利技术提出了一种基于OCR的文档生成方法,避免了切换页面频繁,复制粘贴频繁,页面排版复杂,不支持图片、语音和视频引用,不支持图片文字识别、语音文字识别和视频文字识别等的问题。
[0006]以下是本专利技术的技术方案。
[0007]一种基于OCR的文档生成方法,包括以下步骤:S1:导入模板,模板内容转化为HTML元素,展示于预览页面;S2:在输入页面进行操作,标题分级组件用于确定标题样式,标题组件用于输入标题内容,文案组件用于输入文案内容,文件识别组件用于识别鼠标拖拽的文件,并上传至所述文件识别组件,文件上传组件选择上传文件,并上传至所述文件识别组件,文字识别组件将所述文件识别组件内的文件转化为文字内容,并展示于所述预览页面,点击确定组件输入页面内容展示于预览页面;S3:导出组件将所述预览页面内容导出为文本文件。解决普通的文档编写工作中的冗余步骤,省去页面切换,复制粘贴、页面排版的步骤,同时支持图片、语音和视频引用以及图片文字识别、语音文字识别和视频文字识别功能,为操作者提供更便捷的操作,提高文档编写效率。
[0008]作为优选,所述文件上传组件上传图片文件、语音文件或视频文件。同一组件支持上传不同类型的文件,为使用者提供便利。
[0009]作为优选,所述文件识别组件直接识别拖拽到该区域的图片文件、语音文件或视
频文件。在电脑端使用时,支持拖拽上传文件,为使用者提供便利。
[0010]作为优选,所述文字识别组件识别文件并将文件处理成文字内容,所述文字内容保存到所述预览页面。文件识别成文字内容后,展示在预览页面,便于二次修改内容和创作内容,为使用者提供全方位文档服务。
[0011]作为优选,所述预览页面每次输入端组件内容的确定保存为独立标签。便于识别文字内容精准排序,分段式体验效果更好,为二次创作提供便利。
[0012]作为优选,所述独立标签双击后,拆分为两个独立子标签。精准对指定内容进行创作,使预览复写更方便。
[0013]作为优选,所述独立标签通过递增排序。对输入或识别的内容进行排序,避免同时输入内容和识别内容排序混乱的问题。提高用户体验。
[0014]作为优选,所述文档生成方法为前端页面基于vue框架,后端采用java编程,通过electron打包的桌面应用程序。使用所述方法生成的方法,具有存储空间小、交互性强、跨平台和安全性高的益处。
[0015]作为优选,所述模板为所述文档生成方法内置模板或包含内容的word文件。内置模板满足部分文档排版要求,同时支持用户自定义上传模板,满足用户需求、提高用户体验感。
[0016]本专利技术的有益效果是:解决普通的文档编写工作中的冗余步骤,省去页面切换,复制粘贴、页面排版的步骤,同时支持图片、语音和视频引用以及图片文字识别、语音文字识别和视频文字识别功能,为操作者提供更便捷的操作,提高文档编写效率。
附图说明
[0017]图1 本专利技术提供的一种基于OCR的文档生成方法流程图。
具体实施方式
[0018]下面通过实施例,并结合附图,对本专利技术的技术方案作进一步具体的说明。另外,为了更好的说明本专利技术,在下文中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本专利技术同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段未做详细描述,以便于凸显本专利技术的主旨。
[0019]实施例:一种基于OCR的文档生成方法,包括以下步骤:S1:导入模板,模板内容转化为HTML元素,展示于预览页面;S2:在输入页面进行操作,标题分级组件用于确定标题样式,标题组件用于输入标题内容,文案组件用于输入文案内容,文件识别组件用于识别鼠标拖拽的文件,并上传至文件识别组件,文件上传组件选择上传文件,并上传至文件识别组件,文字识别组件将文件识别组件内的文件转化为文字内容,并展示于预览页面,点击确定组件输入页面内容展示于预览页面;S3:导出组件将预览页面内容导出为文本文件。
[0020]本实施例中,文件上传组件上传图片文件、语音文件或视频文件。文件上传组件响应后,打开文件选择弹窗,通过目标文件路径选中目标文件,点击弹窗确定后,文件上传至文件识别组件。
[0021]本实施例中,文件识别组件直接识别拖拽到该区域的图片文件、语音文件或视频文件。鼠标单击选中目标文件,将目标文件拖拽至文件识别组件后放置目标文件,目标文件上传成功。
[0022]本实施例中,文字识别组件识别文件并将文件处理成文字内容,文字内容保存到预览页面。
[0023]文字识别组件响应后,前端对文件进行判断,若文件是空文件,则输入页面弹出上传文件为空文件的提示框,若文件不是空文件,则判断文件具体类型。当文件类型是图片类型、语音类型或视频类型时,将文件信息传输到后端进行处理,同时将最大的独立标签序号传输到后端,若文件类型不是图片类型、语音类型或视频类型时,则输入页面弹出上传文件不合适的提示框,重新选择文件进行上传。
[0024]当后端接收的文件类型是图片文件时,程序调用图片转化文字的方法进行解析并显示于预览页面。其具体流程是:后端获得对应图片文件,调用图片转化文字接口,忽略文字的样式,对图片内容进行解析,解析的文字以字符数组的形式暂存,独立标签序号和每一段文字内容作为数组的元素,第一个独立标签序号为传输的最大的独立标签序号加一,后面依次递增。图片文字解析完后,将字符数组传输到前端,按照独立标签递增序号顺次解析数组元素,将数组元素解析成独立标签样式,并将元素文字内容显示于预览页面。
[0025]当后端接收的文件类型是语音文件时,程序调用语音转化文字的方法进行解析并显示于预览页面。其具体流程是:后端获得对应语音文件,调用语音转化文字接口,对语音内容进行解析,当前、后语音断了一秒以上时,视为一段语音内本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于OCR的文档生成方法,包括以下步骤:S1:导入模板,模板内容转化为HTML元素,展示于预览页面;S2:在输入页面进行操作,标题分级组件用于确定标题样式,标题组件用于输入标题内容,文案组件用于输入文案内容,文件识别组件用于识别鼠标拖拽的文件,并上传至所述文件识别组件,文件上传组件选择上传文件,并上传至所述文件识别组件,文字识别组件将所述文件识别组件内的文件转化为文字内容,并展示于所述预览页面,点击确定组件输入页面内容展示于预览页面;S3:导出组件将所述预览页面内容导出为文本文件。2.根据权利要求1所述的一种基于OCR的文档生成方法,其特征在于,所述文件上传组件上传图片文件、语音文件或视频文件。3.根据权利要求1所述的一种基于OCR的文档生成方法,其特征在于,所述文件识别组件直接识别拖拽到该区域的图片文件、语音文件或视频文件。4.根据权利要求1...
【专利技术属性】
技术研发人员:李梦茹,金红达,何琦枫,孙建彬,谢建勋,姜雪明,
申请(专利权)人:浙江浙大中控信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。