一种基于OCR的文档生成方法技术

技术编号：31486146 阅读：40 留言：0更新日期：2021-12-18 12:21

本发明专利技术公开了一种基于OCR的文档生成方法，包括以下步骤：导入模板，模板内容转化为HTML元素，展示于预览页面；在输入页面进行操作，标题分级组件用于确定标题样式，标题组件用于输入标题内容，文案组件用于输入文案内容，文件识别组件用于识别鼠标拖拽的文件，文件上传组件选择上传文件，文字识别组件将所述文件识别组件内的文件转化为文字内容，点击确定组件输入页面内容展示于预览页面；导出组件将所述预览页面内容导出为文本文件。解决普通的文档编写工作中的冗余步骤，省去页面切换，复制粘贴、页面排版的步骤，同时支持图片、语音和视频引用以及图片文字识别、语音文字识别和视频文字识别功能，为操作者提供更便捷的操作，提高文档编写效率。提高文档编写效率。提高文档编写效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于OCR的文档生成方法

[0001]本专利技术涉及应用程序方法领域，特别涉及一种基于OCR的文档生成方法。

技术介绍

[0002]传统的操作手册包括：引言、软件概述、软件使用说明、运行说明、操作命令一览表及用户操作举例等。通常由相关的开发人员进行编写，编写过程中需要参照一定的规范，通常会有固定的模板，同时需要提供图文说明。这就需要编写人员，频繁的截图，并且同时进行系统操作与文档编写工作，操作起来较为麻烦。
[0003]现有技术中文档生成方法存在许多问题：切换页面频繁，复制粘贴频繁，页面排版复杂，不支持图片、语音和视频引用，不支持图片文字识别、语音文字识别和视频文字识别等。
[0004]例如，一种在中国专利文献上公开的“文档生成方法及相关装置”，其公告号：CN110008461A，其申请日：2019年4月16日，解决现有技术中由于需要开发人员与业务人员进行沟通后通过编程构建和修改文档模板，才能生成文档，导致耗时长，效率低下的问题，但是存在操作繁琐，排版麻烦，不支持图片、语音和视频引用，不支持图片文字识别、语音文字识别和视频文字识别等。

技术实现思路

[0005]针对现有技术的不足，本专利技术提出了一种基于OCR的文档生成方法，避免了切换页面频繁，复制粘贴频繁，页面排版复杂，不支持图片、语音和视频引用，不支持图片文字识别、语音文字识别和视频文字识别等的问题。
[0006]以下是本专利技术的技术方案。
[0007]一种基于OCR的文档生成方法，包括以下步骤：S1：导入模...

【技术保护点】

【技术特征摘要】
1.一种基于OCR的文档生成方法，包括以下步骤：S1：导入模板，模板内容转化为HTML元素，展示于预览页面；S2：在输入页面进行操作，标题分级组件用于确定标题样式，标题组件用于输入标题内容，文案组件用于输入文案内容，文件识别组件用于识别鼠标拖拽的文件，并上传至所述文件识别组件，文件上传组件选择上传文件，并上传至所述文件识别组件，文字识别组件将所述文件识别组件内的文件转化为文字内容，并展示于所述预览页面，点击确定组件输入页面内容展示于预览页面；S3：导出组件将所述预览页面内容导出为文本文件。2.根据权利要求1所述的一种基于OCR的文档生成方法，其特征在于，所述文件上传组件上传图片文件、语音文件或视频文件。3.根据权利要求1所述的一种基于OCR的文档生成方法，其特征在于，所述文件识别组件直接识别拖拽到该区域的图片文件、语音文件或视频文件。4.根据权利要求1...

【专利技术属性】
技术研发人员：李梦茹，金红达，何琦枫，孙建彬，谢建勋，姜雪明，
申请(专利权)人：浙江浙大中控信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人