基于云计算技术的图像识别方法技术

技术编号：39804889 阅读：30 留言：0更新日期：2023-12-22 02:38

本申请提供了一种基于云计算技术的图像识别方法，包括：云计算平台对用户上传的原始图像进行切分，得到

全部详细技术资料下载

【技术实现步骤摘要】
基于云计算技术的图像识别方法、装置及相关设备
[0001]本申请要求于
2022
年
06
月
07
日提交中国国家知识产权局
、
申请号为
202210636827.6、
申请名称为“一种长文本切片识别的服务化部署方法”的中国专利申请的优先权，其全部内容通过引用结合在本申请中
。

[0002]本申请涉及人工智能
，尤其涉及一种基于云计算技术的图像识别方法
、
装置及相关设备
。

技术介绍

[0003]随着光学字符识别
(optical character recognition
，
OCR)
技术的发展，识别输入图像中的文本信息，在票据识别
、
文本扫描
、
网络图像的安全性审核
、
图书检索等场景中存在广泛应用
。
[0004]通常情况下，输入的图像中可以包括一行或者多行字符串，每行字符串可以构成该图像中的一个文本行，并且，不同文本行的图像尺寸可以相同，也可以不同
。
例如，在图1所示的输入图像中，可以包括3个文本行，其中，文本行1为“篮球运动赛事”，文本行2为“BASKETBALL GAMES”，文本行3为“举办方：
XXX”。
[0005]目前，在识别图像中的文本时，通常会从该图像中切分得到多个切片图像，每个切片图像中包括至少一个文本行
。
然...

【技术保护点】

【技术特征摘要】
1.
一种基于云计算技术的图像识别方法，其特征在于，所述方法应用于云计算平台，所述方法包括：所述云计算平台获取用户上传的原始图像，并对所述原始图像进行切分，得到
M
个包括文本行的切片图像，所述
M
为正整数；所述云计算平台对每个切片图像进行裁剪，得到
M
组子切片图像，每组子切片图像基于一个切片图像裁剪得到，并利用人工智能
AI
模型识别每组子切片图像，得到
M
组文本子串，其中，每组文本子串包括至少一个文本子串，每组子切片图像中的不同子切片图像的尺寸相同；所述云计算平台根据所述
M
组文本子串生成所述原始图像中的文本，并将所述原始图像中的文本提供给所述用户或进行保存
。2.
根据权利要求1所述的方法，其特征在于，每组子切片图像中的子切片图像的尺寸根据所述原始图像所属的类别确定，并且，裁剪不同类别的原始图像中的切片图像所采用的尺寸不同
。3.
根据权利要求1或2所述的方法，其特征在于，所述
M
个切片图像的尺寸不同，并且，裁剪所述
M
个切片图像所采用的尺寸相同
。4.
根据权利要求1至3任一项所述的方法，其特征在于，所述
M
个切片图像属于多个不同的类型，并且，所述
M
组子切片图像通过不同的
AI
模型进行识别
。5.
根据权利要求1至4任一项所述的方法，其特征在于，所述云计算平台配置有多个
AI
模型，所述多个
AI
模型支持被所述云计算平台提供的目标服务进行调用，所述目标服务为多个服务中的任一服务，所述多个服务用于识别不同类型的原始图像
。6.
根据权利要求5所述的方法，其特征在于，所述不同的
AI
模型部署于至少一个计算设备
。7.
根据权利要求1至6任一项所述的方法，其特征在于，所述云计算平台根据所述
M
组文本子串生成所述原始图像中的文本，包括：所述云计算平台对每组文本子串进行拼接，得到
M
个文本行；所述云计算平台根据所述
M
个文本行，生成所述原始图像中的文本
。8.
根据权利要求1至7任一项所述的方法，其特征在于，所述
M
组文本子串中包括目标组文本子串，所述目标组文本子串包括第一文本子串以及第二文本子串，所述第一文本子串对应的第一子切片图像与所述第二文本子串对应的第二子切片图像之间存在重叠区域，所述重叠区域的尺寸为预设尺寸，所述重叠区域内的字符用于指导所述第一文本子串与所述第二文本子串之间的拼接
。9.
根据权利要求8所述的方法，其特征在于，所述重叠区域内的字符是根据所述第一文本子串在所述第一子切片图像上的成像位置进行确定，所述第一文本子串在所述第一子切片图像上的成像位置由所述
AI
模型输出
。10.
根据权利要求1至9任一项所述的方法，其特征在于，所述云计算平台获取用户上传的原始图像，包括：所述云计算平台输出信息输入界面；所述云计算平台获取所述用户通过所述信息输入界面上传的原始图像
。11.
一种基于云计算技术的图像识别装置，其特征在于，所述图像识别装置应用于云计
算平台，所述图像识别装置包括：交互模块，用于获取用户上传的原始图像；裁剪模块，用于对所述原始图像进行切分，得到
M
个包括文本行的切片图像，所述
M
为正整数；对每个切片图像进行裁剪，得到
M
组子切片图像，每组子切片图像基于一个切片图像裁剪得到；识别模块，用于利用人工智能
AI
模型识别每组子切片图像，得到
M
组文本子串，其中，每组文本子串...

【专利技术属性】
技术研发人员：徐武恒，谢泽澄，吴新，邓华伟，廖明辉，黄铮，朱声高，
申请(专利权)人：华为云计算技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人