【技术实现步骤摘要】
【技术保护点】
一种基于树结构指导的英文场景文本块识别方法,其特征在于,包括以下步骤:步骤S1:在部件上对每类字符建立树结构,并为每类字符训练一个用于检测出该类字符结构的字符树结构模型;步骤S2:在待识别的文本块图像中使用每类字符树结构模型对每类字符进行检测,得到所有类别字符的检测结果;步骤S3:对检测结果进行非极大值抑制,抑制检测分数低的检测结果,保留检测分数高的检测结果,这些保留的检测结果所在位置代表了候选字符所在的位置,将这些候选字符中的每个候选字符所在的位置设为一个节点,利用这些节点建立条件随机场;步骤S4:为条件随机场定义损失函数,所述损失函数包括一元损失函数和二元损失函数,其中一元损失融入检测得分,二元损失融入字符空间位置约束及语言模型;步骤S5:对损失函数做最小化处理,得到最终的文本块识别结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:王春恒,史存召,肖柏华,高嵩,胡仅龙,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。