一种智能扩充与复用试题库的系统及方法技术方案

技术编号:34041158 阅读:19 留言:0更新日期:2022-07-06 13:31
本发明专利技术公开了一种智能扩充与复用试题库的系统及方法,利用图像识别算法及ocr文本识别方法,实现对要录入的试题内容的自动识别,从而实现了试题内容的自动录入。且在本发明专利技术中,试题的录入不但包括文本内容的录入,还包括图案内容的录入,并且利用位置数据可以将试题中的文本内容和图案内容按位置关系还原,不会出现乱序的情况。会出现乱序的情况。

A system and method of intelligently expanding and reusing test question base

【技术实现步骤摘要】
一种智能扩充与复用试题库的系统及方法


[0001]本专利技术涉及智能教育
,具体涉及一种智能扩充与复用试题库的系统及方法。

技术介绍

[0002]试题资源是当前智慧教育发展的重要组成部分,如何将纸质试题资源电子化一直是教育科技公司亟待解决的重点问题。当前试题录制大多是通过人工操作半自动化录题系统进行录题,录制效率缓慢且人工成本极高,如何有效提取采集试题资源十分重要。
[0003]目前很多试题资源都是存在附图的。而试题库中通常只保存了文本信息,有些试题库虽然保存了图片信息,但是图片信息与试题的位置关联信息会缺失,从而导致复用题目时,可能导致图片位置紊乱,从而试题复用性变差。

技术实现思路

[0004]针对现有技术的不足,本专利技术旨在提供一种智能扩充与复用试题库的系统及方法。
[0005]为了实现上述目的,本专利技术采用如下技术方案:
[0006]一种智能扩充与复用试题库的系统,包括图像采集模块、试题图片提取模块、文本提取模块、关联绑定模块、试题检索模块;
[0007]所述图像采集模块用于采集试题图片;
[0008]所述试题图案提取模块用于从所述试题图片中提取并记录试题当中的图案信息,所述图案信息包括图案的原图以及图案在所述试题图片中的位置数据;若一个试题中没有图案时,则标记此试题无图;
[0009]所述文本提取模块用于通过ocr识别提取试题图片中的文本信息,所述文本信息包括文本内容以及文本内容在试题图片中的位置数据;
[0010]所述关联绑定模块用于对试题图片按试题进行分割操作,获取试题图片中每一道单独试题的区域位置,并将各个区域位置内的文本内容以及图案进行绑定关联,并根据各个区域位置内的文本内容和图案在试题图片中的位置数据,获得各个区域位置内的文本内容和图案的相对位置信息,即在对应试题中的相对位置信息;
[0011]所述试题检索模块用于将检索条件文本与试题库中所有试题进行文本匹配,从而获取文本匹配度最高的一个或多个试题结果作为检索结果。
[0012]进一步地,所述试题图案提取模块在提取试题图片中图案后将图案消除,文本提取模块对消除图案后的试题图片进行文本信息提取,并对试题图案提取模块提取的图案进行文本信息提取。
[0013]更进一步地,关联绑定模块先将各个区域位置内的图案与消除图案后识别得到的文本内容及其相对位置信息进行关联存储在试题库中,作为对应试题的一级关联,并将各个区域位置中的各个图案分别与从中提取到的文本内容进行关联存储在试题库中,作为对
应试题的二级关联。
[0014]本专利技术还提供一种利用上述系统的方法,具体过程为:
[0015]先利用图像采集模块采集试题图片;
[0016]所述试题图案提取模块从所述试题图片中提取并记录试题当中的图案信息,所述图案信息包括图案的原图以及图案在所述试题图片中的位置数据;若一个试题中没有图案时,则标记此试题无图;
[0017]所述文本提取模块通过ocr识别提取试题图片中的文本信息,所述文本信息包括文本内容以及文本内容在试题图片中的位置数据;
[0018]关联绑定模块对试题图片的原图按试题进行分割操作,获取试题图片中每一道试题的区域位置,并将各道试题的区域位置内的文本内容以及图案进行绑定关联,并根据各个区域位置内的文本内容和图案在试题图片中的位置数据,获得各个区域位置内的文本内容和图案的相对位置信息,即在对应试题中的相对位置信息;
[0019]需要检索试题时,输入检索条件文本,所述试题检索模块将检索条件文本与试题库中所有试题进行文本匹配,从而获取文本匹配度最高的一个或多个试题结果作为检索结果并展示。
[0020]进一步地,上述方法中,所述试题图案提取模块在提取试题图片中图案后将图案消除,文本提取模块对消除图案后的试题图片进行文本信息提取,并对试题图案提取模块提取的图案进行文本信息提取。
[0021]更进一步地,上述方法中,关联绑定模块先将各个区域位置内的图案与消除图案后识别得到的文本内容及其相对位置信息进行关联存储在试题库中,作为对应试题的一级关联,并将各个区域位置中的各个图案分别与从中提取到的文本内容进行关联存储在试题库中,作为对应试题的二级关联。
[0022]进一步地,上述方法中,关联绑定模块在将各个试题的文本内容和图案进行关联绑定存储在试题库前,先通过文本匹配的方式判断试题库中是否已有相同的试题,如果是,则放弃该道试题,不将其存储在试题库中。
[0023]本专利技术的有益效果在于:本专利技术利用图像识别算法及ocr文本识别方法,实现对要录入的试题内容的自动识别,从而实现了试题内容的自动录入。且在本专利技术中,试题的录入不但包括文本内容的录入,还包括图案内容的录入,并且利用位置数据可以将试题中的文本内容和图案内容按位置关系还原,不会出现乱序的情况。
具体实施方式
[0024]以下将对本专利技术作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围并不限于本实施例。
[0025]实施例1
[0026]本实施例提供一种智能扩充与复用试题库的系统,包括图像采集模块、试题图片提取模块、文本提取模块、关联绑定模块、试题检索模块;
[0027]所述图像采集模块用于采集试题图片(试题图片中可以包含一道试题,也可以包含多道试题)。所述图像采集模块提供拍照采集、导入图片采集等多种采集方式。
[0028]所述试题图案提取模块用于从所述试题图片中提取并记录试题当中的图案信息,
所述图案信息包括图案的原图以及图案在所述试题图片中的位置数据;若一个试题中没有图案时,则标记此试题无图。
[0029]所述文本提取模块用于通过ocr识别提取试题图片中的文本信息,所述文本信息包括文本内容以及文本内容在试题图片中的位置数据。具体地,所述试题图案提取模块在提取试题图片中图案后将图案消除,文本提取模块对消除图案后的试题图片进行文本信息提取,并对试题图案提取模块提取的图案进行文本信息提取。
[0030]所述关联绑定模块用于对试题图片按试题进行分割操作,获取试题图片中每一道单独试题的区域位置,并将各个区域位置内的文本内容以及图案进行绑定关联,并根据各个区域位置内的文本内容和图案在试题图片中的位置数据,获得各个区域位置内的文本内容和图案的相对位置信息,即在对应试题中的相对位置信息。
[0031]在本实施例中,关联绑定模块先将各个区域位置内的图案与消除图案后识别得到的文本内容及其相对位置信息进行关联存储在试题库中,作为对应试题的一级关联,并将各个区域位置中的各个图案分别与从中提取到的文本内容进行关联存储在试题库中,作为对应试题的二级关联。
[0032]所述试题检索模块用于将检索条件文本与试题库中所有试题进行文本匹配,从而获取文本匹配度最高的一个或多个试题结果作为检索结果。检索条件文本可以是试题中的文本内容,也可以是图案中的文本内容。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能扩充与复用试题库的系统,其特征在于,包括图像采集模块、试题图片提取模块、文本提取模块、关联绑定模块、试题检索模块;所述图像采集模块用于采集试题图片;所述试题图案提取模块用于从所述试题图片中提取并记录试题当中的图案信息,所述图案信息包括图案的原图以及图案在所述试题图片中的位置数据;若一个试题中没有图案时,则标记此试题无图;所述文本提取模块用于通过ocr识别提取试题图片中的文本信息,所述文本信息包括文本内容以及文本内容在试题图片中的位置数据;所述关联绑定模块用于对试题图片按试题进行分割操作,获取试题图片中每一道单独试题的区域位置,并将各个区域位置内的文本内容以及图案进行绑定关联,并根据各个区域位置内的文本内容和图案在试题图片中的位置数据,获得各个区域位置内的文本内容和图案的相对位置信息,即在对应试题中的相对位置信息;所述试题检索模块用于将检索条件文本与试题库中所有试题进行文本匹配,从而获取文本匹配度最高的一个或多个试题结果作为检索结果。2.根据权利要求1所述的系统,其特征在于,所述试题图案提取模块在提取试题图片中图案后将图案消除,文本提取模块对消除图案后的试题图片进行文本信息提取,并对试题图案提取模块提取的图案进行文本信息提取。3.根据权利要求2所述的系统,其特征在于,关联绑定模块先将各个区域位置内的图案与消除图案后识别得到的文本内容及其相对位置信息进行关联存储在试题库中,作为对应试题的一级关联,并将各个区域位置中的各个图案分别与从中提取到的文本内容进行关联存储在试题库中,作为对应试题的二级关联。4.一种利用权利要求1

3任一所述系统的方法,其特征在于,具体过程为:先利用图像采集模块...

【专利技术属性】
技术研发人员:廖泽宇
申请(专利权)人:珠海读书郎软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1