一种图像数据仓库管理方法技术

技术编号:4252161 阅读:375 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开一种图像数据仓库管理方法,是利用基于文本的图像数据描述信息,对图像数据仓库进行高效管理,该管理过程包括图像数据索引文件的生成、上传、关键词检索及图像数据的下载;该方法分成图像数据上传和下载两路工作,客户端用户在对图像数据仓库的上传操作中,利用加锁的方式使该用户在当前时间成为对该仓库具有唯一更改性操作权限的用户。整个上传及下载操作都是通过数据描述文件进行,该描述文件记录了所有图像数据的分字段编号、存储路径及各种属性的详细信息。客户端与服务器端保持同样的图像数据描述文件,使得用户对图像数据进行的检索操作都能在客户端进行,从而减轻网络以及服务器端的压力,从根本上提高了数据仓库管理的效率。

【技术实现步骤摘要】

本专利技术属于图像处理
,涉及图像数据仓库管理方法
技术介绍
计算技术的发展以及计算机硬件性能的提高极大的促进了模式识别、人工智能、 数据挖掘以及图像处理等研究领域的发展,使得机器学习可以在超大样本训练集上进行, 从而获得更具特异性和敏感性的分类特征以及识别结果。随着机器学习训练样本集的增大,对样本集数据仓库的管理也将是至关重要的问 题,它将直接影响数据的存储以及检索提取的效率,如果没有高效的数据仓库管理方法,将 无疑为后续针对数据仓库的机器学习研究设置了巨大的瓶颈。根据马尔的视觉理论,人获取的外部信息70% -80%来自人的视觉系统(也即是 图像),因此模式识别的主要研究问题之一是针对图像内容的理解。例如在计算机人脸识别 问题的研究中,图像数据仓库中往往需要存储大量不同的人群(种)、在不同的角度和光照 条件以及不同的表情的图像数据;在针对医疗图像的研究中,针对某个组织结构或者某种 病变的研究,也往往需要不同医学成像模式(比如计算机断层成像、磁共振成像等)、在不 同成像参数以及在不同发育阶段/病程的图像资料。因此,针对图像的研究内容势必涉及 规模巨大的图像数据仓库以及与数据仓库匹配的图像数据仓库管理方法。现有的图像数据仓库管理方法都缺少高效的数据存储以及检索获取方式。如美 国国家标准与技术研究所公布的人脸数据仓库(http://faCe. nist. gov/),该数据仓库 是以数据信息组成文件名的方式实现数据分类与查找,由于图像数据的属性信息只存在 于文件名中,该方法限制了查找的高效性和数据属性描述的可扩展性;再如由美国国家生 物影像与生物工程研究所等单位发起的老年痴呆病的神经影像研究计划(http://www. adni-info. org/),大量的医学图像数据存储在服备器端,检索i寸稈都是通i寸服备器端的计 算机程序完成,这种方式无疑增加了服务器的负担,尤其是外部访问量增大时,这种检索速 度的影响将尤为明显。因此总的归纳起来,目前已有图像数据仓库管理方法存在以下不足1.针对图像数据的描述方案不能方便的随意扩展,使其不能满足基于图像数据的 科学研究对图像数据描述特征属性多样性的需求;2.影像图像数据的存储以及编号不能反映图像数据之间的关联性,比如不同时间 点或者不同图像采集模式所得到的图像数据之间的关系,不能很好的得到体现;3.图像数据在服务器上的上传和下载过程都在服务器端完成,这种设计增加了服 务器端的负担,影响了针对数据仓库的上传、检索和下载速度;4.当用户需要从众多图像数据检索结果中有选择性的下载部分结果时,没有很好 的选择性的批量下载的方法。因此,针对计算机图像处理研究的背景需求,以及目前已有图像数据仓库管理方 法的不足,我们提出了一种新的图像数据仓库管理方法。
技术实现思路
为了解决现有技术中图像数据仓库检索效率不高、存储/检索关键词扩展性不 好,以及数据与数据之间关联不明确的问题,本专利技术目的是提出一种基于文本的可扩展、可 以高效存储/检索/下载的图像数据仓库管理方法。为达成所述目的,本专利技术提供一种图像数据仓库的管理方法,是利用基于文本的 图像数据描述信息,对影像图像数据仓库进行快速高效的管理,该管理过程包括图像数据 图像数据描述文件的生成、图像数据的上传、图像数据的关键词检索和图像数据的下载;该 方法分成图像数据上传和图像数据下载两路工作,实现的步骤如下其中图像数据上传包括步骤sul 客户端启动图像数据上传操作准备上传新图像数据,并连接到将要操 作的服务器;步骤SU2 利用锁对所操作服务器的图像数据仓库进行加锁的操作,如果加锁操 作成功,使得同一时刻只有一个客户端具有对图像数据仓库进行更改性操作的权限;如果 加锁操作不成功,客户端不具有对图像数据仓库进行更改性操作的权限;步骤SU3 客户端用更改性操作的权限对图像数据仓库进行更改性操作,由客户 端客先从服务器端下载索引文件,把客户端索引文件和服务器的索引文件的时间属性进行 比对,如果比对的时间属性一致,客户端的图像数据索引文件与服务器的索引文件内容相 同,如果比对的时间属性不一致,则用服务器端的索引文件覆盖客户端的索引文件,用于保 证所有的更改性操作是在最新的图像数据仓库进行;最后在客户端上形成的图像数据索引 文件;步骤su4:客户端先输入新采集图像数据的名称,客户端会在客户端的索引文件 中检索该名称是否已经存在,得到检索结果,由客户端的用户判断新采集的图像数据与服 务器端已有的图像数据是否有关联性;如果没有关联性,将直接对新采集图像数据进行累 积编号为RCCM(X1X2X3X4. . . xn+l)_sMRI ;如果存在相关性,针对检索结果中列举的已有的相 关联的图像数据,客户端的用户根据新采集图像数据的名称选择该新采集图像数据的第 k次采集,然后在已有编号后再加上被试采集次数后缀k,生成新采集图像数据的编号为 RCCMXlx2x3x4. . . xn_sMRI_k,式中,RCCM表示数据所属单位,xix2x3x4. . . xn表示已有数据编号, 其中n和k为自然数,sMRI是图像数据中图像类型的缩写,因此不同领域的不同图像类型 该缩写会相应的不同;步骤su5 以对新采集图像数据生成的RCCM(X1X2X3X4. . . xn+l)_sMRI或 RCCMXlx2x3x4. . . xn_sMRI_k编号为新采集图像数据的描述文件开头,并生成用户对图像数据 仓库检索所需要的关键词及其键值,关键词表示数据一种特征的类别、与关键词对应的键 值表示该特征的类别对应的属性值,生成的新图像数据描述文件是纯文本文件;步骤SU6 客户端用户把新采集图像数据描述文件放入该新采集图像数据所在的 文件夹,然后把该文件夹一起上传到服务器端的图像数据仓库;步骤SU7 服务器端图像数据有新图像数据上传后,服务器端根据本次更新所在 的客户端的用户指令相应的更新该图像数据仓库的索引文件,图像数据仓库索引文件的更 新过程就是检索该图像数据仓库中用户指定的时间内的所有存在更新的目录以及该目录5中对应的图像数据的描述文件,得到被更新的新描述文件,再分别提取被更新的新描述文 件以及对应的存放路径并与该服务器端已有的索引文件进行比较,如果存在图像数据编号 重复,则用被更新的新描述文件及其路径覆盖服务器端已有的索引文件的相应内容;如果 编号不重复,则把被更新的新描述文件及其路径添加到服务器端已有的索引文件中,从而 得到整个图像数据仓库的被更新的新索引文件,至此,更新图像数据仓库索引文件完毕;步骤SU8 把步骤su2中设置的锁打开,客户端释放对服务器端的控制权限,使得 其它用户对该服务器数据仓库有更新权限,从而对图像数据仓库解锁;其中图像数据下载包括步骤sdl 客户端的用户启动图像数据下载操作,并连接到将要操作的服务器;步骤sd2 客户端的用户把客户端的图像数据索引文件与服务器端的图像数据索 引文件进行同步操作,在客户端生成最新的索引文件,使得客户端的图像索引文件与服务 器端的图像数据索引文件内容完全相同,从而保证用户的检索过程在最新的图像数据仓库 上进行;步骤sd3 用户在客户端得到了最新的索引文件后,输入要检索的关键词和键值 进行搜索,得到满足关键词键对本文档来自技高网
...

【技术保护点】
一种图像数据仓库的管理方法,其特征在于,是利用基于文本的图像数据描述信息,对影像图像数据仓库进行快速高效的管理,该管理过程包括图像数据图像数据描述文件的生成、图像数据的上传、图像数据的关键词检索和图像数据的下载;该方法分成图像数据上传和图像数据下载两路工作,实现的步骤如下:其中图像数据上传包括:步骤su1:客户端启动图像数据上传操作准备上传新图像数据,并连接到将要操作的服务器;步骤su2:利用锁对所操作服务器的图像数据仓库进行加锁的操作,如果加锁操作成功,使得同一时刻只有一个的用户指令相应的更新该图像数据仓库的索引文件,图像数据仓库索引文件的更新过程就是检索该图像数据仓库中用户指定的时间内的所有存在更新的目录以及该目录中对应的图像数据的描述文件,得到被更新的新描述文件,再分别提取被更新的新描述文件以及对应的存放路径并与该服务器端已有的索引文件进行比较,如果存在图像数据编号重复,则用被更新的新描述文件及其路径覆盖服务器端已有的索引文件的相应内容;如果编号不重复,则把被更新的新描述文件及其路径添加到服务器端已有的索引文件中,从而得到整个图像数据仓库的被更新的新索引文件,至此,更新图像数据仓库索引文件完毕;步骤su8:把步骤su2中设置的锁打开,客户端释放对服务器端的控制权限,使得其它用户对该服务器数据仓库有更新权限,从而对图像数据仓库解锁;其中图像数据下载包括:步骤sd1:客户端的用户启动图像数据下载操作,并连接到将要操作的服务器;步骤sd2:客户端的用户把客户端的图像数据索引文件与服务器端的图像数据索引文件进行同步操作,在客户端生成最新的索引文件,使得客户端的图像索引文件与服务器端的图像数据索引文件内容完全相同,从而保证用户的检索过程在最新的图像数据仓库上进行;步骤sd3:用户在客户端得到了最新的索引文件后,输入要检索的关键词和键值进行搜索,得到满足关键词键对的图像数据目录列表;步骤sd4:客户端的用户对图像数据目录列表中的图像进行预览,以确定搜索的结果是否为自己预期的结果;步骤sd5:在搜索得到的图像数据目录列表中,采用文件夹复选框复选所有需要的图像数据,对所需要的图像数据进行批量下载。客户端具有对图像数据仓库进行更改性操作的权限;如果加锁操作不成功,客户端不具有对图像数据仓库进行更改性操作的权限;步骤su3:客户端用更改性操作的权限对图像数据仓库进行更改性操作,由客户端客先从服务器端下载索引文件,把客户端索引...

【技术特征摘要】
一种图像数据仓库的管理方法,其特征在于,是利用基于文本的图像数据描述信息,对影像图像数据仓库进行快速高效的管理,该管理过程包括图像数据图像数据描述文件的生成、图像数据的上传、图像数据的关键词检索和图像数据的下载;该方法分成图像数据上传和图像数据下载两路工作,实现的步骤如下其中图像数据上传包括步骤su1客户端启动图像数据上传操作准备上传新图像数据,并连接到将要操作的服务器;步骤su2利用锁对所操作服务器的图像数据仓库进行加锁的操作,如果加锁操作成功,使得同一时刻只有一个客户端具有对图像数据仓库进行更改性操作的权限;如果加锁操作不成功,客户端不具有对图像数据仓库进行更改性操作的权限;步骤su3客户端用更改性操作的权限对图像数据仓库进行更改性操作,由客户端客先从服务器端下载索引文件,把客户端索引文件和服务器的索引文件的时间属性进行比对,如果比对的时间属性一致,客户端的图像数据索引文件与服务器的索引文件内容相同,如果比对的时间属性不一致,则用服务器端的索引文件覆盖客户端的索引文件,用于保证所有的更改性操作是在最新的图像数据仓库进行;最后在客户端上形成的图像数据索引文件;步骤su4客户端先输入新采集图像数据的名称,客户端会在客户端的索引文件中检索该名称是否已经存在,得到检索结果,由客户端的用户判断新采集的图像数据与服务器端已有的图像数据是否有关联性;如果没有关联性,将直接对新采集图像数据进行累积编号为RCCM(x1x2x3x4...xn+1)_sMRI;如果存在相关性,针对检索结果中列举的已有的相关联的图像数据,客户端的用户根据新采集图像数据的名称选择该新采集图像数据的第k次采集,然后在已有编号后再加上被试采集次数后缀k,生成新采集图像数据的编号为RCCMx1x2x3x4...xn_sMRI_k,式中,RCCM表示数据所属单位,x1x2x3x4...xn表示已有数据编号,其中n和k为自然数,sMRI是图像数据中图像类型的缩写,因此不同领域的不同图像类型该缩写会相应的不同;步骤su5以对新采集图像数据生成的RCCM(x1x2x3x4...xn+1)sMRI或RCCMx1x2x3x4...xn_sMRI_k编号为新采集图像数据的描述文件开头,并生成用户对图像数据仓库检索所需要的关键词及其键值,关键词表示数据一种特征的类别、与关键词对应的键值表示该特征的类别对应的属性值,生成的新图像数据描述文件是纯文本文件;步骤su6客户端用户把新采集图像数据描述文件放入该新采集图像数据所在的文件夹,然后把该文件夹一起上传到服务器端的图像数据仓库;步骤su7服务器端图像数据有新图像数据上传后,服务器端根据本次更新所在的客户端的用户指令相应的更新该图像数据仓库的索引文件,图像数据仓库索引文件的更新过程就是检索该图像数据仓库中用户指定的时间内的所有存在更新的目录以及该目录中对应的图像数据的描述文件,得到被更新的新描述文件,再分别提取被更新的新描述文件以及对应的存放路径并与该服务器...

【专利技术属性】
技术研发人员:左年明宋明刘勇刘冰蒋田仔
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1