一种基于LDA文档主题生成模型的车辆二级维护管理方法技术

技术编号:15502340 阅读:81 留言:0更新日期:2017-06-03 23:17
本发明专利技术提供一种基于LDA文档主题生成模型的车辆二级维护管理方法,包括:步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。本发明专利技术技术方案能够快速精确对车辆二级维护系统中的待处理图像进行分类。

Vehicle two level maintenance management method based on LDA document subject generation model

The invention provides a LDA document theme generation model of the vehicle two maintenance management method, which is based on step 1, two maintenance vehicle image of the subject image samples for training the LDA model based on each feature vector to obtain the image samples in the theme theme; two levels of maintenance of the vehicles in the image histogram of each subject to be processed the use of local sensitive hash algorithm recognition; step 2, the theme of each feature vector of image samples and visual words to be processed vehicle two maintenance topics in the image histogram based on the treatment of two maintenance vehicle image classification. The technical proposal of the invention can rapidly and accurately classify the image to be processed in the two stage maintenance system of the vehicle.

【技术实现步骤摘要】
一种基于LDA文档主题生成模型的车辆二级维护管理方法
本专利技术涉及车辆维护管理
,更具体地,涉及一种基于LDA文档主题生成模型的车辆二级维护管理方法。
技术介绍
目前,在车辆二级维护领域,车辆维修是以强制维护、定期检测为前提和基础,以视情修理为手段,根据车辆实际状况确定修理作业深度的。这与以往的老制度的根本区别是加强二级维护前后的检测诊断,视情附加修理项目,保障车辆经常处于良好技术状况.因此,二级维护质量的提高是执行新保修制度的关键,而对二级维护过程中所产生的图片的分类与分析,是二级维护系统中重要设计内容,因此若仅仅只是对图片进行采集存储,并未充分利用二级维护系统的优势。现有技术主要是对二级维护所产生的图片进行采集与存储,并未对图片进行甄别处理。如果仅讨论图像分类技术,常用的主题模型有LDA与PLSA模型,而在图像特征提取过程中通常采用sift特征提取或者sift特征结合其他特征。特征聚类的技术有KMeans聚类技术等等。
技术实现思路
本专利技术为克服上述问题或者至少部分地解决上述问题,提供一种基于LDA文档主题生成模型的车辆二级维护管理方法。根据本专利技术的一个方面,提供一种车辆二级维护管理方法,其特征在于,包括:步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。本申请提出一种基于LDA文档主题生成模型的车辆二级维护管理方法,步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。本专利技术技术方案能够快速精确对车辆二级维护系统中的待处理图像进行分类。附图说明图1为根据本专利技术实施例一种车辆二级维护管理方法的整体流程示意图;图2为根据本专利技术实施例一种车辆二级维护管理方法中空间金字塔形式的图像进行分类示意图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。本专利技术目的是解决车辆二级维护管理系统中二级维护图片分类问题,主要对待处理的车辆二级维护图片进行鉴别与分类,确保所拍摄的图片的有效性,以提高车辆二级维护质量。本专利技术我们采用了基于LDA的图像分类技术,对二级维护过程中产生的图像进行分类。针对二级维护图片的特性,本专利技术对二级维护图片的主题构建了分类树,在分类树中划分了多个子类别,并认为同一个图像中可能存在多个主题,主题之间可能存在分类树的层级结构关系,由此本专利技术提出了基于主题特征空间的分类方法,结合SPM模型,采用多尺度分块的方法对图像块的主题特征进行统计与匹配。同时由于二级维护图片在颜色集合上具备较为独特特征表示,我们采用了颜色直方图的方法表达图像的颜色分布,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响。此外由于特征维度较大,如果采用线性计算的方式会非常耗时,为实现图像的快速分类,我们采用了局部敏感哈希(LSH,Locality-SensitiveHashing),实现特征的快速聚类,减少计算时间。在二级行业领域,目前,车辆维修是以强制维护、定期检测为前提和基础,以视情修理为手段,根据车辆实际状况确定修理作业深度的.这与以往的老制度的根本区别是加强二级维护前后的检测诊断,视情附加修理项目,保障车辆经常处于良好技术状况.因此,二级维护质量的提高是执行新保修制度的关键,而对二级维护过程中所产生的图片的分类与分析,是二级维护系统中重要设计内容,因此若仅仅只是对图片进行采集存储,并未充分利用二级维护系统的优势。而主题模型两种主要方法为LDA、pLSA,pLSA模型中参数P(z|d)与训练数据的图像数量呈线性相关,当图像数量增多时计算复杂度增大且容易发生过拟合现象。而LDA模型中的参数θ维数只与主题数有关,与图像数目无关。因此LDA相比于pLSA更适用于对大量图像数据建模,并且分类效果要稍好些。因此本专利技术采用了LDA模型。同时本专利技术考虑到图像主题具备层级特性,因此结合了SPM模型,对图像的主题特征进行空间金字塔匹配。此外对于目前基于LDA的图像分类方法,在特征提取阶段通常采用的单一的sift特征或sift特征结合其他特征如纹理特征等等,其所形成的特征并未考虑到二级维护图片的行业特性,及在图片颜色方面具备行业特性,因此本专利技术采用了sift特征与颜色直方图特征结合。此外在特征聚类方面,由于KMeans聚类对于大量、高维度的数据聚类时间较长,本专利技术采用了LSH技术进行特征映射变换,将原有的高维特征集划分为多个子集,以实现聚类。同时本专利技术中对二级维护图片构建了相关的分类树,采用多尺度的分块方式,获取图像块的主题特征进行空间金字塔匹配。在特征提取方面,针对二级维护图片中所常出现的颜色集,采用了颜色直方图特征与sift特征结合,构建特征集,充分考虑到二级维护图片所具备的领域行业特性。此外为减少计算时间,本专利技术中采用了LSH对特征向量进行聚类。本专利技术采用了基于LDA主题模型的图像分类技术,处理车辆二级维护系统中用户上传的图片,进行类别判断,筛选出不合格照片,确保整个二级维护过程的有效性。在自然语言处理领域,假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的,则我们可将文本表示为词汇的特征向量,这样的的一个模型称为BOW模型。在图像处理领域根据BOW(BagOfModel,词包)模型,图片可视为视觉词汇的集合,LDA模型则是结合BOW模型,获取图片的主题分布。由于二级维护系统中的图片具备领域特性,在图像分类领域来看,意味着二级维护系统中的图片所包含的特定的领域主题,如图片的主要内容包含:车辆、车牌等等内容,也就是图片内容中的主题。采用LDA主题模型可以识别大规模图片集中潜在的主题信息,同时结合BOW模型以及传统的图像分类模型如SPM模型可有效的实现二级维护系统中的图片分类处理。如图1,本专利技术一个具体实施例中,示出一种车辆二级维护管理方法整体流程示意图。总的来说,包括:步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。本专利技术另一个具体实施例,一种车辆二级维护管理方法,所述步骤1中基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本视觉单词的特征向量还包括:基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得所述样本所视觉单词的所属主题和主题分布情况,从而形成图像样本中各主题的特征向量。本专利技术另一个具体实施例,一种本文档来自技高网...
一种基于LDA文档主题生成模型的车辆二级维护管理方法

【技术保护点】
一种车辆二级维护管理方法,其特征在于,包括:步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。

【技术特征摘要】
1.一种车辆二级维护管理方法,其特征在于,包括:步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。2.如权利要求1所述的方法,其特征在于,所述步骤1中基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本视觉单词的特征向量还包括:基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得所述样本所视觉单词的所属主题和主题分布情况,从而形成图像样本中各主题的特征向量。3.如权利要求1所述的方法,其特征在于,所述步骤1中利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图还包括:步骤101,采用多尺度分块方法对所述待处理车辆二级维护图像进行分块,并对所有图像分块进行特征描述;步骤102,利用局部敏感哈希算法将所述得到的图像块特征表述信息进行聚类,从而得到视觉词典;步骤103,对所述图像块进行视觉词典映射,获得图像块的视觉单词统计直方图。4.如权利要求1所述的方法,其特征在于,所述步骤2还包括:利用SPM模型对所述待处理车辆二级维护图像进行分类。5.如权利要求1所述的方法,其特征在于,所述步骤2还包括:以空间金字塔形式对所述待处理车辆二级维护图像进行分类。6.如权利要求3所述的方法,其特征在于,所述步骤101中对所有图像分块进行特征描述...

【专利技术属性】
技术研发人员:熊向峰杨赛舟陆义平
申请(专利权)人:武汉长江通信智联技术有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1