本发明专利技术属于动物图像识别领域,具体涉及一种红外相机动物图像识别训练集最佳组合的构建方法,包括以下步骤:S1、建立红外相机动物图像库;S2、物种辨别与整理;S3、提取关键特征;S4、构建各个组合训练集;S5、模型训练:S6、模型测试与分析;S7、判定最佳组合。本发明专利技术创造性地以构建训练集最佳组合,提高训练集质量来精准提升单一物种的识别率,可为红外相机图像识别训练集优化提供一项重要手段。训练集优化提供一项重要手段。训练集优化提供一项重要手段。
【技术实现步骤摘要】
一种红外相机动物图像识别训练集最佳组合的构建方法
[0001]本专利技术属于动物图像识别领域,具体涉及一种红外相机动物图像识别训练集最佳组合的构建方法。
技术介绍
[0002]随着人工智能、机器学习先进技术的发展,以深度学习为代表的监督机器学习技术在图像识别、语音识别领域进行广泛研究与应用。其中,图像识别应用在人脸识别、车牌识别、动物识别领域,图像识别准确率影响着各类识别产品的应用效果,提升图像识别率的方法成为重点,其主要实现手段在于构建训练集进行模型训练得到高准确率的识别模型。由于模型算法逐步优化且成型,导致训练集质量成为识别率提升的重要因子。
[0003]红外相机是野生动物监测的重要监测设备,代替人在野外进行24小时不间断的动物监测工作,并获得触发拍摄后的各类图像如环境图、动物图。由于红外相机监的不间断性,积累了大量的影像数据。其中,红外相机动物图像可作为红外相机动物图像识别训练集,将训练集进行模型训练,可获得红外相机动物图像识别模型。因红外相机动物图像产生于野外环境,随着拍摄环境、动物物种差异及动物位置变化形成复杂的数据集,当直接将海量数据全部用于训练发现随着训练集量的增加,识别率增幅减弱,且可能出现识别出错的情况,成为动物图像识别率提升的瓶颈。
[0004]目前,提升识别率的方法聚焦在模型算法优化上如CN201811091554一种基于改进的卷积神经网络的鸟类识别方法以及CN201910327366基于多预置点的深度鸟类识别算法,尚未提出训练集的优化方法,为了突破训练集质量低而导致识别效果差的瓶颈,训练集质量提升方法成为迫切需求。
技术实现思路
[0005]为了解决训练集质量低而导致识别效果差的问题,本专利技术提供一种动物图像训练集内部组合优化方法,用于提升训练集质量来精准提高不同物种的识别率。
[0006]为实现上述目的,本专利技术采用的技术方案是提供一种红外相机动物图像识别训练集最佳组合的构建方法,包括以下步骤:
[0007]S1、建立红外相机动物图像库,红外相机动物图像库包括:家养动物图像库、野生动物图像库;
[0008]S2、物种辨别与整理:将步骤S1划分的家养动物图像库和野生动物图像库进一步区分,形成单独的物种数据集;
[0009]S3、提取关键特征:对步骤S2中物种数据集内的单一物种进行关键特征提取;
[0010]S4、构建各个组合训练集:根据各个物种关键特征、红外照片类型因素,调整训练集内照片的比例,搭配形成多种组合类型的数据集,并对数据集进行优化;
[0011]S5、模型训练:根据图像目标检测算法构建识别模型框架,将各个组合训练集分别导入进行训练;
[0012]S6、模型测试与分析:对训练完成的各个模型进行准确性测试;
[0013]S7、判定最佳组合:根据测试结果,选出最佳数据集。
[0014]进一步地,步骤S1中的红外相机动物图像库包括:步骤S1中的红外相机动物图像库包括:家养动物图像库、野生动物图像库,其中,家养动物图像库包括通过红外相机获取的白天和夜间环境下,家养动物的睡姿、卧姿、进食姿态、行走/飞行姿态、停驻姿态、鸣叫/吼叫姿态图像数据,野生动物图像库包括通过红外相机获取的的白天和夜间环境下,野生动物的睡姿、卧姿、进食姿态、行走/飞行姿态、停驻姿态、鸣叫/吼叫姿态图像数据,便于后续在加入新物种图片时进行种类划分,便于后续在加入新物种图片时进行种类划分。
[0015]进一步地,步骤S3中对步骤S2中物种数据集内的单一物种进行关键特征提取,提取的关键特征包括雌雄异形、活动节律,根据照片提取特征利于后续通过不同模型的训练。
[0016]进一步地,步骤S4中,根据各个物种关键特征、红外照片类型因素,调整训练集内可见光和红外照片、动物整体与局部照片、动物雌性与雄性照片的比例,搭配形成多种组合类型的数据集,多种类的图片利于模型培训,提高模型的识别率,不同类型的图片利于丰富数据集,提升不同条件下的模型识别率。
[0017]进一步地,步骤S4中,对数据集进行人工或自动化标注获得标签文件,进行Mosaic数据增强处理优化数据集,使其格式进行转换,形成多种训练集,标注的数据集用于模型对准确物种像素特征的判定。
[0018]进一步地,步骤S5中,对训练服务器进行环境搭建与配置,构建目标检测模型网络框架,以各个组合类型的训练集单独进行模型训练,得到多种模型,构建目标检测模型网络框架包括YOLO、R
‑
CNN、SSD等,优选框架为YOLO或复合型框架。
[0019]进一步地,步骤S6中,用同一组的训练集外动物图像数据对步骤S5得出的多种模型进行模型测试,获取各个模型识别结果,分析对比各模型的识别成功率及准确率,模型识别结果包括物种名、置信度、预测框位置。
[0020]进一步地,步骤S7获取步骤S6分析所得识别成功率和准确率均最佳的训练集组合类型,并将其作为该物种训练数据的最佳组合方式,便于后续新模型的训练数据补充,提升训练集数据优化效率。
[0021]本专利技术可为红外相机动物图像识别训练集优化提供一种手段,并适用于红外相机监测到的各类动物如鸟类、兽类训练集优化,以提升训练集的质量的方式来精准提升单一物种的识别率。
[0022]与现有技术相比,本专利技术至少有如下优点:
[0023]1)本专利技术具有前瞻性,尝试突破了训练集质量低而导致识别效果差的瓶颈;
[0024]2)本专利技术区分不同物种差异,提取关键特征进行组合,并进行严格测试,可得到更科学的训练集组合方式;
[0025]3)本专利技术应用在红外相机图像识别领域,可降低无效图像处理的工作量,能够指导后续获取更多最佳组合相关的有效数据,构建更高质量的训练集来训练模型,逐步精准提升单一物种的识别率。
附图说明
[0026]图1是本专利技术的一种红外相机动物图像识别训练集最佳组合的构建方法的流程
图;
[0027]图2是本专利技术红外相机动物图像库的结构图;
[0028]图3是白鹇训练集组合测试结果图;
[0029]图4是果子狸训练集组合测试结果图。
具体实施方式
[0030]为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作进一步地详细描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。
[0031]在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
[0032]实施例1
[0033]如图1所示的一种红外相机动物图像识别训练集最佳组合的构建方法的流程图,其包括以下步骤:
[0034]S1、建立红外相机动本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种红外相机动物图像识别训练集最佳组合的构建方法,其特征在于,包括:S1、建立红外相机动物图像库,所述红外相机动物图像库包括:家养动物图像库、野生动物图像库;S2、物种辨别与整理:将步骤S1划分的家养动物图像库和野生动物图像库进一步区分,形成单独的物种数据集;S3、提取关键特征:对步骤S2中物种数据集内的单一物种进行关键特征提取;S4、构建各个组合训练集:根据各个物种关键特征、红外照片类型因素,调整训练集内照片的比例,搭配形成多种组合类型的数据集,并对数据集进行优化;S5、模型训练:根据图像目标检测算法构建识别模型框架,将各个组合训练集分别导入进行训练;S6、模型测试与分析:对训练完成的各个模型进行准确性测试;S7、判定最佳组合:根据测试结果,选出最佳数据集。2.如权利要求1所述的一种红外相机动物图像识别训练集最佳组合的构建方法,其特征在于,所述步骤S1中所述家养动物图像库包括通过红外相机获取的白天和夜间环境下,家养动物的睡姿、卧姿、进食姿态、行走/飞行姿态、停驻姿态、鸣叫/吼叫姿态图像数据,所述野生动物图像库包括通过红外相机获取的的白天和夜间环境下,野生动物的睡姿、卧姿、进食姿态、行走/飞行姿态、停驻姿态、鸣叫/吼叫姿态图像数据。3.根据权利要求2所述的一种红外相机动物图像识别训练集最佳组合的构建方法,其特征在于,所述步骤S3提取的关键特征包括雌雄异形、活动节律。4.根据权利要求3所述的一种红外相机动物图像识别训练集最佳组合...
【专利技术属性】
技术研发人员:罗名步,杨帆,胡慧建,庄凯金,肖洪浪,赵顺,方钟涛,
申请(专利权)人:广州林猫自然科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。