现在的位置:主页 > 期刊导读 >

基于改进YOLOv3-LITE轻量级神经网络的柑橘识别(8)

来源:果树资源学报 【在线投稿】 栏目:期刊导读 时间:2020-10-13

【作者】:网站采编
【关键词】:
【摘要】:表1 数据集及其数量Table 1 Data sets and size数据集Dataset训练集Training set验证集Validation set测试集Test set总数量Total number AB 图片个数Number of images51 130 轻度遮挡样

表1 数据集及其数量Table 1 Data sets and size数据集Dataset训练集Training set验证集Validation set测试集Test set总数量Total number AB 图片个数Number of images51 130 轻度遮挡样本个数Number of lightly obscured samples2 3 252 重度遮挡样本个数Number of severely obscured samples4 5617 145

2 改进的YOLOv3-LITE柑橘识别网络

2.1 YOLOv3网络模型

YOLO网络模型是一种one-stage的方法,YOLO将输入图像分成S×S个格子,如果一个物体的中心落在某个网格内,则对应的网格负责检测该物体。其中,YOLOv1将输入图像的尺寸改为448×448,然后送入CNN网络训练,采用非极大抑制算法进行预测,YOLOv1对小目标检测效果不好,定位也不够精确。Redmon等[29]提出的YOLOv2吸收了Faster R-CNN中RPN的思想,去掉YOLOv1中的全连接层,加入Anchor Boxes,提高了召回率,且提出k-means聚类计算Anchor Boxes,Average IoU也提升了,但对小目标检测效果一般。YOLOv3在YOLOv2的基础上进行了一些改进,加深了网络,提出了多标签分类预测,使用逻辑回归(logistic regression)对方框置信度进行回归,同时提出了跨尺度预测,使用类似FPN(feature pyramid networks)的融合做法,在多个尺度的特征图上进行位置和类别预测,对小目标的检测效果提升明显。在类别预测中,YOLOv3不使用Softmax函数对每个框分类,而是对每个类别独立地使用逻辑回归,在训练过程中,使用二元交叉熵损失(binary cross-entropy loss)来进行类别预测,可以更好地处理多标签任务。YOLOv3目标检测网络损失函数如式(1)所示。

(1)

式中i表示第i个方格,j表示该方格预测出的第j个方框;obj表示含有目标,noobj即没有目标,Ci为预测目标的类别,为真实目标的类别,λcoord、λnoobj是惩罚系数。损失函数包括5个部分,第1项包含预测和实际的x、y坐标,该部分是计算预测的中心坐标的损失;第2项包含预测和实际的宽和高,即w、h,该部分是计算预测边界框的宽高的损失;第3项是方框置信度损失,回归目标是预测方框与实际方框的IoU值;前3项都只在预测方框和实际方框有对应关系时才计算损失;第4项是没有对应物体的方框置信度损失,3、4项是计算预测的置信度损失,第5项是分类损失,当方格中有物体时,才计算分类损失。

2.2 改进的YOLOv3-LITE轻量级神经网络模型设计

2.2.1 基于GIoU的边框回归损失函数

IoU为预测框与原来图片中标记框的重合程度,目标检测领域常使用边框回归IoU值作为评价指标。但是,大部分检测框架没有结合该值优化损失函数,IoU可以被反向传播,它可以直接作为目标函数去优化。考虑到优化度量本身与使用替代的损失函数之间的选择,最佳选择是优化度量本身。作为损失函数,传统IoU有两个缺点:如果2个对象不重叠,IoU值将为零,则其梯度将为零,无法优化;2个物体在多个不同方向上重叠,且交叉点水平相同,其IoU将完全相等,IoU无法精确的反映两者的重合度大小,如图1所示,3个不同的方法重叠两个矩形具有完全相同的IoU值,但他们的重合度是不一样的,最左边的图回归的效果最好,最右边的回归效果最差,其中最右边的图预测边框为旋转候选边框[34]。因此,IoU函数的值并不能反映两个对象之间如何发生重叠。在柑橘采摘机器人的果实识别中,回归框位置的精确度直接决定了机器手采摘的成功率。因此,该文提出通过引入GIoU来解决IoU的缺点。IoU取值[0,1],而GIoU有对称区间,取值范围[-1,1],在两者重合的时候取最大值1,在两者无交集且无限远的时候取最小值-1。因此,GIoU是一个非常好的距离度量指标,与IoU只关注重叠区域不同,GIoU不仅关注重叠区域,还关注其他的非重合区域,能更好的反映两者的重合度,GIoU Loss可以替换掉大多数目标检测算法中边框回归的损失函数,如式(2)-(5)所示。

注:黑色矩形代表预测的边界框,灰色矩形代表原始标记的边界框。Note: The black rectangle represents the predicted bounding box; the gray rectangle represents the original marker's bounding box.图1 两个矩形重叠示意Fig.1 Diagram of two overlapping rectangles

(2)

(3)

文章来源:《果树资源学报》 网址: http://www.gszyxb.cn/qikandaodu/2020/1013/483.html

上一篇:果树在动物园景观绿化中的应用
下一篇:果树在园林绿化建设中的应用探讨

果树资源学报投稿 | 果树资源学报编辑部| 果树资源学报版面费 | 果树资源学报论文发表 | 果树资源学报最新目录
Copyright © 2018 《果树资源学报》杂志社 版权所有
投稿电话: 投稿邮箱: