现在的位置:主页 > 期刊导读 >

基于改进YOLOv3-LITE轻量级神经网络的柑橘识别(5)

来源:果树资源学报 【在线投稿】 栏目:期刊导读 时间:2020-10-13

【作者】:网站采编
【关键词】:
【摘要】:以YOLOv3-LITE网络为基础网络,传统方法为不使用预训练模型,用训练集从头开始对所有参数进行训练,迁移学习的方法是使用COCO数据集的预训练模型对模型

以YOLOv3-LITE网络为基础网络,传统方法为不使用预训练模型,用训练集从头开始对所有参数进行训练,迁移学习的方法是使用COCO数据集的预训练模型对模型进行部分层参数的训练,该文提出使用混合训练与迁移学习结合的预训练模型进行模型的微调,3种方法检测的结果在测试集A+B(如表1所示)的对比结果如表3所示。相对于传统方法,使用迁移学习对模型提升效果明显,使用混合训练与迁移学习结合,模型的F1值上升3.79%,AP值上升2.75%,Average IoU值上升2.74%。

表3 不同训练方式检测结果的比较Table 3 Comparison of detection results using different training methods训练方式Training methodsF1 score/%平均精度Average precision/%IoUAverage IoU/% 传统方法Original 迁移学习方法Transfer learning 混合训练+迁移学习方法Mixup+Transfer learning

3.2 不同骨干网络检测结果对比

为了证明模型在YOLO网络框架下改进的优越性,该文通过对比不同的网络框架以及不同骨干网络进行对比,在测试集A+B(如表1所示)的检测结果如表4所示。其中,采用DarkNet-53为骨干网络的传统YOLOv3模型相对于YOLOv2模型由于网络模型更复杂,使得检测速度略低于YOLOv2,但模型F1值提升了5.45%,AP值提升了6.36%,识别准确率提升明显。从表4中可以看到YOLOv3-Thiny减少了模型的层数,检测速度与模型大小都取得了很好的提升,但检测精度下降明显。采用MobileNet-v1作为YOLOv3的骨干网络,其速度达到270帧/s,模型大小为23 MB,速度和模型占用内存取得了最优的结果,但检测精度较传统YOLOv3模型下降明显。而骨干网络采用MobileNet-v2的YOLOv3(即YOLOv3-LITE),其F1值与AP值在所有模型中取得了最优的效果,且相对于传统YOLOv3方法,模型AP值提升1.68%,F1值提升了0.84%,且模型权重所占内存减小208 MB,在GPU上的检测速度对视频检测的帧率高达246帧/S,在CPU上的检测速度可以达到22帧/s。由于在果园采摘机器人中绝大部分采用的是嵌入式终端或者移动设备,YOLOv3-LITE网络具有明显的优势。

表4 不同骨干网络检测结果对比Table 4 Comparison of detection results using different backbone networks网络模型Network models骨干网络Backbone networksF1 score/%平均精度Average precision /%权重大小Weight size检测速度Detection speed MB70 MB62 MB220 MB270 MB246

3.3 使用GIoU损失函数的检测结果

使用YOLOv3-LITE为基础网络,将GIoU回归损失函数替代传统YOLOv3的回归框损失函数,对模型进行训练,在测试集A+B(如表1所示)的检测结果对比如表5所示。采用GIoU替代模型的边框回归损失函数对模型的F1值提升了0.93%,AP值提升0.75%,而Average IoU值提升了4.11%,且相对于传统YOLOv3提升显著,可以看出将GIoU作为损失函数,对边框回归的准确率影响较大,这使得柑橘果实的定位更加精准,能为柑橘采摘机器人提供精度较高的定位信息。

表5 使用GIoU损失函数的检测结果Table 5 Detection results using GIoU loss function网络模型Network modelsF1 score/%平均精度Average precision/%IoUAverage IoU/% GIoU+

3.4 不同遮挡程度对比试验

由于叶片对样本的遮挡以及样本之间互相重叠,都会对模型的检测精度带来较大的影响。该文将遮挡程度作为控制变量,使用网络模型为改进的YOLOv3-LITE模型,分别取测试集A和B以及A+B(见表1)验证检测结果,见表6和图7。对轻度遮挡果实的识别,模型的F1值能达到95.27%,AP能达到92.75%,Average IoU高达88.65%。且在全部测试集中,F1值达到93.69%,AP值为91.13%,Average IoU为87.32%。由表6可知,在果实遮挡以及重叠的情况下,模型的识别精度会有所降低,一方面是因为卷积神经网络在对小目标以及目标密集的图像进行卷积计算时,在深层网络会丢失若干信息;另一个原因是考虑到实际应用场景,对单个柑橘遮挡面积超过70%,和距离较远、目标极小的柑橘未做数据标记,这对识别效果也会有一定的影响。但从图表数据可以看出,在严重遮挡、且目标密集的环境下,模型也能达到91.43%的F1值和89.10%的AP值。模型对测试集A+B检测的P-R曲线如图8所示。

表6 不同遮挡程度的检测结果对比Table6 Comparison of detection results in different obscured degrees测试集Test setF1 score/%平均精度Average precision/%IouAverage IoU/% A+

图7 不同遮挡程度的结果对比Fig.7 Comparison of results in different obscured degrees

3.5 不同检测方法对比试验

分别对Faster-RCNN、SSD和改进的YOLOv3-LITE网络进行训练,在不同测试集下对比试验。如表7和图9所示,在果实轻度遮挡的情况下,3个模型的F1值都达到91%以上,AP值在89%以上。改进的YOLOv3-LITE比SSD、Faster-RCNN在速度精度方面提升明显,且在重度遮挡的情况下,F1值也能达到90%以上,相对SSD与Faster-RCNN提升近3个百分点。在自然环境下,其F1值和AP值比SSD分别高出3.94%和3.49%,而比Faster-RCNN高出3.8%和3.26%。由图9可知,改进的YOLOv3-LITE网络会漏检遮挡大于70%的柑橘,这是由于遮挡大于70%的柑橘默认不做标记。其次,在较暗的背景下也会影响柑橘目标的检测精度。另外,从表中可以得出,SSD与Faster-RCNN在检测精度方面比较接近。

文章来源:《果树资源学报》 网址: http://www.gszyxb.cn/qikandaodu/2020/1013/483.html

上一篇:果树在动物园景观绿化中的应用
下一篇:果树在园林绿化建设中的应用探讨

果树资源学报投稿 | 果树资源学报编辑部| 果树资源学报版面费 | 果树资源学报论文发表 | 果树资源学报最新目录
Copyright © 2018 《果树资源学报》杂志社 版权所有
投稿电话: 投稿邮箱: