[youtube]VOC3huqHrss[/youtube]
YOLO是基于深度学习方法的端到端实时目标检测系统。YOLO的升级版有两种:YOLOv2和YOLO9000。作者采用了一系列的方法优化了YOLO的模型结构,产生了YOLOv2,在快速的同时准确率达到state of the art。然后作者采用wordtree的方法,综合ImageNet数据集和COCO数据集训练YOLO9000,使之可以实时识别超过9000种物品。本文有以下几点非常值得参考:
一,对模型的一系列分析和改进非常值得参考;
二,采用多尺度训练方法,使模型可以适应不同的输入尺寸,非常值得参考。
三,综合不同数据集的方法非常值得参考;
四,联合训练方法也是非常值得参考;
五,YOLO端到端实时检测和识别的思路非常值得参考。
总体说,这篇论文很值得参考。
YOLOv2 简介
YOLO9000是可以检测超过9000种类别的实时检测系统。首先,作者在YOLO基础上进行了一系列的改进,产生了YOLOv2。YOLOv2在PASCAL VOC和COCO数据集上获得了目前最好的结果(state of the art)。然后,采用多尺度训练方法,YOLOv2可以根据速度和精确度需求调整输入尺寸。67FPS时,YOLOv2在VOC2007数据集上可以达到76.8mAP;40FPS,可以达到78.6mAP,比目前最好的Faster R-CNN和SSD精确度更高,检测速度更快。最后提出了目标检测和分类的共训练方法。采用该方法,作者分别在COCO目标检测数据集和ImageNet分类数据集上训练了YOLO9000。联合训练使YOLO9000可以预测没有labelled的目标检测数据。YOLO9000在ImageNet验证集(200类)上获得了19.7mAP。其中,156类没有出现在COCO训练集中,YOLO9000获得了16.0mAP。YOLO9000可以实时识别超过9000类别。
论文
论文地址:https://arxiv.org/abs/1612.08242
PyTorch 实现
Github 地址:YOLOv2 in Pytorch
本站微信群、QQ群(三群号 726282629):