これまでに提案されている物体検出のアルゴリズムは、大きく分けて 2 種類存在する。1 つは、R-CNN 系に代表される、region propasal に基づくアルゴリズムである。R-CNN 系では、入力画像から物体の候補領域を推測し、次に、それらの候補領域を抽出して物体のクラス判別を行なっている。もう 1 つのアルゴリズムは、画像をグリッド状に分けたとき、各グリッドがどのクラスに属するのかを推定している。YOLO (you only look once) は、画像のグリッド化に基づく物体検出のアルゴリズムの 1 つである。



References
- You Only Look Once: Unified, Real-Time Object Detection. arXiv. 2015. arXiv: 1506.02640
- YOLO9000: Better, Faster, Stronger. arXiv. 2016. arXiv: 1612.08242
- YOLOv3: An Incremental Improvement. arXiv. 2018. arXiv: 1804.02767