HOG (Histogram of Oriented Gradients) とは?
HOG特徴量は、画像の局所的な勾配方向のヒストグラムを特徴として使用する手法です。
2005年に提案され、歩行者検出などで高い性能を発揮しました。
画像をセルに分割し、各セル内の勾配方向を集計することで、物体の形状を表現します。
セルとブロックへの分割
HOGでは、画像を小さなセル(例:8×8ピクセル)に分割し、
さらに複数のセルをまとめたブロックを作ります。
Cell 1
Cell 2
Cell 3
Cell 4
Cell 5
Cell 6
Cell 7
Cell 8
Cell 9
Cell 10
Cell 11
Cell 12
Cell 13
Cell 14
Cell 15
Cell 16
- セル:通常8×8ピクセル。勾配ヒストグラムを計算する単位
- ブロック:通常2×2セル。正規化を行う単位
- ストライド:ブロックを重ねながらスライドさせる
勾配方向のヒストグラム
各セル内で、すべてのピクセルの勾配を計算し、
その方向を9つのビン(0°〜180°を20°ずつ)に分類して集計します。
方向ビンの例
0-20°, 20-40°, 40-60°, 60-80°, 80-100°, 100-120°, 120-140°, 140-160°, 160-180°
各ピクセルの勾配強度を、その方向に対応するビンに加算します。
まとめ
HOG特徴量は、物体の形状を効果的に表現する強力な手法です。
重要なポイント
- 勾配ヒストグラム:局所的な勾配方向の分布を特徴量として使用
- セル分割:画像を小領域に分けて局所特徴を抽出
- 方向ビン:通常9ビン(0°〜180°)で勾配方向を量子化
- 正規化:照明変化に対してロバストな特徴量
- 応用:歩行者検出、顔検出、物体認識など多数
- 発展:ディープラーニング登場前は標準的な手法だった
HOGの利点
- 形状の特徴を効果的に捉える
- 照明変化に強い
- 局所的な幾何学的変化に対してロバスト