← 画像処理に戻る

HOG特徴量

物体検出に使われる強力な特徴量を学びます

HOG (Histogram of Oriented Gradients) とは?

HOG特徴量は、画像の局所的な勾配方向のヒストグラムを特徴として使用する手法です。 2005年に提案され、歩行者検出などで高い性能を発揮しました。

画像をセルに分割し、各セル内の勾配方向を集計することで、物体の形状を表現します。

元画像
HOG特徴量の可視化

セルとブロックへの分割

HOGでは、画像を小さなセル(例:8×8ピクセル)に分割し、 さらに複数のセルをまとめたブロックを作ります。

Cell 1
Cell 2
Cell 3
Cell 4
Cell 5
Cell 6
Cell 7
Cell 8
Cell 9
Cell 10
Cell 11
Cell 12
Cell 13
Cell 14
Cell 15
Cell 16
  • セル:通常8×8ピクセル。勾配ヒストグラムを計算する単位
  • ブロック:通常2×2セル。正規化を行う単位
  • ストライド:ブロックを重ねながらスライドさせる

勾配方向のヒストグラム

各セル内で、すべてのピクセルの勾配を計算し、 その方向を9つのビン(0°〜180°を20°ずつ)に分類して集計します。

勾配方向と強度
方向ヒストグラム

方向ビンの例

0-20°, 20-40°, 40-60°, 60-80°, 80-100°, 100-120°, 120-140°, 140-160°, 160-180°

各ピクセルの勾配強度を、その方向に対応するビンに加算します。

HOG特徴量の計算手順

  1. 勾配の計算:画像の各ピクセルでX方向とY方向の勾配を計算
  2. 勾配強度と方向:勾配の大きさと方向を求める
  3. セル内ヒストグラム:各セル内で方向ヒストグラムを作成(9ビン)
  4. ブロック正規化:照明変化に対してロバストにするため、ブロック単位で正規化
  5. 特徴ベクトル:すべてのブロックのヒストグラムを連結して最終的な特徴ベクトルを作成
HOG可視化

各セルの主要な勾配方向を矢印で表示

まとめ

HOG特徴量は、物体の形状を効果的に表現する強力な手法です。

重要なポイント

  • 勾配ヒストグラム:局所的な勾配方向の分布を特徴量として使用
  • セル分割:画像を小領域に分けて局所特徴を抽出
  • 方向ビン:通常9ビン(0°〜180°)で勾配方向を量子化
  • 正規化:照明変化に対してロバストな特徴量
  • 応用:歩行者検出、顔検出、物体認識など多数
  • 発展:ディープラーニング登場前は標準的な手法だった

HOGの利点

  • 形状の特徴を効果的に捉える
  • 照明変化に強い
  • 局所的な幾何学的変化に対してロバスト
元画像
HOG特徴量