さまざまな距離 - gggggraziegrazie

Computer visionなどの世界では、対象間の距離を測る方法がいくつもあります。その中で学んだものを下記に列挙していきます。

Bhattacharyya distance

[1]によると、2つの確率分布が近いのか遠いのかを表現します。[2]の式を下記に記載します。
f:id:graziegrazie:20190315060020p:plain

[2]より、多変量正規分布にBhattacharyya distanceを当てはめると、下記の様に２つの確率分布の共分散行列 ${\Sigma}$ が同じであれば、マハラビノス距離に近い式になります。
f:id:graziegrazie:20190315060719p:plain

Bhattacharyya distanceを視覚的に理解しようとすれば、[3]にあるように確率分布の共通分布 ${p \cap q}$ であると考えられます。

Mahalanobis Distance

[4]にあるように、多次元のデータの類似度（距離）を測る指標です。注目データが、データ中の外れ値に当たるかどうかを判断するのに使われます。

距離と言えば、ユークリッド距離が最も有名と思います。各項の差分をとり、その二乗和かの平方根をとったものがそうです。ただ距離を取る対象によっては、ある軸方向は特定の値周辺に固まっている（分散が小さい）が、ある軸方向では広く散らばっている（分散が大きい）場合があります。そこでMahalanobis Distanceでは、各軸の分散を考慮しながら距離を計算します。意味合いとしては、正規化に近いと言えるのではないでしょうか。そのため、一見散らばったように見えるデータからも、その中で特に分散が大きいものだけ外れ値として検出することが出来ます。詳細は[4][5]が詳しいです。