2017-04-30 マハラノビス距離 数学 統計 統計学で用いられる、データ点が平均からどれだけ外れているかを判定するための手法。[2]によると、ユークリッド距離を標準偏差で割った値に該当する。例えば2次元のデータを評価する時、主成分分析と共に用いる。第一主成分をX軸、第二主成分をY軸とした時、マハラノビス距離は主成分上での距離を指す。マハラノビス距離の算出式は、である。つまり分散が大きいと距離が小さくなり、分散が小さくなると距離が大きくなる。これにより、外れ値の判定に用いられたりする。参考までに、下記にマハラノビス距離を用いて乱数データの異常値検知をするサンプルコードを作成しました。 参考文献 [1]教師なし学習による異常値検知: マハラノビス距離 (理論編) - Qiita [2]判別分析(マハラノビス) [3]マハラノビス距離とは - Minitab [4]Mahalanobis distance - Wikipedia