gggggraziegrazie

graizegrazieさんのやったこと、学んだことを記録する雑記帳です

数学

locality sensitive hashing(LSH)

LSH[0][6]とは、ハッシュ関数を使ってデータを次元圧縮をしたり、データ同士の比較を高速で行えるようにするための手法である。使用するハッシュ関数の代表例は、下記の安定分布とハミング距離、Jaccard指数がある。ハミング距離を使って、データの比較する…

さまざまな距離

Computer visionなどの世界では、対象間の距離を測る方法がいくつもあります。その中で学んだものを下記に列挙していきます。 Bhattacharyya distance [1]によると、2つの確率分布が近いのか遠いのかを表現します。[2]の式を下記に記載します。 [2]より、多…

"図解・ベイズ統計「超」入門 あいまいなデータから未来を予測する技術"を読んで

従来の統計学とベイズ統計学の違い 乗法定理 ベイズの定理 例題1. 理由不十分の原則 ベイズ更新 例題2. 1回目のデートで良を得る確率 事前準備 確率分布 例題3. 従来の統計学とベイズ統計学の違い 従来の統計学 - データについての不確実性を確率で表現・推…

マハラノビス距離

統計学で用いられる、データ点が平均からどれだけ外れているかを判定するための手法。[2]によると、ユークリッド距離を標準偏差で割った値に該当する。例えば2次元のデータを評価する時、主成分分析と共に用いる。第一主成分をX軸、第二主成分をY軸とした時…

Probabilistic Robotics - Chap.3 Gaussian Filters

3.2 The Kalman Filter 3.2.2 The Kalman Filter Algorithm 3.3 The Extended Kalman Filter 3.3.1 Why Liearlization? 3.3.2 Linealization Via Taylor Expansion 3.4 The Unscented Kalman Filter(UKF) 3.4.2 The UKF Alogorithm 3.5 The Information Filt…

特異値分解(SVD)の概要

データの開先手法の1つとして、特異値分解(SVD:Singular Value Decomposition)という手法があります。SVDでは、不要なデータを取り除くことができるため、画像やテキストデータの圧縮や解析に使われます[1][2]。以降では数式を用いてSVDについて概要を説…