gggggraziegrazie

graizegrazieさんのやったこと、学んだことを記録する雑記帳です

Machine Learning

TransformerはGoogleが[3]で発表したRNNの一種で、Encoder-Decoderをベースにしています。Encoder-Decoderは、テキスト翻訳のために考えられたモデルであり、入力(翻訳元、ソースと呼ばれる)テキストと出力(翻訳先、ターゲットと呼ばれる)テキストのペア…

Brute-force

Weblioで意味を調べると、腕力という意味だそうです。これをデータの関連付けに当てはめると、総当たりで調べる、という意味になるそうです。へぇー。ejje.weblio.jp ja.wikipedia.org

locality sensitive hashing(LSH)

LSH[0][6]とは、ハッシュ関数を使ってデータを次元圧縮をしたり、データ同士の比較を高速で行えるようにするための手法である。使用するハッシュ関数の代表例は、下記の安定分布とハミング距離、Jaccard指数がある。ハミング距離を使って、データの比較する…

さまざまな距離

Computer visionなどの世界では、対象間の距離を測る方法がいくつもあります。その中で学んだものを下記に列挙していきます。 Bhattacharyya distance [1]によると、2つの確率分布が近いのか遠いのかを表現します。[2]の式を下記に記載します。 [2]より、多…

マルコフブランケット(Markov Blanket)

下記のP.30がわかりやすい。 グラフィカルモデル入門 from Kawamoto_Kazuhiko www.slideshare.netグラフィカルモデルでシステムをモデル化した時、注目変数について確率を求めたい時、考慮すべきはその変数と繋がっているノード(関係する変数)のみでよい、…

決定木(Decision Tree)

決定木とは、複数のルールを使って組み合わせることで、データを複数のサブセットに分割する手法のことです。分割したサブセットの内容により、分類木や回帰木と呼ばれます。分類木の分割対象はクラスであり、回帰木の対象は出力値です。つまり決定木の作成…