gggggraziegrazie

graizegrazieさんのやったこと、学んだことを記録する雑記帳です

決定木(Decision Tree)

決定木とは、複数のルールを使って組み合わせることで、データを複数のサブセットに分割する手法のことです。分割したサブセットの内容により、分類木や回帰木と呼ばれます。分類木の分割対象はクラスであり、回帰木の対象は出力値です。つまり決定木の作成後に新しいデータを得ると、分類木を使えばそのデータが所属するクラスを、回帰木を使えば対応する出力値を求めることができます。下記の図が理解の参考になるかと思います。

f:id:graziegrazie:20181223185808p:plain
Fig. 分類木と回帰木の例
左:分類木の例(暑いと感じる温度・湿度のペアを入力した際に、暑い・暑くないといくクラスを出力する木)、右:回帰木の例(温度・湿度を入力した際に、何Lの水を飲むかを出力する木)(出典[1])

f:id:graziegrazie:20181223212445p:plain
Fig. 決定木の入出力例と回帰木の出力例[4]

なお決定木はアルゴリズムの名前ではなく、モデルの名前です。モデルの構造が木構造のため、その名がついています。