Impurity
ノード内のデータのクラスがどれだけ混在しているかを表す指標。純粋なノード(全データが同一クラス)は不純度0、クラスが均等に混在するほど不純度が高い。誤分類率・Gini指標・交差エントロピーの3種類が代表的。
「ノード m における予測誤差(不純度)」
「分類木では不純度という考え方で分割の良さを測る」