Surrogate Splits
決定木(CART)が欠損データを扱うための仕組み。本来の分岐変数が欠損していた場合に、同様の分岐パターンを示す「代替変数」を使って分岐する。欠損のある観測値を捨てることなく予測に利用でき、決定木の欠損耐性を高める重要な機能。
「決定木は「代わりに最も似た役割を果たせる別の変数」で代替分岐する。これを代理分割(surrogate splits)と呼ぶ」
「欠損があれば代替分割(surrogate split)を使うか欠損自体を1つのカテゴリとして扱える」