Feature Selection
予測に有効な変数のサブセットを自動的に選ぶ操作。p >> N の高次元問題では、全変数を使うより重要な変数だけを選んだ方が過学習を防げる。LASSOや最近傍縮小重心はゼロ化により暗黙的に特徴選択を行う。
「縮小後の重心がゼロになった遺伝子は分類に使われなくなる——自動的な特徴選択」
「2308個から43個への特徴選択で精度を保ちながらモデルをシンプルにする」