High-Dimensional Problem
変数の数p がサンプル数N よりはるかに大きい(p >> N)状況での統計・機械学習の課題。ゲノム解析などで典型的に現れる。過学習のリスクが極端に高まり、従来の手法(LDAなど)が不安定になる。スパース性の仮定と正則化が対処の鍵となる。
「p >> N の高次元問題では従来の機械学習の常識が通用しなくなる」
「p=2308、N=63という高次元問題への対処法として対角LDAを導入」
「p=16063、N=144という高次元問題で正則化判別分析を適用する」