Cross-Validation
データを分割し、一部で訓練、残りで評価を繰り返すことで、モデルの汎化性能を推定する手法。K-Fold CVでは全データをK個に分け、各foldを一度テスト役として使う。ラベル情報を使う処理はすべてCVの内側に閉じ込めることが重要。
「交差検証で最適なαを選ぶ」
「両方を試して交差検証で比較」
「データをfoldに分けてCVでλを選ぶ」
「AIC/Cpの限界を超えるための交差検証」
「K-Fold CVでテスト役を順番に交代させる」
「クロスバリデーションが「データを分けて」誤差を測るのに対し、ブートストラップは「データを増やすフリをして」誤差の分布を覗き込む」
「ブートストラップとクロスバリデーションの居場所の比較」
「クロスバリデーションで最適なサイズを選びます」
「クロスバリデーションで最適サイズを選択」
「閾値ΔをクロスバリデーションでNSCの変数選択に使用」
「正しいCVでは変数選択をCV内部で行い情報漏洩を防ぐ」
「スタッキングで各モデルの公正な評価値を得るために交差検証を使用」
「10-fold CVとLOOCVが条件付き誤差か期待誤差かのどちらを推定しているかを検証」
「CVは個別の訓練セットの誤差ではなく期待誤差を当てる道具」
「交差検証で最良モデルを選ぶ従来アプローチへの問い」
「Leave-One-Out CVで公正な重みを推定するStacking」
「Leave-one-out交差検証でバンド幅を選ぶとO(N²)の計算コストがかかる」