Bootstrap
手持ちのデータから置換ありでリサンプリングを繰り返し、モデルのばらつきを推定する手法。新しいデータを集めることなく、統計量の分布や信頼区間を推定できる。ノンパラメトリック(データを直接リサンプル)とパラメトリック(推定モデルから生成)の2種類がある。非情報事前分布のもとでのBayes事後分布と漸近的に一致するという深い数理的基盤を持つ。Baggingではこのブートストラップを使って多様な学習器を生成する。
「手持ちのデータから復元抽出によって仮想の新しいデータセットを作り出すブートストラップ」
「ブートストラップ法——データを引き直すフリで誤差を測る」
「予測の不確かさを測るブートストラップ」
「ブートストラップ信頼区間の計算」
「ブートストラップと最大尤度の深い関係」
「データを引き直して推定値のばらつきを直接観察するBootstrap法」
「Bootstrapの手順とBootstrap分布の意味」
「ブートストラップで「元のデータからありえた別の世界線のデータ」を擬似的にたくさん作る」
「Bumpingではブートストラップサンプルで複数のモデルを作る」
「各点は約37%の確率でブートストラップサンプルに含まれない」
「復元抽出でブートストラップサンプルを作りバギングに使う」