複雑な曲線を、シンプルな「山」の重ね合わせで表現できるとしたら? 3つの山、5つの山、10の山——それだけで、どんな関数も近似できる。
この直感的なアイデアが放射基底関数(RBF)だ。 そして驚くことに、このアプローチを突き詰めると、6章の冒頭で学んだ カーネル平滑化と全く同じ式に行き着く。
異なる道を辿ったのに、同じ場所に到達する——これが数学の美しさだ。
このページで学ぶこと:
5章では、関数を「基底関数の線形結合」で表現するアイデアを学んだ:
多項式、スプライン、フーリエ基底——これらはすべてこの形式に収まる。 一方、6章では「カーネル平滑化」を学んだ。 目標点の近くにあるデータに重みをかけて局所的にフィットする方法だ。
ここで自然な問いが生まれる。「カーネル関数そのものを基底関数として使ったらどうなる?」
空間のさまざまな位置 ξj を中心として、そこに1つずつカーネル関数を配置する。 それぞれがその位置の「局所的な形」を担う。 これを組み合わせれば、複雑な関数を表現できる—— これが放射基底関数(Radial Basis Function, RBF)の発想だ。

数式で書けば:
「距離が同じなら同じ値」という性質から「放射(Radial)」と呼ばれる。 中心から等距離の点は、どの方向にあっても同じ重みを持つ。
この式の形、どこかで見たことがあると感じたなら正解だ。 Section 5でその正体を明かそう。
RBFモデルには、3種類のパラメータがある:
理想を言えば、この3つをすべてデータから最適化したい。 しかし、ここに落とし穴がある。 Gaussianカーネルを使った場合の最小化問題は:
この最適化問題は非凸だ。 「非凸」とは、山と谷が複数ある地形のこと——複数の局所最小値が存在し、 どの「こぶ」の初期位置から始めるかによって、最終的な解が全く変わってしまう。

この難しさは、正則化を使っても解決しない。 そもそも問題の構造が複雑なのだ。 これはシグモイド関数を使うニューラルネットワークの訓練と全く同じ難しさだ。
実用的な解決策として、中心とスケールの推定と係数の推定を分離するアプローチが使われる。
直感的に言えば:
「どこに山を置くか(中心)さえ決まれば、各山の高さ(係数)を求めるのは普通の線形回帰になる」—— これが分離戦略の本質だ。
全パラメータを同時最適化するのは難しい。 代わりに、中心とスケールをデータの分布から決め、係数だけを線形回帰で求める方法がある。 この2段階アプローチを見てみよう。
ステップ1:データの分布から中心を見つける
データ X の周辺分布をGaussian混合モデル(GMM)でモデル化する。 GMMはデータを「いくつかのクラスターの重ね合わせ」として捉え、各クラスターの中心と広がりを推定する:
ここで得られた混合成分の平均 μj を中心 ξj、 分散 σj² からスケール λj を設定する。

ステップ2:中心を固定して係数を線形回帰で求める
中心 ξj とスケール λj を固定した後、係数 βj は単純な最小二乗問題になる:
行列 H の各要素 Hij は、「i番目のデータ点が j番目の中心からどれだけ近いか」を表す。 この行列さえ作れば、あとは通常の線形回帰と同じだ。
なぜこれがうまくいくのか?
カーネル中心はデータが多い場所、つまり予測が重要な場所に自然に配置される。 データが少ない場所には中心が置かれないため、「無駄な」基底関数が生まれない。 データの構造そのものが、どこにRBFを配置すべきかを教えてくれる。
固定幅(すべての λj = λ)のRBFには厄介な問題がある。 カーネル中心がまばらな領域では、どの基底関数も大きな値を持たず 「穴」ができてしまう。
具体的に言うと:データが密集している領域ではカーネルが重なり合い滑らかな予測ができるが、 データがまばらな領域では全てのカーネルが小さな値を返し、予測が不安定になる。 高次元では特に深刻だ。

解決策は正規化だ:
この正規化RBF基底は、 どの点でも全基底関数の合計が1になることを保証する:
これにより:
正規化のアイデアはシンプルだ:「どこにいても、何かが大きな値を持つようにする」。 分母を全カーネルの合計にすることで、どの地点でも相対的な重みが意味を持つようになる。
正規化RBF基底を使ったモデルを、特別な設定で見てみよう。 各学習データ点 xi に一つずつ基底関数を配置—— つまり「全データ点を中心として使う」場合だ。
すると予測式は:
これは……どこかで見た形だ。 第6章冒頭で学んだカーネル平滑化のNadaraya-Watson推定量そのものだ!

つまり:
この2つは実は同じ手法の異なる見方だった。 同じものを異なる角度から見ている——数学の美しさがここにある。
この統一的な視点から、カーネル法(第12章のSVMを含む)と 局所的学習手法の深い関係が見えてくる。 SVMのカーネルトリックも、本質的にはRBFと同じ「距離に基づく重み」のアイデアを共有している。
6.7節で学んだことを振り返ろう。 RBFは一見シンプルなアイデアだが、その背後には深い統一性がある。

| 手法 | 基底 | 最適化 |
|---|---|---|
| カーネル平滑化 | なし(局所重み付け) | なし(直接計算) |
| RBF回帰 | カーネル関数 | 非凸(全パラメータ)→分離戦略 |
| 正規化RBF | 正規化カーネル | 線形(係数のみ) |
| Nadaraya-Watson | 各データ点に一つ | なし(直接計算) |
全てが「距離に基づく重み」というコアアイデアを共有している。
RBFが重要な理由は技術的な性能だけでなく、概念的な橋渡けにある:
数学の美しさは、異なる角度から同じ真実が見えることにある。 RBFはその典型例だ——基底展開、カーネル平滑化、そしてサポートベクターマシン。 異なる名前を持つこれらの手法が、実は「距離に基づく重み」という一つのアイデアを共有している。