Weight Decay
ニューラルネットワークの正則化手法。損失関数に重みの二乗和のペナルティ項を追加することで、重みが大きくなるのを抑制する。Ridge回帰と同じ発想。λを大きくするほど重みが0に近づき、シンプルなモデルになる。過学習を防ぐための代表的な手法。
「重み減衰(Weight Decay)による正則化」
「過適合を防ぐためにL₂ペナルティで重みの大きくなりすぎを抑制する」