前節まではサンプルが特徴空間で線形分離可能と仮定したが,必ずしも そうでない場合のことを考える必要がある. 十分大きな次元の特徴空間 に対応するカーネルを使えば無理矢理線形分離可能な分離超平面を学習する ことはできるが,ノイズがあるような状況下では明らかに サンプルにオーバーフィットしたものとなってしまう.