大規模データを使うことができればそりゃいいが、計算量が膨大になる。 また、たとえば1億のセットがあったとして、1000くらいのセットを無作為抽出して、high variance 問題か、high bias 問題か学習曲線をプロットしてみて確認する必要がある。 (J cv ...