过拟合

过拟合是指模型对训练数据符合的非常好,但是对于测试数据符合的很差。

原因:

  1. 训练数据量不足,或者筛选方法不科学,训练数据无法代表整体,导致模型学习到的参数不适用于测试数据。
  2. 模型阶数过高(复杂度过高),对可见数据进行了非常完美的拟合,包括噪声。

解决方法:

  1. 增加训练数据或者更科学的帅选训练数据
  2. 正则化,参考 正则化