假设检验
- 如何评估假设函数
- 训练集与测试集
- 测试机误差计算
评估假设函数
假设函数误差很小时,可能已经过拟合了。
那么,你该如何判断一个假设函数是过拟合的呢?对于这个简单的例子,我们可以对假设函数 h(x) 进行画图,然后观察图形趋势,但对于特征变量不止一个的这种一般情况,还有像有很多特征变量的问题,想要通过画出假设函数来进行观察,会变得很难甚至是不可能实现的。
因此,我们需要另一种方法来评估我们的假设函数过拟合检验。
训练集与测试集
为了检验算法是否过拟合,我们将数据分成训练集和测试集,通常用70%的数据作为训练集,用剩下30%的数据作为测试集。
很重要的一点是训练集和测试集均要含有各种类型的数据,通常我们要对数据进行“洗牌”,然后再分成训练集和测试集。
测试集误差计算
在通过训练集让我们的模型学习得出其参数后,对测试集运用该模型,我们有两种方式计算误差:
- 对于线性回归模型,我们利用测试数据集计算代价函数J ;
- 对于逻辑回归模型,我们可以利用测试数据集来计算代价函数:
也可以计算误分类的比率,对于每一个测试集实例,计算:
然后对计算结果求平均。