02-4 理解代价函数

理解代价函数 II

代价函数的直观理解 II -等高线

本节强烈建议观看视频理解，以下仅列出关键步骤。

本节中，我们将结合等高线图，更深入地学习代价函数的作用。

照例先给出单线性回归模型： hypothesis(假设):
$h_{0}(x) = \theta_{0} + \theta_{1}x$

parameters（参数）:
$\theta_{0}$ , $\theta_{1}$

Cost Function(代价函数）:
$J(\theta_{0}, \theta_{1}) = \frac{1}{2m}\sum_{i=1}^m(h_{0}(x^{(i)})-y^{(i)})^{2}$

Goal:
$minimize_{\theta_{0},\theta_{1}}J(\theta_{0}, \theta_{1})$

在上一节中，我们假设 $\theta_0=0$ ，仅考虑了 $\theta_1$ , 得到的图像是一个弓形曲线：

如果我们考虑 $[\theta_0, \theta_1]$ 两个参数，得到的图像则如下：

从代价函数的样子（等高线图）中可以看出在三维空间中存在一个使得 $J(\theta_{0}, \theta_{1})$ 最小的点。

下面为等高线图的二维图像，同一线圈上的 $J(\theta_{0}, \theta_{1})$ 取值相同。

理解代价函数

通过这些图形，我希望你能更好地理解这些代价函数 $J$ 所表达的值是什么样的，它们对应的假设是什么样的，以及什么样的假设对应的点，更接近于代价函数 $J$ 的最小值。

当然，我们真正需要的是一种有效的算法，能够自动地找出这些使代价函数 $J$ 取最小值的参数 $\theta_{0}$ 和 $\theta_{1}$ 来。

我们也不希望编个程序把这些点画出来，然后人工的方法来读出这些点的数值，这很明显不是一个好办法。我们会遇到更复杂、更高维度、更多参数的情况，而这些情况是很难画出图的，因此更无法将其可视化，因此我们真正需要的是编写程序来找出这些最小化代价函数的 $\theta_{0}$ 和 $\theta_{1}$ 的值。

在下一节视频中，我们将介绍一种算法，能够自动地找出能使代价函数 $J$ 最小化的参数 $\theta_{0}$ 和 $\theta_{1}$ 的值。