02-1 模型表示

这一节我们主要学习以下内容

单变量线性回归模型表示

模型表示

让我们通过一个例子来开始：

它是一个典型的监督学习模型。因为对于每个数据，我们都给出了“正确的答案”，即告诉我们：根据我们的数据来说，房子实际的价格是多少，更具体来说，这是一个回归问题。

回归一词指的是，我们根据之前的数据预测出一个准确的输出值，对于这个例子就是价格。

在监督学习中我们有一个数据集，这个数据集被称训练集。

整个课程中会小写的 m 来表示训练样本的数目。

以之前的房屋交易问题为例，假使我们回归问题的训练集（Training Set）如下表所示：

这个回归问题的标记如下:

$m$ 代表训练集中实例的数量
$x$ 代表特征/输入变量
$y$ 代表目标变量/输出变量
$(x^{(i)},y^{(i)})$ 代表训练集中的第i个实例
$h$ 代表学习算法的解决方案或函数也称为假设（hypothesis）

监督学习的完整流程

模型表示

这就是一个监督学习算法的工作方式。这里有训练集，把它喂给学习算法，学习算法工作，然后输出一个函数，通常表示为小写 $h$ （hypothesis，假设）。 $h$ 表示一个函数，输入是房屋尺寸大小 $x$ ，得到的输出值为 $y$ ，对应房子的价格。因此， $h$ 是一个从x到y的函数映射。

假设函数的建模

模型表示

对于上述房价预测问题，我们该如何表达h？

一种可能的表达方式为： $h_{\theta}(x) = \theta_{0} + \theta_{1}x$ 因为只含有一个特征/输入变量，因此这样的问题叫作单变量线性回归问题。