模型表示

这一节我们主要学习以下内容

  • 单变量线性回归(Linear Regression with One Variable) 模型表示
  • 监督学习的完整流程
  • 单变量线性回归的假设函数建模

单变量线性回归 模型表示

模型表示

让我们通过一个例子来开始:

  • 数据集: 俄勒冈州波特兰市的住房价格(面积,价格)。
  • 问题:构建一个预测住房价格的模型,告知面积,给出最可能的售价。

它是一个典型的监督学习模型。因为对于每个数据,我们都给出了“正确的答案”,即告诉我们:根据我们的数据来说,房子实际的价格是多少,更具体来说,这是一个回归问题。

回归一词指的是,我们根据之前的数据预测出一个准确的输出值,对于这个例子就是价格。

在监督学习中我们有一个数据集,这个数据集被称训练集

整个课程中会小写的 m 来表示训练样本的数目。

以之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示:

这个回归问题的标记如下:

$m$ 代表训练集中实例的数量
$x$ 代表特征/输入变量
$y$ 代表目标变量/输出变量
$(x^{(i)},y^{(i)})$ 代表训练集中的第i个实例
$h$ 代表学习算法的解决方案或函数也称为假设(hypothesis)

监督学习的完整流程

模型表示

这就是一个监督学习算法的工作方式。这里有训练集,把它喂给学习算法,学习算法工作,然后输出一个函数,通常表示为小写$h$(hypothesis,假设)。$h$表示一个函数,输入是房屋尺寸大小$x$,得到的输出值为$y$,对应房子的价格。因此,$h$是一个从x到y的函数映射。

假设函数的建模

模型表示

对于上述房价预测问题,我们该如何表达h?

一种可能的表达方式为: 因为只含有一个特征/输入变量,因此这样的问题叫作单变量线性回归问题