Loading [MathJax]/jax/output/CommonHTML/jax.js

模型表示

这一节我们主要学习以下内容

  • 单变量线性回归(Linear Regression with One Variable) 模型表示
  • 监督学习的完整流程
  • 单变量线性回归的假设函数建模

单变量线性回归 模型表示

模型表示

让我们通过一个例子来开始:

  • 数据集: 俄勒冈州波特兰市的住房价格(面积,价格)。
  • 问题:构建一个预测住房价格的模型,告知面积,给出最可能的售价。

它是一个典型的监督学习模型。因为对于每个数据,我们都给出了“正确的答案”,即告诉我们:根据我们的数据来说,房子实际的价格是多少,更具体来说,这是一个回归问题。

回归一词指的是,我们根据之前的数据预测出一个准确的输出值,对于这个例子就是价格。

在监督学习中我们有一个数据集,这个数据集被称训练集

整个课程中会小写的 m 来表示训练样本的数目。

以之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示:

这个回归问题的标记如下:

m 代表训练集中实例的数量
x 代表特征/输入变量
y 代表目标变量/输出变量
(x(i),y(i)) 代表训练集中的第i个实例
h 代表学习算法的解决方案或函数也称为假设(hypothesis)

监督学习的完整流程

模型表示

这就是一个监督学习算法的工作方式。这里有训练集,把它喂给学习算法,学习算法工作,然后输出一个函数,通常表示为小写h(hypothesis,假设)。h表示一个函数,输入是房屋尺寸大小x,得到的输出值为y,对应房子的价格。因此,h是一个从x到y的函数映射。

假设函数的建模

模型表示

对于上述房价预测问题,我们该如何表达h?

一种可能的表达方式为: hθ(x)=θ0+θ1x 因为只含有一个特征/输入变量,因此这样的问题叫作单变量线性回归问题