模型表示
这一节我们主要学习以下内容
- 单变量线性回归(Linear Regression with One Variable) 模型表示
- 监督学习的完整流程
- 单变量线性回归的假设函数建模
单变量线性回归 模型表示
模型表示
让我们通过一个例子来开始:
- 数据集: 俄勒冈州波特兰市的住房价格(面积,价格)。
- 问题:构建一个预测住房价格的模型,告知面积,给出最可能的售价。
它是一个典型的监督学习模型。因为对于每个数据,我们都给出了“正确的答案”,即告诉我们:根据我们的数据来说,房子实际的价格是多少,更具体来说,这是一个回归问题。
回归一词指的是,我们根据之前的数据预测出一个准确的输出值,对于这个例子就是价格。
在监督学习中我们有一个数据集,这个数据集被称训练集。
整个课程中会小写的 m 来表示训练样本的数目。
以之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示:
这个回归问题的标记如下:
m 代表训练集中实例的数量
x 代表特征/输入变量
y 代表目标变量/输出变量
(x(i),y(i)) 代表训练集中的第i个实例
h 代表学习算法的解决方案或函数也称为假设(hypothesis)
监督学习的完整流程
模型表示
这就是一个监督学习算法的工作方式。这里有训练集,把它喂给学习算法,学习算法工作,然后输出一个函数,通常表示为小写h(hypothesis,假设)。h表示一个函数,输入是房屋尺寸大小x,得到的输出值为y,对应房子的价格。因此,h是一个从x到y的函数映射。
假设函数的建模
模型表示
对于上述房价预测问题,我们该如何表达h?
一种可能的表达方式为: hθ(x)=θ0+θ1x 因为只含有一个特征/输入变量,因此这样的问题叫作单变量线性回归问题。