14-2 高斯分布

高斯分布

如果变量 $x$ 符合高斯分布 $x ~ N(\mu, \sigma^2)$ , 则其概率密度函数为： $p(x,\mu, \sigma^2) = \frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)^2}{2\sigma^2})$

我们可以利用已有的数据来预测总体中的 $\mu$ 和 $\sigma^2$ 的计算方法如下：

$\mu = \frac{1}{m}\sum^m_{i=1}x^{(i)}$

$\sigma^2 = \frac{1}{m}\sum^m_{i=1}(x^{(i)}-\mu)^2$

高斯分布样例：

注：机器学习中对于方差我们通常只除以 m 而非统计学中的（m-1）。在实际使用中，到底是选择使用 1/m 还是 1/(m-1)其实区别很小，只要你有一个还算大的训练集，在机器学习领域大部分人更习惯使用 1/m 这个版本的公式。这两个版本的公式在理论特性和数学特性上稍有不同，但是在实际使用中，他们的区别甚小，几乎可以忽略不计。