高斯分布

如果变量$x$符合高斯分布$x ~ N(\mu, \sigma^2) $, 则其概率密度函数为:

我们可以利用已有的数据来预测总体中的$\mu$和$\sigma^2$的计算方法如下:

高斯分布样例:

注:机器学习中对于方差我们通常只除以 m 而非统计学中的(m-1)。在实际使用中,到底是选择使用 1/m 还是 1/(m-1)其实区别很小,只要你有一个还算大的训练集,在机器学习领域大部分人更习惯使用 1/m 这个版本的公式。这两个版本的公式在理论特性和数学特性上稍有不同,但是在实际使用中,他们的区别甚小,几乎可以忽略不计。