高斯分布
如果变量x符合高斯分布x N(μ,σ2), 则其概率密度函数为: p(x,μ,σ2)=1√2πσexp(−(x−μ)22σ2)
我们可以利用已有的数据来预测总体中的μ和σ2的计算方法如下:
μ=1mm∑i=1x(i) σ2=1mm∑i=1(x(i)−μ)2高斯分布样例:
注:机器学习中对于方差我们通常只除以 m 而非统计学中的(m-1)。在实际使用中,到底是选择使用 1/m 还是 1/(m-1)其实区别很小,只要你有一个还算大的训练集,在机器学习领域大部分人更习惯使用 1/m 这个版本的公式。这两个版本的公式在理论特性和数学特性上稍有不同,但是在实际使用中,他们的区别甚小,几乎可以忽略不计。