正态分布,也称为高斯分布(Gaussian distribution),是一种 概率分布。它描述了一个连续型随机变量的分布情况,这个随机变量有两个主要参数:均值(μ)和方差(σ²)。正态分布的概率密度函数呈钟形曲线,关于均值对称,在均值处达到最大值,并在正负无穷远处趋近于零。其特点是中间高、两边低,形状类似于一个倒置的钟。
正态分布由A.棣莫弗在求二项分布的渐近公式中首次得到,后来C.F.高斯在研究测量误差时从另一个角度导出。正态分布在数学、物理、工程以及统计学的许多方面都有广泛的应用。例如,许多自然现象和社会现象(如身高、考试成绩、产品强力等)的概率分布都可以近似地用正态分布来描述。
正态分布的一个重要特性是其集中性,即大部分数据集中在均值附近,而远离均值的数据出现的概率较小。此外,正态分布的形状由均值(μ)和标准差(σ)决定:μ决定了分布的中心位置,σ决定了分布的幅度。标准正态分布是均值μ为0,标准差σ为1的正态分布。
正态分布具有很多良好的数学性质,例如,它的期望值、中位数和众数都重合,反映了数据的对称性。同时,正态分布经过线性变换后仍然保持正态分布的形式,这使得它在许多统计分析和建模中非常有用。