均方根误差(Root Mean Squared Error, RMSE)是 一种常用的衡量模型预测准确性的指标。它通过计算预测值与实际观测值之间差异的平方和,然后取平方根得到。RMSE 的值越小,表示模型的预测越准确。
定义
RMSE 是预测误差的平方和的平均值,再取平方根。数学表达式为:
\[
RMSE = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}
\]
其中,\( y_i \) 是实际观测值,\( \hat{y}_i \) 是预测值,\( n \) 是观测次数。
单位
由于 RMSE 是对误差平方和取平方根,因此它的单位与观测值的单位相同。
解释
RMSE 提供了误差的平均大小,比均方误差(MSE)更直观地反映了预测值与实际值之间的平均误差。
RMSE 对异常值的敏感性较 MSE 低,因为平方根运算会减小异常值的影响。
应用场景
RMSE 常用于评估回归模型、时间序列预测、信号处理等领域的模型性能。
它可以帮助我们了解模型预测的准确性,并作为模型选择和调优的依据。
示例
假设有一个模型预测了某城市的年降雨量,实际观测值为 [300, 350, 400, 450, 500] 毫米,预测值分别为 [280, 320, 370, 420, 470] 毫米。计算 RMSE 如下:
\[
RMSE = \sqrt{\frac{1}{5} \left[ (300 - 280)^2 + (350 - 320)^2 + (400 - 370)^2 + (450 - 420)^2 + (500 - 470)^2 \right]}
\]
\[
RMSE = \sqrt{\frac{1}{5} \left[ 400 + 900 + 900 + 900 + 900 \right]}
\]
\[
RMSE = \sqrt{\frac{1}{5} \times 4500} = \sqrt{900} = 30
\]
在这个例子中,RMSE 为 30 毫米,表示模型预测的平均误差为 30 毫米。
总结
均方根误差(RMSE)是一种重要的衡量模型预测准确性的指标,它通过平方和的平方根来直观地反映预测值与实际值之间的平均误差。由于其单位与观测值相同,且对异常值相对不敏感,RMSE 在实际应用中非常广泛。