纳什效率系数与可决系数的差异
正文参考文献正文
纳什效率系数和可决系数的公式形式非常相似,主要差异如下: 可决系数(Coefficient of determination,R)是用来度量一个统计模型的拟合优度的。R2=1−∑(yi−y^i)2∑(yi−y‾)2R^2 =1-\frac{\sum{(y_i-\hat{y}_i)^2}}{\sum{(y_i-\overline{y})^2}} R2=1−∑(yi−y)2∑(yi−y^i)2
式中:yiy_iyi是变量观测值;y‾\overline{y}y是变量观测值的均值;y^i\hat{y}_iy^i是统计模型的变量模拟值;举个例子,如果我们有一系列观测值xix_ixi和yiy_iyi,我们假设用一元线性回归模型y=ax+by=ax+by=ax+b模拟变量之间的关系,可以得到一系列模拟值y^i=a^xi+b^\hat{y}_i=\hat{a}x_i+\hat{b}y^i=a^xi+b^。如果xxx和yyy没有相关关系,最小二乘估计的参数为a^=0,b^=y‾\hat{a}=0,\hat{b}=\overline{y}a^=0,b^=y,此时R2=0R^2=0R2=0,因此,R2R^2R2的最小值为0,即残差平方和(yi−y^i)2{(y_i-\hat{y}_i)^2}(yi−y^i)2不会小于总的平方和(yi−y‾)2{(y_i-\overline{y})^2}(yi−y)2。R2R^2R2的取值范围为[0,1]。纳什效率系数(Nash-Sutcliffe Efficiency, NSE)常用于用于量化模拟模型(如水文模型)的预测精度。
NSE=1−∑(yi−yipred)2∑(yi−y‾)2NSE =1-\frac{\sum{(y_i-{y_i^{pred}})^2}}{\sum{(y_i-\overline{y})^2}} NSE=1−∑(yi−y)2∑(yi−yipred)2
式中:yipredy_i^{pred}yipred是预测模型对变量的预测值。预测值属于回归样本外得到的预测结果,和回归模型的模拟值有很大区别,模型误差的平方和(yi−yipred)2(y_i-{y_i^{pred}})^2(yi−yipred)2可能大于总平方和(yi−y‾)2(y_i-\overline{y})^2(yi−y)2,对于一个完美的模型,估计的误差的方差等于0,则NSE=1;相反,一个模型产生的估计误差方差等于观察到的时间序列的方差,结果NSE=0。实际上,NSE=0表示该模型具有与时间序列平均值相同的预测能力,即误差平方和。当预测模型得到的估计误差方差显著大于观测值方差时,NSE<0。NSE值越接近1,表明模型预测能力越好。因此NSE的取值范围为(−∞,1](-\infty, 1](−∞,1]。但是如果将NSE用于模型回归中,则和R2R^2R2完全等价,范围是[0,1]。
参考文献
[1] /wiki/Nash%E2%80%93Sutcliffe_model_efficiency_coefficient
[2] /wiki/Coefficient_of_determination
[3] /questions/185898/difference-between-nash-sutcliffe-efficiency-and-coefficient-of-determination/230002#230002?newreg=2a378583117b4380bb38a8884c23fdd4
如果觉得《纳什效率系数与可决系数的差异》对你有帮助,请点赞、收藏,并留下你的观点哦!