六盘山日雨量分析和T-test

2019年日雨量

蓝色被红色覆盖,但是经过局部放大可以看到,两者吻合的还不错,除了最高峰值处,红色要比蓝色高些

实验结果:

  • Average daily rainfall in 2019 - real : 2.814647887323944
  • Average daily rainfall in 2019 - pred: 2.85994
  • real is bigger than pred by: -0.015836753178213987
  • Average daily rainfall in 201907-09 - real : 2.354716981132076
  • Average daily rainfall in 201907-09 - pred : 2.2898154
  • real is bigger than pred by : 0.028343574999952128
  • Average daily rainfall in 201908-12 - real : 3.4965034965034976
  • Average daily rainfall in 201908-12 - pred : 3.7051587
  • real is bigger than pred by : -0.05631478440750046
  • R-square is 0.9073249074687747

结果分析

全年误差在1.5%左右,上半年预测低了2.8%,下半年预测高了5.6%,可以分析图像找到原因:在下半年会有暴雨天气,增幅非常大,模型预测不会达到峰值高度,导致预测值偏小,不过这个误差不是很大,而且这对实验来说是有利好的。模型预测值偏大,在进行2020预测时,就会更加突出人工降雨的效果,因为真实值比偏大的预测值还大就可以说明效果。

2020年日雨量

实验结果

  • Average daily rainfall in 2020 - real : 2.817611940298508
  • Average daily rainfall in 2020 - pred: 2.7112591
  • real is bigger than pred by: 0.03922635523451054
  • Average daily rainfall in 202007-09 - real : 2.1363207547169814
  • Average daily rainfall in 202007-09 - pred : 2.2529469
  • real is bigger than pred by : -0.05176602312318417
  • Average daily rainfall in 202008-11 - real : 4.009836065573769
  • Average daily rainfall in 202008-11 - pred : 3.5114276
  • real is bigger than pred by : 0.14193897059174176

结果分析

  1. 可以看到2019年的上半年pred小了2.8%,在2020年pred大了5%;同时2019上半年的real平均值为2.81,2020为2.13。这两项数值表明,2020年上半年的雨量比2019年是有所降低的,(2.13-2.35)/2.35=-9.36%,即大概降低9.36%
  2. 如果我们假设下半年没有进行人工降雨,并且假设下半年也会同比减少9.36%左右
  3. 实际上下半年的real比pred高了14%,我们注意到2019年的模型中下半年pred大了5.63%,假设模型在2020年下半年也有次误差,则扣除误差,增量大概为14%+5.63%=19.63%
  4. 按照实际值来看,下半年的real为4.01,而2019下半年的real为3.50,增加了14.57%,而根据上半年显示2020雨水少,应该下半年也会减少9.36%,实际却增加14.57%,这表示降雨效果达到了9.36%+14.57%=23.93%
  5. 两个方面的证据都表示降雨的增加会达到20%

残差图

由残差图可以看出,下半年与上半年相比,震荡更加明显,且总体上偏向正值,上半年的残差图比较接近0,说明降雨效果还是比较明显的

T-test

检测内容

  1. 2020年实验期间和非实验时间的月降水量
  2. 2020年实验期间和2019年同时期月降雨量
  3. 2020年实验期间和2008-2019年同时期的平均月降雨量
    1. 2008-2013年的10月和11月数据缺失,所以10月、11月的平均值只计算了2014-2019年
  4. 2020年实验期间的总降雨量和2014-2019年同时期的总降雨量
    1. 同样因为2008-2013年的10月和11月数据缺失,所以只使用了2014年以后的数据

检测结果

与检测内容一一对应

  1. result = 0.162630615
  2. result = 0.486994972
  3. result = 0.278419538
  4. result = 0.074096442

结果分析

  1. 可以看到第四个检测结果较好,T-test的检测结果表示2020年实验期间的总降雨量与往年同时期的降雨量,有7.41%的概率属于同一分布,相对应的,属于不同分布的置信度为92.59%,可以看到降雨的效果比较明显,置信度达到90%以上。

本文章使用limfx的vscode插件快速发布