人工影响天气的统计数学方法


一、线性代数

矩阵

  1. 方阵A主对角线上全部元素和为A的迹
  2. 对角矩阵:除主对角线上的元素外,其他都为0,D=diag(a1,a2,...an)
  3. 纯量矩阵:主对角线值相等的对角矩阵

行列式

  1. 如果n元齐次线性方程组有非零解,则其系数行列式必须为0
  2. 性质
    1. 互换任意两行,行列式反号
    2. k×任意一行=k×行列式
    3. 任意两行成比例,行列式为0
    4. 两个同阶行列式只有一行不同,两者之和等于把行列式的这一行元素换为两个行列式相应两行元素之和
    5. 某行加上另一行的k倍,行列式的值不变
    6. 行列式转置后值不变
  3. 逆矩阵
    1. 若AB=BA=I,称A是可逆的
    2. detA≠0,则A是非奇异阵 detA=0,则A是奇异阵/降秩阵
    3. 性质

二、统计检验

基本概念

  1. 变量分为离散型变量和连续型变量
  2. 随机试验
  3. 随机变量的数字特征
    1. 方差
  4. 重要的理论分布
    1. 二项分布
      • 当p->0,n->无穷时,np<5,要用泊松分布
    2. 正态分布
      • 当影响随机变量取值的因素很多,但是每个因素都影响很小时,就服从正态分布
    3. 皮尔逊Ⅲ型分布
      1. 是一种重要的偏态分布,分布曲线左右不对称
      2. 如雨量的分布,云滴谱的分布、河流最大流量的分布都近似地服从该分布
    4. 对数正态分布
      1. 随机变量取值的对数具有正态分布
      2. 是一种偏态分布
      3. 雨量的分布近似服从对数正态分布

统计检验方法

  1. 数理统计的中心问题是如何合理地收集资料,并利用观测的样本资料来对统计总体的数字特征、分布函数等进行评估、分析与推断。
  2. 统计检验的基本思想
    1. 统计假设检验的内容:对研究的总体作出假设
    2. 选取适当的样本统计量来对加假设进行判断
  3. 错误
    1. 第一种错误:原假设成立,做出拒绝原假设的错误判断
    2. 第二种错误:原假设不成立,做出接受原假设的错误判断

三、回归分析

一元线性回归

  1. 回归分析:寻找非确定性联系的统计关系,并运用这种统计关系,估计另一个变量所取得值,同时定出做这种估计时,准确度有多大。
  2. 回归方程
  3. 回归方程的显著性检验
  4. 利用回归方程进行预报的准确度——区间估计
  5. 样本平均值的区间估计
  6. 双样本回归分析
  7. 相关

多元线性回归

  1. 影响气象现象的因素很多,需要找到各气象因素作为预报因子(协变量),确立预报银子和预报量之间的相关性,建立多元回归方程
    1. 寻找有效的预报因子的方法
      1. 根据物理规律
      2. 根据观测数据
  2. 多元线性回归方程
  3. 多元线性回归方程的显著性检验
  4. 回归系数的显著性检验
    1. 可以剔除对y影响较小的量
  5. 逐步回归分析
    1. 逐个引入因子,引入的条件是该因子的回归系数(或偏回归平方和)经检验是显著的。
    2. 每引入一个新因子后,对老因子的回归系数逐个重新检验,将其中变为不显著的因子剔除,直至所有显著的因子都包括在回归方程中为止。

四、试验设计和效果检验

概述

  1. 人工影响天气试验,可分为两类:研究性实验、作业性试验
  2. 效果
    1. 间接效果:降水
    2. 直接效果:云的厚度、持续时间、上升气流速度、云体温度、冰晶浓度、大云滴浓度
    3. 效果检验的基本思路:
      1. 实测雨量y
      2. 估计降雨y0,估计如果不催化,本来会下的雨
    4. 实测雨量的方法是雨量计
    5. 雷达
      1. 雷达观测云内出现回波的时间及高度,降水区的分布、移动和发展,回波顶的高度及发展速度。
      2. 回波强度受水滴大小的影响比数目的影响大,所以,若雨滴谱不同,尽管降水强度相同,雷达回波强度还是不同,所以雷达测量降水强度是有条件的。但实际上雨滴谱与降水强度关系密切。
      3. 在事先利用稠密的雨量站点做好检定的条件下,可以用雷达定量的测量降水强度。
    6. 自然降水量的估计比实测雨量要困难的多,人工降雨的效果检验实质就是用什么方法对自然降水进行定量估计的问题。
      1. 物理预报方法-做不到
      2. 统计推断方法-目前的方法
        1. 比较好的方法是将数值模拟试验的结果与统计分析方法结合起来做出判断。
  3. 试验设计
    1. 试验的统计设计中关键的问题是选择合适的自然雨量估计值。有几种设计思想:
      1. 历史平均值作为自然雨量的估计值,由于气象有长期上的变化,所以很少使用
      2. 对比区的自然雨量作为目标区的自然雨量的估计值
        1. 区域对比试验采用这种估计值,假定雨量在空间分布上是均匀的
        2. 由于地形差异,选择实验单元上的主观偏见,较难满足
      3. 用对比区的自然雨量作为预报因子(控制因子),对试验区的进行统计推断
        1. 区域回归实验采用的方法
        2. 假定试验期目标区与对比区雨量的相关关系与历史上同期的区域相关性相同
        3. 比区域对比实验更近一步
        4. 缺点是样本容量小,估计值不稳定
      4. 随机化设计
        1. 基本思想是将宜于催化的云(或降水过程)随机地分为两组,一组播云,一组不播云作为对比。若两组雨量出现显著差异,就归因于作业。
        2. 若只用目标区本身的资料,则这种试验叫做单区随机试验
        3. 优点是避免了主观偏见,不依赖历史资料
        4. 单区随机试验功效太低,较短时间难出结果,加一些控制变量,提高功效。如:区域回归随机试验、随机交叉试验、单体云的随机试验、协变量回归随机试验。
        5. 现代的人工降水试验研究中,采用各种随机化设计方案
  4. 效果检验
    1. 效果的统计检验
      1. 统计检验的主要内容是显著性检验,即如果实测雨量与估计雨量之间有差异的话,就对差异及逆行统计检验,指出由于降水的自然变差和估计值的随机误差引起这差异的可能性有多大。
        1. 若可能性很大,没有理由认为人工降雨有效,即效果不显著
        2. 若可能性很小,如小于5%,则有较大把握说明有效,即效果显著
        3. 可能性大小就叫做显著性水平或显著度
      2. 显著性检验也叫假设检验,分为参量性检验和非参量性检验
        1. 人工降水中应用较多的参量性检验法是t-检验法,要求统计变量服从正态分布,且要求人工影响的措施只改变总体平均值,不改变方差
        2. 两个条件若不满足,t-检验的依据就不成立,所以在使用t-检验之前,要对统计变量的分布进行分布函数检验。所用检验法要求大样本,样本容量应大于30-50
        3. 若结果与正态分布偏离较大,要使变量正态化,如求对数,平方根等
        4. 作业样本和对比样本方差相等性的检验可用F-检验法,F>F0.95
        5. 在不知道统计变量的分布情况时,采用非参量性检验法
    2. 效果的物理检验
      1. 物理效应检验
        1. 根部云和降水的形成以其人工影响的物理机制,找出对应的物理效应,作为效果的指标,通过试验来检验人工影响是否显著的改变这些指标。
      2. 降水量的数值预报

催化效果的观测分析

人工降雨实验是从设法改变云的某些微物理过程入手,进而促使降水的形成或增加雨量。所以试验效果还能从云的物理结构发生发生异常变化中反映过来。催化效果的观测分析方法,主要分析作业前后云的宏微观结构变化,空中和地面降水的形成和发展。 分析的主要依据是云的结构和降水的时空连续性。

  1. 人工影响前后云的宏观结构的变化
    1. 云体外形
    2. 宏观气象要素的变化
  2. 人工影响前后云的微观结构的变化
    1. 物态
      1. 人工催化是否有效,可以从观测催化前后冰雪晶的出现及其浓度变化中反应出来
    2. 含水量、云滴谱和云滴浓度
  3. 降水资料的分析
    1. 飞机观测
    2. 雷达观测
    3. 地面降水资料的收集和分析
      1. 在地形条件大致相似的地区,可以假定自然降水在时空分布上是连续的
        1. 比较作业区与周围非作业区的降水分布
        2. 分析降水起讫时间
          1. 自然降水开始时间具有方向性,与雨区的移动相对性
          2. 人工影响的降水时间与催化时间相对应
      2. 积状云降水分析困难

催化效果的统计分析

  1. 序列试验
    1. 最简单的统计效果检验方法,根据历史资料,求出降水平均值,作为试验区自然降水量的估计值,和实测雨量比较,得出人工影响的效果估计量
    2. 首先确定计算雨量的时间单位,成为催化单元,一月或一季
    3. 具体方法:根据历史资料求平均降雨量x'和标准差S。当时间长时,u=(x-x')/S近似服从标准正态分布。若催化后,u>=1.65,(概率为5%),认为有效,显著性水平为0.05。
    4. 要达到5%的显著性水平,计算发现降水要增大一倍,但人工降水的影响在10%-30%,所以此方法灵敏度太低,不适合。
  2. 区域回归试验 区域控制法:降水的自然变差大,使用历史平均雨量估计不太准确区域回归不用历史平均值,借助一个或以上的对比区,根据历史资料建立目标区与对比区的历史雨量回归方程,利用回归方程估计目标区的自然雨量,称为目标区自然雨量的期待值
    1. 对比区的选定
      1. 目标区位于作业点的下风方向
      2. 对比区要满足的条件
        1. 不受催化
        2. 地形、面积大体相仿
        3. 天气系统影响相同,显著性水平在0.01以上
        4. 和目标区一样,有稠密的雨量站网
    2. 统计变量的选择
      1. 有代表性
      2. 合适进行统计检验,若使用t-检验法,要求变量正态分布
      3. 变量的区域相关系数较大,本身的自然变差较小,变量具有稳定性
      4. 选择变量的具体做法:
        1. 单站月雨量
          1. 代表性差,分布偏态严重,区域相关性差,变差大,雄安率不高
        2. 整个区域的月雨量(总量)或区域面积平均月雨量(各站加权平均或简单算术平均)
          1. 要求有历史数据的稠密雨量站网
        3. 一次系统天气的雨量(总量或平均)
          1. 对试验期按天气型进行分层统计、
        4. 日雨量或催化后某一时段的雨量
          1. 困难是选择类似的历史雨量资料要有明确的统一指标。工作量大
    3. 分析步骤
      1. 根据目标区和对比区的的历史资料,求两区雨量指标的相关系数r,进行显著性检验,,要求r的显著性水平a<=0.01
      2. 求历史回归方程
      3. 根据试验期对比区实测雨量x,求目标区试验期自然降水量的期待值y'
      4. ,表示人工降水的效果
      5. 为了确定上述差值是否为人工影响,进行显著性检验
        1. 假设样本容量为n,查t-分布表(自由度v=n-2),可得相对于显著度a的t值
      6. 若效果显著,可以在一定的置信水平求出置信区间
    4. k次试验的平均效果——多个事件检验法
      1. 上述分析步骤是单个事件检验法,缺点是各次试验效果差别大
      2. 多个事件检验法直接检查多次试验的总效果
      3. k次试验,每次都有一个实测值与期待值之差d,求d的平均增加值,讨论他的显著度
      4. 平均之后,随即部分被抵消,在总体分布具有正态分布的前提下,仍用t-检验法
      5. 回归方程可按照不同的天气型分别建立,但是需要足够的历史资料,可设置变动范围(定为对比区的雨量的+-30%)
    5. 回归分析法的缺点
      1. 对比区难选
      2. 根据不同的对比区建立回归方程,得到不同的结论,因为历史资料不够多
      3. 必须要有历史记录
  3. 随机试验 随机试验试图排除回归分析方法的影响,把易于催化的分为两组,按照随机性原则,一组催化,一组对比。随机试验不依赖历史资料。 三种随机试验方案如下:
    1. 区域回归随机试验
      1. 一个目标区,多个对比区,当有利于催化的天气出现时,目标区按随机规则决定是否催化,对比区一直不催化
      2. 跟据对比单元(不催化单元)两区的雨量建立回归方程
      3. 按照催化单元对比区的实测雨量计算目标区的自然雨量期待值
    2. 随机交叉试验
      1. 选择两个雨量相关性好而彼此又不污染的试验区,每个实验单元按照随机规则决定一区催化,一区对比。
    3. 单体积云的随机试验
  4. 协变量回归随机试验
    1. 随机试验的一个主要问题是检验效果的功效比较低
    2. 随机区分的对比单元和催化单元之间的随即变差是相当大的,为了提高统计检验的功效,需要选择预报因子,在一定预报因子取值条件下,自然降水量的条件变差可以大大减小,提高统计检验的功效。
    3. 具体方法:挑选目标区降水量关系密切的气象要素作为预报因子,建立降水量的预报方程,对目标区自然降水进行估计,和催化后的实测雨量比较。对比单元的雨量用来检验预报方程的预报效果,对催化效果进行订正。
    4. 预报因子不超过样本容量的5%-10%
    5. 通过逐步回归分析方法实现
    6. 气象控制回归试验
    7. 协变量回归随机试验
      1. 利用一些云雨产生的伴生变量作为预报因子,对积云降水进行统计预报
      2. 将协变量的统计预报方法和随机化设计结合起来
      3. 优点
        1. 将统计分析方法和降水动力过程的分析结合起来,使预报因子有较为可靠的物理依据
        2. 将统计预报和随机试验结合起来,可以利用对比单元检验预报方程的适用性,可以从由模式估计的催化效果中扣除预报方程的系统偏差。

本文章使用limfx的vscode插件快速发布