高原气象
PLATEAU METEOROLOGY
1999年 第18卷 第2期 Vol.18 No.2 1999


变分四维同化方法若干问题的数值试验

冯伍虎  邱崇践*

  摘 要 资料误差和模式误差都可能影响变分四维同化的结果,针对这一问题利用浅水方程模式进行了变分四维同化的数值模拟试验。试验分三种情况进行:(1) 仅修正初始场,(2) 仅修正模式,(3) 二者同时修正。试验结果表明,当模式有误差时,传统的变分四维同化方法(仅修正初始场)可能将模式的误差混淆到初始场中去,尽管在同化期间可得到较好的拟合,但却不一定能保证同化后有好的预报。如果不修正初始场而修正模式,当模式误差不大时,尽管实际的方程误差随时间变化,但仍可用一个定常的误差项来近似代替它达到改善预报的目的。在实际的方程误差随时间变化较大时,如果用定常的误差项来代替,可能造成同化失败。同时修正初始场和模式,同化后效果会好于同化前,但尺度化因子的选取对同化产生很大影响。
  关键词 变分四维同化 控制变量 浅水方程模式 伴随模式
  分类号 P435

THE RESEARCH OF SEVERAL ASPECTS OF FOUR-DIMENSIONAL VARIATIONAL DATA ASSIMILATION

FENG Wu-hu QIU Chong-jian

(Department of Atmospheric Sciences, Lanzhou University, Lanzhou,Gansu 730000)

  Abstract It is possible that both observational data error and model error will influence results through four-dimensional variational data assimilation. According to this, some numerical experiments are performed on a shallow water equation model. In these experiments initial data and model error parameter are adjusted simultaneously or sequentially as control variables. It shows when taking initial data as control variables, model error will be aliased to the initial fields if model equations exist error. Although it can be well adjusted during the periods of assimilation, it may not have good forecast after assimilation. But if taking model error parameter as control variables, although model error will varies with time, we can substitute it with constant model error control if the errors in the model have small effect, otherwise, assimilation will fail. It shows when initial data and model correction term adjusted simultaneous as the control variables, perhaps it will be the best, but the choice of scale will influence the results.
  Key words Four-dimensional variational data assimilation Control variables Shallow water equation model Adjoint model

1 引  言
  变分四维同化方法已经成为产生最优预报的一种有力工具。这一最优过程是通过修正预报模式的某些输入量(称为控制变量)使预报与观测最接近。变分四维同化可以被理解为用预报模式提供的信息来弥补观测场的不足,因此,预报模式的误差必然影响到同化的结果。正是由于认识到这一点,Derber[1]首先提出用修正模式的方法来替代修正初始场进行变分四维同化。Zupanski等[2]则进一步在同化过程中将初始场和模式误差均作为控制变量加以修正。既然初始场和模式都有误差,那么在同化过程中对两者都加以修正应该是合理的。但实际进行中我们会面临如下一些问题:(1) 由于我们不可能将每个计算格点(包括空间和时间)上的模式误差均作为控制变量,一般只能对其时间或空间变化作某种假设。现在流行的作法是假设其不随时间变化或时间变化函数已知。在这种假设下修正模式是否有好处?(2) 由于上面的问题,再加上观测资料有误差,在同化过程中同时修正初始场和模式是否仍然可行?之所以提出这样的问题是考虑到由于对模式误差不正确的假设加之观测误差的影响,使得我们无法将初始场的误差和模式误差的作用区分开来,这样会不会影响以后的预报?对这两个问题在用实际资料所作的试验中并没有给出肯定的回答。由于我们既不知道由实际观测形成的初始场的误差,也不知道模式的误差,要从实际的试验中来分析这两个问题也有不少困难。本文将采用浅水模式,并引入已知的模式误差,利用模式资料进行一系列数值模拟试验,对上述问题进行分析研究。

2 方  法
2.1 变分方法的一般原理
  变分四维同化方法的基本原理是通过修正模式的输入量(以下称为控制变量),使在同化时段内的模式输出量(或者它们的某些函数)与相应的观测之间距离最小。定义一个目标函数表征这一距离,于是变分四维同化方法便构成了一个约束条件下(控制方程)的泛函极小化问题。通过与原模式(线性化后)对应的伴随模式作向后积分,可计算出目标函数相对于控制变量的梯度,然后运用某种极小化算法(例如伴随梯度法、拟牛顿法)使它达到极小点。
  上述问题可一般性地表述为下面的数学问题[3],设目标函数具有下列形式:

g0205.gif (1149 bytes)       (1)

其中y满足下面的预报方程

yn=Gnyn-1nt0203.gif (106 bytes),               (2)

上标n表示时间标号,在预报方程(2)中已加入了用λnt0203.gif (106 bytes)表示的模式修正项,其中t0203.gif (106 bytes)只是空间的函数,λ是时间t的已知函数,分别为在模式方程中所加入的误差项的时间部分和空间部分。yn是在tn时刻的模式状态矢量,tn时y的观测为ynobs。W为权重矩阵,依赖于观测误差协方差。y0t0203.gif (106 bytes)为控制变量。
  变分四维同化方法有三种:一种认为模式精确,仅修正初始场,这是一种传统的四维变分,此时控制变量为y0;另一种认为初始场精确而仅修正模式,这时控制变量为t0203.gif (106 bytes);还有一种认为初始场和模式都不精确,需要同时进行修正,此时控制变量为y0t0203.gif (106 bytes)
  对(1)式取一阶变分,并利用伴随算子的性质,可得到目标函数对初始场的梯度

g0206.gif (426 bytes)               (3)

和目标函数关于模式误差t0203.gif (106 bytes)的梯度

g0207.gif (685 bytes)              (4)

这里伴随函数t0207.gif (167 bytes)是由下面的伴随方程决定

t0207.gif (167 bytes)n=G′*n+1t0207.gif (167 bytes)n+1+W(yn-ynobs),          (5)

G′*是算子G线性化后的伴随算子。本文中采用变尺度法[3](或拟牛顿法,Luenberger,1984, Gilleta,1981),找出目标函数的极小值。实践证明,它是很成功的最优化方法之一,具有较好的数值稳定性及收敛性。其具体计算步骤如下:
  (1) 给出控制变量的初始猜测值;
  (2) 积分模式(2),得出同化期间模式方程的积分值;
  (3) 根据方程(1),计算出目标函数值;
  (4) 通过反向时间积分伴随方程(3)或(4),分别计算出目标函数关于相应控制变量的梯度值;
  (5) 如果达到收敛或已经给定的迭代次数,则迭代中止,否则返回(2),重复该过程。
2.2 模式方程
  模式方程是下面的浅水方程:

g0208.gif (4709 bytes)     (6)

这里u,v,h分别是东西向、南北向风速及高度,东西边界取周期性边界条件,南北边界取光滑刚性边界条件,时间积分采用Euler-后差迭代格式,空间采用中央差分格式。积分区域为边长D=6 000 km的正方形区域,网格距Δx=Δy=300 km,时间步长Δt=360 s,f=10-4s-1,g=9.8 ms-2。方程中加入了人工耗散项以消除可能产生的非线性计算不稳定。扩散系数Ku=Kv=Kh=6.7×105m2s-1,资料同化的时间t=6 h。
2.3 观测资料的构造
  试验所用的观测资料是由上述模式产生的模拟资料。对模式积分的时段划分如图1所示。类似Grammeltvedt[4]的做法,在图1中A时刻取高度场为

g0209.gif (1506 bytes)      (7)

0210.gif (1468 bytes)

图 1 模式积分的时段划分
Fig. 1 A schematic view of the assimilation-forecast cycle

风场是由地转关系给出

g0210.gif (443 bytes)                (8)

g0211.gif (412 bytes)                (9)

这里H0=1 000 m,H1=-120 m,H2=60 m,y0=D/2。本文中取k=4和k=10两种情况。从A时刻出发作3 h时间积分,以消除由于初始风场和高度场不协调产生的高频振荡,将得到的结果(B时刻)作为初时时刻的“真实值”,以下称为“真实的初始场”。再由B时刻的“真实的初始场”出发,沿精确的模式再向前积分6 h得到同化期间的“真实场”。若认为观测无误差,我们将同化期间的“真实场”视为观测场。若认为观测有误差,取观测场为“真实场”与误差场之和。这里误差场取为随机型误差,随机型误差是由随机函数产生,误差的振幅是“真实场”均方根值的10% 。
  在不进行变分四维同化时,同化阶段和实际预报阶段所用的初始场均是该时段的起始时刻(B或者C)的观测场。在进行变分四维同化后,实际预报所用的初始场是同化末时刻(C)的同化结果。假设同化过程中每小时一次观测,并在所有网格点上有效。

3 试验设计
  本文的目的主要是研究模式误差给变分四维同化带来的问题。由于在实际中模式误差的具体形式无法知道,为了模拟这种情况,在试验中将预报方程的水平扩散系数取为“真实值”的10倍而引入模式误差。但我们在修正模式时并不修正扩散系数,而是如同(2)式那样在方程(6)右端加入模式修正项,并设其不随时间变化,即令λ=1。在预报阶段,仍保留同化产生的模式误差修正项,即认为模式误差具有持续性。依次将三个方程的修正项记为t0203.gif (106 bytes)u,t0203.gif (106 bytes)vt0203.gif (106 bytes)h
  我们共进行了三组试验:
  试验I (IC试验):仅修正初始场。
  试验II (ME试验):仅修正模式。
  试验III (ICME试验):对初始场和模式方程同时修正。
  每组试验所用的观测资料均包括无误差和有误差两种情况。本文中权重矩阵W为对角矩阵,其中对应于u,v,h的分量分别记作Wu,Wv,Wh,其中Wu=Wv=1.0 m-2s-2,Wh=1.0×10-2m-2。由(3),(4)式得出的梯度一般还不能直接用于下降算法中,这是因为各个预报变量量级差别太大,从而使目标函数在多维空间呈现出极度扁的椭圆球,造成目标函数难于达到极小。解决的办法之一是选取适当的尺度化因子将原变量作归一化处理,使开始迭代时目标函数对各个分量的梯度大体相当[5]。在仅修正初始场(IC)时,取高度场、风场的尺度化因子分别为:Sh=10.0 m,Su=Sv=1.0 ms-1。在仅修正模式(ME)时,取尺度化因子分别为:t0208.gif (148 bytes)=t0209.gif (140 bytes)=0.01 ms-2t0210.gif (150 bytes)=0.1 ms-1。在同时修正初始场和模式(ICME)时,取尺度化因子分别为:Sh=10.0 m,Su=Sv=1.0 ms-1t0208.gif (148 bytes)=t0209.gif (140 bytes)=0.01 ms-2t0210.gif (150 bytes)=0.1 ms-1

4 试验结果
4.1 不考虑观测误差,模式误差对四维同化过程的影响
  取(7)式中的k=4。首先考虑观测资料无误差的情况。这时所给的初始场也是准确的。由于模式有误差,预报误差大体上随时间线性增长(如图2中实线所示)。由图可看出,由于模式有误差,如果仅修正初始场(IC试验),可能将模式误差混淆到初始场中去,从而对初始场进行错误的调整,同化2 h后高度场均方根误差值即可明显小于同化前。然而在同化结束时(t=6 h)却有较大的误差,由于起始的误差比较大,在实际预报阶段同化后的预报误差始终明显大于同化前,即同化后的效果反不如同化前。由此可见,模式有误差时传统的四维同化方法(仅修正初始场)有可能带来的影响。当然,这取决于模式误差的大小。现在的情况是一种极端的情况(初始场无误差),但它仍可说明,模式的误差可能在四维同化过程中混淆到初始场中去,尽管在同化期间可得到较好的拟合,但却不能保证同化后有好的预报。如果不修正初始场而修正模式,从图2可看到,在同化期间,高度场均方根误差始终小于同化前,在实际预报阶段,由于对模式作了修正,而且起始误差也比较小,所以在不足1 h后的预报效果明显好于同化前。这表明尽管实际的方程误差随时间变化,我们仍可以用一个定常的误差项来近似代替它,达到改善预报的目的。从图2还可看到,如果同时修正初始场和模式(ICME试验),反演的初始场均方根误差明显低于仅修正初始场的情况,同化后的效果也明显要好于同化前,而在实际预报阶段预报均方根误差值要大于仅修正模式所得的结果。

0211.gif (4473 bytes)

图 2 模式误差较小时同化前后高度场均方根误差随时间变化的比较
0~6 h为同化时段,6~12 h为预报时段;实线:同化前;点线:仅修正初始场;星号线:
仅修正模式;圆圈线:同时修正初始场和模式
Fig. 2 Temporal variation of the RMS errors of height fields over the assimilation period (from 0 to 6 h) and over a subsequent 6 h forecast(from 6 to 12 h) in the experiments by the model with lesser errors.Sol-
id line: without data assimilation,dashed line: IC experiment, dashed line with star: ME experiment,dashed line with circle: ICME experiment

  若取k=10,东西向的波数增加,风速增大,系统移动加快。这意味着在空间点上扩散项的值随时间变化增大,相应的模式误差随时间变化增大。由图3可看出,在同化期间,同化后效果有可能好于同化前,但在实际预报阶段的预报显然不如同化前。这表明当实际的方程误差随时间变化比较剧烈时,在修正模式时,若用一个定常的误差项来近似代替它,有可能会导致同化失败。

0212.gif (4461 bytes)

图 3 模式误差较大时同化前后高度场均方根误差随时间变化的比较
其余说明同图2
Fig. 3 The same as Fig. 2, but for in the experiments by the model with bigger errors

  在我们的试验中,实际的模式误差可以由扩散项计算出来,将其时间平均值和同化给出的模式误差比较,计算空间平均的相对偏差R,其定义为

g0212.gif (1525 bytes)        (10)

这里t0203.gif (106 bytes)h为同化给出的模式误差,t0211.gif (116 bytes)h为实际的模式误差(时间平均)值,R(u)和R(v)的定义与R(h)相类似。

  表1给出了在不同的模式误差情况下(k分别为4和10),同化给出模式误差和实际的模式误差(时间平均)的平均偏差R值。

表 1 模式误差不同时同化后给出的模式误差的空间平均相对偏差值
Table 1 The relative differences between the actual and retrieved space-mean model errors

  k R(u) R(v) R(h)
4 ME试验 0.84 0.75 0.57
ICME试验 0.65 0.64 0.47
10 ME试验 1.93 2.14 2.27
ICME试验 2.44 2.60 2.34
  由表1可以看出,在模式误差随时间变化较小时(k=4),如果仅修正模式,相对偏差值均小于1,表明同化给出的模式误差接近于实际的时间平均值。从图4给出的连续方程的实际误差(时间平均)和同化给出的方程误差空间分布图更可以清楚看到这两者的分布很一致。值得注意的是,尽管我们的试验中初始场无误差,ICME试验给出的模式误差更接近于实际的时间平均值。这表明,模式误差随时间变化的部分通过修正初始场得到补偿。但在模式误差随时间变化较大时(k=10)情况相反,表明这种情况对模式误差作定常假设是不适宜的。

0213.gif (18509 bytes)
0214.gif (7930 bytes)

图 4 k为4时连续方程的实际误差和
同化给出的方程误差空间分布
(a) 为实际误差(时间平均),(b) ME,(c) ICME模式
Fig. 4 The time-mean error in the continuity
equation. (a) actual value; (b) retrieved value
by ME experiment; (c) retrieved value by ICME
experiment (k=4)

4.2 模式与观测资料均有误差对四维同化过程的影响
  在实际数值预报中,观测资料总是有误差的,仍取k=4,这时由图5可以看出,如果仅修正初始场,同化1 h后高度场均方根误差即可明显小于同化前的均方根误差,但由于没有对模式进行修正,在实际预报阶段继续沿着原来的模式所作的预报还不如同化前。如果不修正初始场而仅修正模式,在实际预报阶段同化后的高度场预报误差始终低于同化前。而同时修正初始场和模式时,模式的误差可能在四维同化过程中混淆到初始场中去,使得反演的初始场误差要大于观测误差,但由于同时也对模式进行了修正,在一定程度上区分了观测误差和模式误差,从而同化后的效果要好于同化前。

0215.gif (5750 bytes)

图 5 观测资料与模式均有误差时同化前后高度场均方根误差随时间变化的比较
其余说明同图2
Fig. 5 The same as Fig. 2, but for in the experiments by the model with
errors and initial field with errors

 在同时修正初始场和模式误差时,尺度化因子的选取也影响着同化的结果。模式误差尺度化因子增大,初始场修正量很小,意味着更多地修正模式,同化后的结果和仅修正模式的情况相近,反之,则初始场修正量很大,意味着更多地修正初始场,同化后的结果和仅修正初始场的情况相近。在此,令初始场的尺度化因子不变,只改变模式误差尺度化因子,将前面所规定的模式误差尺度化因子称作标准值。表2给出了模式误差尺度化因子变化时初始时刻(t=0)、同化结束时刻(t=6 h)以及实际预报的第6小时(t=12 h)模式各要素场均方根误差的比较。当模式误差尺度化因子取为标准值的2倍时,高度场的初始时刻均方根误差值(5.50 m)减小,但风场的均方根误差值增大。在同化结束时和实际预报的第6小时的均方根误差值均小于标准值的情况。当模式误差尺度化因子减小为1/2或1/4,风场的均方根误差值增大,而且在实际预报阶段的6 h预报的均方根误差值均比取标准值时大。当模式误差尺度化因子增大4倍时,尽管风场的初始时刻均方根误差值略小于取为标准值时的情况,但在同化结束和实际预报的第6 h的均方根误差值均大于取为标准值时的情况。由此可看出,同时修正初始场和模式,尺度化因子的选取对同化后的结果有很大的影响。在试验中,我们可以找出最优的尺度化因子使得同化后的效果最好,但在实际应用中,如何选取尺度化因子是一个值得考虑的问题。

表 2 模式误差尺度化因子变化时同时修正初始场和模式后均方根误差值的比较
Table 2 The RMS errors for different scale factor of the error terms
in the mode in ICME experiments

时间(小时) 0 0 12
RMS(h)/m 标准值的1/4 6.11 4.51 8.79
标准值的1/2 5.27 2.12 3.81
标准值 5.56 2.96 3.09
标准值的2倍 5.50 2.27 2.90
标准值的4倍 5.90 4.17 4.40
RMS(u)/ms-1 标准值的1/4 0.43 0.47 0.98
标准值的1/2 0.27 0.21 0.43
标准值 0.22 0.19 0.36
标准值的2倍 0.25 0.18 0.34
标准值的4倍 0.22 0.24 0.43
RMS(v)/ms-1 标准值的1/4 0.57 0.63 1.35
标准值的1/2 0.29 0.27 0.62
标准值 0.23 0.24 0.48
标准值的2倍 0.23 0.23 0.48
标准值的4倍 0.20 0.27 0.55
5 小  结
  变分四维同化的主要思想是利用模式提供的信息来修正和弥补资料的不足,当模式存在较大误差时,则它可能提供一些错误的信息,对四维同化产生消极影响。尽管在四维同化中也可以修正模式,但由于模式误差的具体形式难以确定使得这一问题仍不能完全解决。我们的试验表明:当模式有误差时,传统的变分四维同化方法(仅修正初始场)可能将模式的误差混淆到初始场中,尽管在同化期间可得到较好的拟合,但不一定能保证同化后有好的预报,这取决于模式误差的大小。如果不修正初始场而修正模式,当模式误差随时间变化较小时,可用一个定常的误差项来近似代替它达到改善预报的目的。但模式误差随时间变化较大时,这种做法也可能失败。在同时修正初始场和模式时,同化后效果有可能好于仅修正模式和仅修正初始场的情况,但尺度化因子的选取对同化产生很大影响。在实际应用中,如何选取尺度化因子是一个值得考虑的问题。

注:国家自然科学基金(49375241)资助

作者简介:冯伍虎,男,1972年1月出生,博士研究生,主要从事中尺度数值模拟研究
  *本文联系人

作者单位:兰州大学大气科学系 甘肃省兰州市 730000

参考文献
1 Derber J C. A variational continuous assimilation technique. Mon Wea Rev, 1989,117:2437~2446
2 Zupanski M. A preconditioning algorithm for large-scale minimization programs. Tellus,1993,45A:478~492
3 W H 普雷斯,B P 弗拉内里等. 数值方法大全―科学计算的艺术. 兰州:兰州大学出版社,1991. 225~240
4 Grammeltvedt A. A survey of finite-difference schemes for the primitive equations for a barotropic field. Mon Wea Rev, 1969,97:384~404
5 Talagrand O. A study of the dynamics of four-dimensional data assimilation. Tellus,1981,33:43~60

收稿日期:1998-05-21;改回日期:1998-08-17