-全讯担保网
\documentclass[utf8]{csoarticle}
\newtheorem{theorem}{定理}
\newtheorem{lemma}{引理}
\renewcommand{\proofname}{证明}
% 如果为英文文章,可以使用下面的定义(去除行首的注释符号%)代替上述中文定义
% \newtheorem{theorem}{theorem}
% \newtheorem{lemma}{lemma}
\usepackage{graphicx}
\usepackage{epstopdf}
\usepackage{amssymb}
\usepackage{booktabs}
\usepackage{makecell}
\begin{document}
%----------------------------------------------------------
% 1. 文章标头信息
%----------------------------------------------------------
\titlechn{基于去趋势波动分析的中国气温变化趋势研究}
\titleeng{trend analysis of the temperature variation in china based on detrending fluctuation analysis}
\authorchn{李文菁\affil{1},余冬玲\affil{1},周煜\affil{1}}
\authoreng{li wen-jing san-feng\affil{1}, yu dong-ling\affil{1}, zhou yu\affil{1}}
\affiliationchn{
\affil{1} 湘潭大学数学与计算科学学院,湘潭 411105
}
\affiliationeng{
\affil{1} school of mathematics and computer science, xiangtan university, xiangtan 411105
}
\abstractchn{全球变暖这一现象近年来受到广泛关注,对全球气候变化的趋势研究逐渐成为气候学家关注的焦点。传统的趋势分析大多直接应用线性回归法来计算,但是这种检测方法假设序列本身是不相关或者一阶相关的。在现实数据中,特别是气候数据常常是长程相关的。在这种情况下,直接使用线性回归分析是不合适的。本文选取了我国590 个气象观测站的近46年的气温数据作为研究对象,应用去趋势波动分析法(detrended fluctuation analysis) 来分析序列的长程相关性以及其对气温的变化趋势的影响:590 个站点中有415个站点的趋势是不显著的。然而,线性回归方法则只有85个站点估计出来的趋势是不显著的。两者之间的差异源于线性回归法没有考虑长程相关性的影响。我们进一步研究了在长程相关性存在时的最可能趋势。我们发现,如果不考虑长程相关性而仅使用线性回归估计趋势会显著高估趋势。考虑到长程相关性在现实数据中的普遍性,趋势研究时必须将其考虑在内。我们的分析为这类情况提供了一般研究框架。}
\abstracteng{as globing warming has raised increasing concern in these years, research on trends in climate has become a hot topic. usually, the linear regression is employed for trend analysis. this detection method works on the basis of an assumption that the series is just first-order correlated or uncorrelated at all. however, in the real-life data, especially in the climatic data, e.g. the temperature data, there generally exists long-term correlation. therefore, the direct application of the linear regression analysis is inappropriate. this study employs detrended fluctuation analysis to investigate trends in temperature data in 590 meteorological stations of china in recent 46 years. the result shows that 415 stations out of 590 have insignificant trends. in contrast, only 85 stations display insignificant trends if using the traditional linear regression. such difference should be due to the effect of long-term correlation. furthermore, we try to calculate the most possible trend in the long-term correlated temperature data. our anlaysis demonstrates that the traditional linear regression method, which does not take long-term correlations into account, would significantly overestimate the trend in observed data. therefore, the effect of long-term correlation has to be taken into consideration in trend analysis of the real-life data. our analysis provides a general framework for the trend analysis of long-term correlated data.}
\keywordchn{长程相关性;去趋势波动分析;气温序列;趋势;显著性。}
\keywordeng{long-term correlation;~detrended fluctuation analysis;~temperature series;~trend;~significance.}
\cateidchn{o29}
\authorintroduction{李文菁(1990-),女,硕士,主要研究方向:时间序列分析。余冬玲(1993-),女,硕士,主要研究方向:生物信息与时间序列。通信作者:周煜(1982-),男,博士,副教授,主要研究方向:非线性时间序列分析以及应用。}
\fund{教育部博士点新教师基金(20124301120004)}
\maketitle
%----------------------------------------------------------
% 2. 正文内容
%----------------------------------------------------------
\section{引言}
气候系统作为一个十分复杂的非线性系统,包含了多圈层和多尺度子系统之间的相互作用\cite{bib1}。上个世纪以来,地球气候发生了非常明显的变化,即全球性变暖,全球变暖这一名词被大家广泛提及,逐渐成为气候学家们关注的焦点。我国地处亚洲东部,幅员辽阔、气候类型多样,对亚洲乃至全球气候系统有着重要的影响。而气温是最基础的气象要素之一,如果温度持续走高,会导致气象灾害频发、生物链被破坏、致病菌快速传播,人类将面临巨大的生存挑战。对气温变化的分析能帮助人类在生产、生活各方面作出合理规划与科学决策,所以研究我国气温变化趋势关系到国计民生,其重要性不容忽视。
近年来,很多专家、学者致力于研究全球气候的变化,第四次ipcc会议报告\cite{bib2} 指出,从1906年到2005年,全球的平均地表温度上升了0.74±0.18$^\circ$c。魏
凤英等\cite{bib3}应用均值差异的假设检验法对中国、北半球乃至整个全球的气温序列的突变现象进行了实例研究,结果表明突变曲线存在着明显的周期性。郭志梅等\cite{bib4}对上世纪80年代中后期中国北方地区的日平均气温及日最高、最低气温进行了研究,研究发现它们大多都发生了一次明显的变暖突变。于淑秋\cite{bib5}应用我国近50年的日平均气温数据来分析生长季节及有效积温的变化趋势,结果表明,除了少部分地区外,生长季节增长,有效积温上升。丁一汇\cite{bib6}等对近百年来中国地表温度和大气温度的变化特征、中国气候变化的原因等方面进行了研究,对未来需要加强研究的问题提出了建议。多年以来的研究结果表明\cite{bib7,bib8,bib9},气候系统不是由单一的气温变量控制,它还受由风速、相对湿度等多变量控制。人们也意识到气候系统具有长程相关性\cite{bib10},表现为热天之后更可能是热天而不是冷天,干旱年后续更可能是干旱年而不是洪涝年。然而复杂的气候系统的信号绝大部分都是非平稳的,也就意味着它的均值、方差、标准差和自相关函数等都会随着时间的变化而变化。我们知道,传统的功率谱分析和相关分析适用于平稳信号,这时这些方法均不适用了,我们需要引进新的方法来分析非平稳信号。本文所要使用的去趋势波动分析法(detrendend fluctuation analysis,dfa)是一种用来研究时间序列长程相关性的有效方法,被广泛应用于物理学\cite{bib11,bib12,bib13}、 经济学\cite{bib14,bib15,bib16,bib17,bib18}、气象学\cite{bib7,bib8,bib9,bib19,bib20,bib21,bib22}、 生物学\cite{bib23}、 医学\cite{bib24,bib25} 等领域,并取得了许多研究成果。尤其在气象领域,不断有学者将其应用于气温及降水变化特征研究\cite{bib8,bib9,bib22}、 气候动力突变检测\cite{bib20}、 极端事件的阈值判断\cite{bib19,bib21} 等方面。在我国,陈莹\cite{bib7} 等应用多重分形去趋势波动分析法分析了长江中下游地区59 个站点1960 年至2002 年日均温度序列及其增幅、增向序列的标度特征,并探讨其温度变化的多重分形特征。江田汉等\cite{bib8} 应用去趋势波动分析法来研究中国、北半球和全球140 年(中国气温数据年限为1865 年至2002 年,北半球及全球气温数据年限为1856 年至2002 年)气温变化的长程相关性。郑祚芳等\cite{bib9} 应用去趋势波动分析法研究了北京地区1870 年至2003年的气温序列及1725 年至2003 年降水序列的长程相关性。何文平等\cite{bib20}在去趋势波动分析法的基础上创造性地提出了新的动力学结构突变检测法-- 滑动去趋势波动分析(moving detrended fluctuation analysis,mdfa),并将其应用于中国西沙站1960年至2005年日地表极端最高温度的动力结构突变研究中,展现了该方法的巨大实用价值。杨萍等\cite{bib21} 提出应用去趋势波动分析法确定极端事件的阈值,并将其应用于北京地区极端高、低温事件及极端降水事件的研究中,确定了北京地区1951年至2004年极端高、低温事件和极端降水事件的阈值。封国林等\cite{bib19}应用去趋势波动分析法对lorenz系统在一定阈值条件下的极端事件的长程相关性进行了研究,并对北京站和南京站1957年至2004年的日最高温数据进行了分析,结果表明,在某阈值条件下这两个站点的极端事件的时间序列都具备长程相关性。
本文在去趋势波动分析基本理论的基础上,应用其对中国590个站点的日最高气温进行长程相关性研究。研究气温的长程相关性能够帮助我们更深入地了解气温序列的相关性质。长程相关性的重要性还表现在它是真实数据产生过程中表现出来的特性,而不仅仅只是某个样本区间的性质,如果在时间序列内的长程相关性是稳定的,那么可以就此来推测它所显露出来的系统信息,这样,我们在进行分析时,可以处理一条很长的序列,并且在序列长度趋近于$\infty$ 时,同样能保持结果的稳定性。既然我们知道气温序列是长程相关的,那么就有必要也必须把由这一因素带来的内部趋势考虑进来,进而得到导致中国城市气温上升的原因究竟是气候系统由于长程相关性导致的内部趋势的影响,还是更可能是由于人类活动造成的外部趋势的所带来的影响,从而对全球变暖成因作出更合理的推断。为了更清楚地了解、认识气温序列的内在波动行为以及分析它的长程相关性,我们必须分辨出序列中那些源于内部波动带来的内部趋势部分。而由外界因素带来的外部趋势成分的部分,我们通常认为它是光滑的或者是缓慢震荡的。在气温序列中,我们并不知道在原始数据的趋势中两种趋势所占的比例,相比内部趋势,我们更加关心外部趋势,它对我们日后的生产生活有指导性意义。而dfa 方法能很好的滤去外部趋势,方便我们研究长程相关性带来的内部趋势对于趋势估计的影响。传统的趋势估计多采用线性回归,而这种方法没有考虑长程相关性带来的内部趋势的影响,高估了外部趋势,会造成误判。
\section{方法}
\subsection{长程相关性}
长程相关性(long-term dependence~或~long-range dependece)又称长记忆性(long memory~ 或~long-term memory)或持久性(persistence)。
长程相关性是指若序列$\left\{ {{x_t}} \right\}$($t= 1,2, \cdots ,n$),${x_t}$之间存在自相关性,则未来的
${x_{t 1}}$的发生与当前的${x_t}$与过去的${x_{t - 1}}$,${x_{t - 2}}$,……有关,$\left\{ {{x_t}} \right\}$的全过程存在某种持续性.
\par
具体来说\cite{bib19},对于一个平稳时间序列$\left\{ {{x_t}} \right\}$ ($t= 1,2, \cdots ,n$),滞后时间长度为$s$的自相关函数为
\[c\left( s \right) = \frac{1}{{n - s}}\sum\limits_{t = 1}^{n - s} {\left( {{x_t} - \bar x} \right)\left( {{x_{t s}} - \bar x} \right)} \]
其中$\bar x$为序列的平均值,
\par
(1)如果$s > 0$,若$c\left( s \right) = 0$,则${x_t}$是不相关的;
\par
(2)如果$c(s)\sim \exp(s/s_{x})$,${s_x}$为衰减时间,则${x_t}$是短程相关的;
\par
(3)如果$c\left( s \right)\sim{s^{ - \gamma }}$,($0 < \gamma < 1$),即$c(s)$是幂律下降的,则${x_t}$是长程相关的。
\par
由于长程相关性的研究对象通常叠加了噪声和趋势,所以很难直接计算其长程相关指数$\gamma$,这时需要我们采用间接计算。
对于具有长程相关性的序列,长程相关指数$\gamma$与hurst指数$h$之间存在着下列关系
\[h = 1 - {\gamma \mathord{\left/ {\vphantom {\gamma 2}} \right. \kern-\nulldelimiterspace} 2},~~~~0 < \gamma < 1\]
\par
(1)当$h = {1 \mathord{\left/ {\vphantom {1 2}} \right. \kern-\nulldelimiterspace} 2}$ 时, 意味着时间序列是不相关的,表示的是一个独立的随机过程,也就是说无论当前状态如何都不会对将来的结果造成影响;
\par
(2)当${1 \mathord{\left/ {\vphantom {1 2}} \right. \kern-\nulldelimiterspace} 2} < h < 1$时,意味着时间序列具有长程相关性,即如果时间序列在某一段时间内呈上升(下降)趋势,则下一段时间内也呈上升(下降)趋势,且$h$越大,相关性也越强;
\par
(3)当$h < {1 \mathord{\left/ {\vphantom {1 2}} \right. \kern-\nulldelimiterspace} 2}$
时,意味着时间序列具有负相关性,即如果时间序列在某一段时间内呈上升(下降)趋势,则下一段时间内也呈下降(上升)趋势。
\subsection{去趋势波动分析法}
\par
随着分形理论在各领域的盛行与推广,很多基于分形理论的研究方法纷纷涌现,例如谱分析法,r/s 分析法等。然而,现实生活中的各类数据往往
含有噪声,因此,这类数据或多或少会有部分或线性或非线性的趋势成分存在,消除这些趋势带来的影响是十分必要的。如果不消除这些趋势成
分会结果的分析造成干扰,不能真实的揭示趋势。相比r/s分析法,dfa方法能有效地解决这个问题。所谓的去趋势波动分析就是先去掉序列
中由外部因素引起的趋势,再研究序列的长程相关性。去趋势波动分析能消除各阶趋势成分,很好地处理那些具有长程相关性且非平稳的时间序
列,消除其中的伪相关现象,避免相关性的错误判断。本文正是基于去趋势波动分析法来研究中国气温变化趋势。
\par
dfa方法最先是由peng等\cite{bib26}学者于1994年研究dna分子链结构时提出的。在随后的2001年,weron\cite{bib27}对gauss白噪声序列分别使用了r/s分析、
dfa方法、周期图回归法这三种方法去计算其长程相关性程度,最终认为dfa 方法较其他两种方法而言有着明显的优势。
2002年,kantelhardt等\cite{bib28,bib29}学者结合多重分形理论,改进和完善了dfa方法,首次提出了多重分形去趋势波动分析
(multifractal detrendend fluctuation analysis,mf-dfa),
用来描述时间序列在不同时间标度下多重分形的特征。下面将简单介绍dfa 方法。
\par
对于给定的时间序列
$x\left( t \right)$($t = 1,2, \cdots ,n$),其计算步骤如下\cite{bib26}:
\par
(1)计算$x\left( t \right)$($t = 1,2, \cdots ,n$)的累计离差
\[y\left( i \right) = \sum\limits_{t = 1}^i {\left( {x\left( t \right) - \overline x } \right)},~~~~i = 1,2, \cdots ,n\]
其中$\overline x = \frac{1}{n}\sum\limits_{t = 1}^n {x\left( t \right)}$。
\par
(2)将$y\left( i \right)$分割成长度为$s$的${n_s}$个互不相交的区间,其中${n_s} = {\mathop{\rm int}} \left( {{n \mathord{\left/
{\vphantom {n s}} \right. \kern-\nulldelimiterspace} s}} \right)$。 考虑到序列长度$n$不一定总是$s$的整数倍,为了充分利用数据,避免丢失尾部数据信息,
使$y\left( i \right)$全部数据进入计算,对$y\left( i \right)$按$i$ 由小到大和由大到小进行两次分割,得到${2n_s}$个子区间。
\par
(3)对于每一个区间$v$($v = 1,2, \cdots ,2{n_s}$)内的$s$个点,使用最小二乘法进行多项式拟合,得到拟合方程
\[{y_v}\left( i \right) = {a_0} {a_1}i {a_2}{i^2} \cdots {a_k}{i^k},~~~i = 1,2, \cdots ,s,~~~k = 1,2, \cdots \]
\par
一般限定$\max \left\{ {k 2,10} \right\} \le s \le {n \mathord{\left/ {\vphantom {n 4}} \right. \kern-\nulldelimiterspace} 4}$。
拟合过程可以采用线性、二次、三次或更高阶多项式来拟合,相应地,被记为dfa1、daf2、dfa3和高阶dfa。
\par
(4)计算均方误差${f^2}\left( {v,s} \right)$
\par
当$v = 1,2, \cdots ,{n_s}$时,
\[{f^2}\left( {v,s} \right) = \frac{1}{s}\sum\limits_{i = 1}^s {{{\left\{ {y\left[ {\left( {v - 1} \right)s i} \right] - {y_v}\left( i \right)} \right\}}^2}}\]
\par
当$v = {n_s} 1,{n_s} 2, \cdots ,2{n_s}$时,\[{f^2}\left( {v,s} \right) = \frac{1}{s}\sum\limits_{i = 1}^s {{{\left\{ {y\left[ {n - \left( {v - {n_s}} \right)s i} \right] - {y_v}\left( i \right)} \right\}}^2}}\]
\par
(5)对${2n_s}$个区间,求${f^2}\left( {v,s} \right)$的均值,得波动函数$f\left( s \right)$
\[f\left( s \right) = {\left\{ {\frac{1}{{2{n_s}}}\sum\limits_{v = 1}^{2{n_s}} {\left[ {{f^2}\left( {v,s} \right)} \right]} } \right\}^{{1 \mathord{\left/
{\vphantom {1 2}} \right. \kern-\nulldelimiterspace} 2}}}\]
\par
(6)若时间序列$x\left( t \right)$具有长程相关性,则$f\left( s \right)$ 与$s$ 满足幂律关系
\[f\left( s \right) \sim {s^h}\]
\par
对于每一个$s$,求得其对应的$f\left( s \right)$,使用最小二乘法对$\ln(f(s))\sim h\ln(s)$ 进行拟合,得到的斜率值$h$与hurst指数$h$有如下关系:
\par
(1)若序列为平稳序列,则$h=h$;
\par
(2)若序列为非平稳序列,则$h=h-1$。
\section{结果}
\subsection{数据}
\par
本文的气温数据来源于中国气象局国家气候中心。我们从中选取了590个中国站点从1960年1 月1日至2005年12 月31日近46年来每日最高气温的日值序列作为研究对象。在趋势显著性中,我们使用到了全部590个站点。在后续的趋势推理中,我们选取了我国五大典型气候的代表站点,分别
是温带季风气候代表城市天津(气象观测站坐标:117.07$^{\circ}$e,39.08$^{\circ}$n)、温带大陆性气候代表城市呼和浩特(气象观测站
坐标:111.68$^{\circ}$e,40.82$^{\circ}$n)、亚热带季风气候代表城市南京(气象观测站坐标:118.8$^{\circ}$e,32$^{\circ}$n)、热带季风气候代表城市海
口(气象观测站坐标:110.35$^{\circ}$e,20.03$^{\circ}$n)、高原山地气候代表城市西宁(气象观测站坐标:101.75$^{\circ}$e,36.72$^{\circ}$n)。
\subsection{数据分析}
\subsubsection{预处理}
\par
montanari\cite{bib31,bib32}的研究表明,时间序列的周期性波动会对结果的分析带来非常明显的影响,是不容忽视的。因此,在对气温序列开始分析之前,要对其进行预处理,即消除周期性
波动的影响,以增加分析的准确度。
\par
对于每个站点的气温序列${t_i}$($i = 1,2, \cdots,16790$),有\[{t_i} = {x_i} {y_i} {z_i}\]
其中$x_i$表示噪声成分,$y_i$表示趋势成分,$z_i$表示周期成分。我们可以通过下列式子消除周期成分,使得${\omega _i} \simeq {x_i} {y_i}$
\[{\omega _i} = {t_i} - {\left\langle t \right\rangle _i}\]
其中,${\left\langle t \right\rangle _i}$ 表示每年第$i$天的平均值。该预处理过程被证明\cite{bib33,bib34}是一种简单有效去除周期性趋势的方法。以天津站点为例,我们用绘制出dfa2和dfa0预处理前后的图形(如图1和图2所示),做一个简单的比较。
\begin{figure}[!h]
\centering
\includegraphics{tj_x_dfa2_dfa0.png}
\caption{未经预处理的原始气温序列的dfa2与dfa0曲线(天津站)}
\end{figure}
\begin{figure}[!h]
\centering
\includegraphics{tj_x_detrend_dfa2_dfa0.png}
\caption{消除周期成分后的dfa2与dfa0曲线(天津站)}
\end{figure}
通过这两幅图,我们可以明显地看出图1中的曲线存在分段现象,曲线被分成了两个部分。这一现象说明气温序列受年周期影响明显,我们必须去除周期性。
我们可以很明显地看到,在消除周期性波动后的图2变得更加光滑,这说明用该方法消除周期性成分是合适的。
\subsubsection{长程相关性效应}
\par
一般来说,人们把全球变暖的原因归结于人口膨胀、过度砍伐、焚烧燃料等人为因素,而忽视了包括大气圈、水圈
太阳辐射等自然因素的影响。问题是,有多少变暖的因素是来自系统内部长程相关性导致的自然
因素,有多少是来自系统外部的人为因素呢?我们知道,传统的线性回归法会把所有表现出来的趋势归结于外部趋
势而不加以区分,不考虑长程相关性的存在可能会影响趋势的估计。为了解决这一问题,我们首先要检验气温时
间序列的长程相关性,计算步骤如下\cite{bib35}:
\par
(1)对这590个站点,在其原始气温序列(已作预处理,以下简称原始序列)上作用dfa2和dfa0(其中2和0是指局部区间作最小二乘拟合时多项式的次数),得
到对应的$\alpha_{2}$和$\alpha_{0}$。
\par
(2)通过线性回归求得每个站点的原始序列的线性趋势$a$(单位为$^\circ$c/100年,下同),以及显著性水平为$\alpha$的置信区间,这里我们取$\alpha=0.05$。
\par
(3)利用傅立叶滤波法(fourier filtering method,ffm)生成与原始序列有相同长度($n=16790$)、相同长程相关性程度(以$\alpha_{2}$度量)、相同标准差
的人工序列,这里我们对于每个站点各生成了500条序列。
\par
(4)对每个站点的500条人工序列再次通过线性回归求得斜率$a'$,进而得到$a'$ 的概率密度图,通过取$\alpha/2$和$1-\alpha/2$分位数可以得到显著性水平
为$\alpha$的置信区间,这里同样取$\alpha=0.05$。
\par
(5)判断原始序列的斜率$a$有多少个落在其对应的置信区间里。
\par
我们知道,利用傅立叶滤波生成的人工序列是不含有外部趋势的,因此其表现出来的趋势是来自于长程相关性带来的内在波动。如图3所示,长程相关性的存在会对置信区间造成影响,图中红色曲线是含有长程相关性的,可以明显看出它的置信区间比不含有长程相关性的蓝色曲线宽得多,这是因为长程相关性会增加估计的趋势的不确定性,表现为方差增大,也就导致置信区间变宽。如果原始序列的$a$落在了(4)所得到的置信区间之外,说明原始序列的趋势极有可能超出了长程相关性的内部趋势的部分,还应该有人为因素带来的外部趋势。如果原始序列的$a$落在的区间内,则可以认为外部趋势并不显著。
\begin{figure}[!h]
\centering
\includegraphics[scale=0.7]{effect_lrc_trends.png}
\caption{长程相关性与置信区间}
\end{figure}
通过计算,我们发现,590个站点中有415个站点的$a$是落在置信区间里的。也就是说,有超过70\%的站点的结果表明外部趋势是不显著的。然而,使用线性回归方法只有85个站点($14\%$)估计出来的趋势是不显著的。这两者之间的差异是源于线性回归法没有考虑长程相关性带来的影响。这样,以往人们习惯性地将全球变暖归因于人类的各种生产、生活行为的思想是不严谨的,人们过分夸大了人类的影响,而忽视了气候系统内部的作用。
\section{讨论}
\par
图3的结果表明,气温序列的长程相关性的影响不容忽视,那么,我们在分析趋势时,要把长程相关性考虑在内,不能单纯地采用线性回归来估计趋
势。我们选取了天津、呼和浩特、南京、海口、西宁这5个城市作为代表来进一步的分析它们的变化趋势,其计算步骤如下\cite{bib35}:
\par
(1)对这5个站点,在其原始气温序列上作用dfa2和dfa0,得到对应的$\alpha_{2}$ 和$\alpha_{0}$,以及通过线性回归得到对应的线性趋势$a$。
\par
(2)利用傅立叶滤波法生成与原始序列有相同长度、相同长程相关性程度、相同标准差的人工序列,这里我们对于每个站点各生成了200条序列。
\par
(3)对这200条人工序列作用dfa2得到对应的$\alpha'_{2}$,由于生成过程中会产生误差,人工序列的$\alpha'_{2}$不会完全和原始序列的$\alpha_{2}$相同,
所以我们选取满足:$\alpha_{2}'\in(\alpha_{2}-\delta,\alpha_{2} \delta)$ (这里$\delta$ 取0.02,研究表明\cite{bib36},$\delta$取值在0.01至0.05之间对结
果的影响差别不大,不失一般性,我们取$\delta=0.02$)的$k$条人工序列。
\par
(4)对(3)中选取的$k$人工序列叠加上斜率为$a$的线性趋势,进行dfa0 分析,得到对应的$\alpha'_{0}$。
\par
(5)我们选取满足以下条件的$k'$条人工序列:
\par
(i)$\alpha_{0}'\in(\alpha_{0}-\delta,\alpha_{0} \delta)$;
\par
(ii)重新估计得到的线性趋势$a'$与原始序列的$a$有相同的符号,即$sgn(a')=sgn(a_{0})$。
\par
(6)选取不同$a$,重复(4)、(5)步。
\par
对于不同的$a$都会有一个$k'$值与之对应,我们可以得到$k'$关于$a$的直方图,正规化后,我们可以得到相应的概率密度函数曲线图(如图4所示)。最
可能的趋势值$a$会在$p(a)$取最大值时取得,我们称这时的$a$为典型值,记作$a_{typ}$。
\begin{figure}[!htbp]
\centering
\includegraphics[width=0.45\textwidth]{tj.eps} \includegraphics[width=0.45\textwidth]{hhht.eps}\\
\includegraphics[width=0.45\textwidth]{nj.eps} \includegraphics[width=0.45\textwidth]{hk.eps}\\
\includegraphics[width=0.45\textwidth]{xn.eps}
\caption{天津,呼和浩特,南京,海口,西宁概率密度曲线}
\label{fig4}
\end{figure}
\newpage
通过上图我们发现,天津站点的$a_{typ}=0.9621$,呼和浩特站点的$a_{typ}=1.3216$,南京站点的$a_{typ}=0.5426$,海口站点的$a_{typ}=1.0546$,西宁
站点的$a_{typ}=1.6287$。每个站点的$a_{typ}$均出现在$x$轴的正半轴上,这是因为在(5)步中我们要求选取了同增的序列。
\par
接下来我们通过$p(a)=\int_{-\infty}^{a}p(a)da$得到趋势小于$a$的累积概率分布。通过取$p(a)=0.025$和$p(a)=0.975$得到$a$的
显著性水平为0.05的置信区间。
\par
为了便于比较本节使用的方法与传统线性回归的方法的区别,绘制了一张表格(如表1所示),表格的左侧为我们通过叠加线性趋势拟合出来的结果,右侧为未考虑长程相关性而直接采用传统线性回归得到的结果,其中$a_{typ}$为最可能的趋势
值,$a_{0.975}$和$a_{0.025}$分别是置信水平为95\%的上、下置信限。通过表1我们发现,天津站点的置信区间为(-1.7036,3.6279),呼和浩特站点的置信区间为(-2.0823,4.7255),南京站点的置信区间为(-1.8375 ,2.9228),海口站点的置信区间为(-1.2231,3.3322),西宁站点的置信区间为(-1.1185,4.3759)。表格中所有数值的单位均为$^\circ$c/100年,保留到小数点后两位。
\begin{table}[!h]
\caption{结果对比}
%\label{tab:sample}
\centering
\begin{tabular}{ccccccc}%{|l|c|r|}
\hline
&\multicolumn{3}{c}{本文的方法} &\multicolumn{3}{c}{线性回归法}\\
站点 &$a_{0.025}$ &$a_{typ}$ &$a_{0.975}$ &$a_{0.025}$ &$a_{typ}$ &$a_{0.975}$\\
\hline
天津 & -1.7036 & 0.9621 & 3.6279 & 2.1236 & 2.5365 & 2.9495 \\
呼和浩特 & -2.0823 & 1.3216 & 4.7255 & 2.6463 & 3.1104 & 3.5746\\
南京 & -1.8375 & 0.5426 & 2.9228 & 0.7013 & 1.1306 & 1.5599 \\
海口 & -1.2231 & 1.0546 & 3.3322 & 1.3066 & 1.6739 & 2.0411 \\
西宁 & -1.1185 & 1.6287 & 4.3759 & 2.5706 & 2.9570 & 3.3434 \\
\hline
\end{tabular}\label{tab1}
\end{table}
通过表1我们发现,本文使用的方法估计出来的外部趋势(以$a_{typ}$度量)明显小于传统线性回归估计出来的趋势,天津站点被高估了163.63\%,呼和浩特站点被
高估了135.35\%,南京站点被高估了108.36\%,海口站点被高估了58.73\%,西宁站点被高估了81.56\%。高估的部分主要来自于长程相关性带来的内部趋势。本文的方法得到的置信区间比线性回归法得到的宽,且包括了0 点,也就是说明趋势是不显著的,而线性回归法得到的置信区间显示趋势是显著的。这两者之间的差异源于线性回归法没有考虑长程相关性的影响,把所有表现出来的趋势都归结于外部趋势而不加以区分,造成了误判。也就表明以往人们把全球变暖完全归结于人类活动的影响是偏颇的,在今后的工作中我们还需要更进一步地研究内、外部因素的主导地位,这个发现使得本次研究有了现实意义。
\section{结论}
\par
在文章的最后,我们总结一下本文的结论,存在的不足以及有待进一步探索、讨论的问题。
\par
结论:
\par
(1)本文选取了590个中国站点从1960年1月1日至2005年12月31日近46年来的日最高气温的日值序
列作为研究对象,利用dfa方法对该日值序列进行了长程相关性检验。结果表明,有超过70\% 的站点的长程相关性带来的内部趋势是显著的,这个结果表明气候系统的内在波动
带来的影响是不可忽视的,过去人们单纯地把序列表现出来的趋势归因于外部因素而不考虑系统的内部因素是偏颇的,是有失公正的。
\par
(2)再进一步做趋势分析时,选取了我国5个有代表性的城市的气象观测站的数据,分别是天津、呼和浩特、南京、海口、西
宁如图1),分别代表温带季风气候、温带大陆性气候、亚热带季风气候、热带季风气候、高原山地气候。针对这5个城市,分别对其趋势进行研究。结果表明,采用传统线性回归得到的趋势忽略了长程相关性带来的内部趋势的影响而显著地高估了外部趋势。进一步说
明了长程相关性对趋势估计是有影响的,在分析趋势时必须将其考虑在内,以免造成误判。
\par
\par
存在的不足:
\par
(1)本文所选择的算法以及代码运算需时太长,对于运算的加速的改进是有必要的。
\par
(2)本文仅对截止到2005年12月31日中国气温数据进行了分析,并未涉及到更近年份的数据,也未涉及到国外的数据,没有对全球的气温数据进行分析,具有局限性。
\par
以上存在的2个不足都是有待进一步完善的,接下来我们可以做的是:收集更多地区、更近的气温数据,在计算时增大人工序列的组数来改进算法,使结果更加稳定。还可以在本文
的基础上继续讨论导致气温上升的外部因素与内部因素谁占据主导地位。
\begin{thebibliography}{35}
\bibitem{bib1}丑纪范. 大气科学中非线性与复杂性研究的进展[j]. 中国科学院院刊, 1997,33(5):325-329.
chou jifan. advances in nonlinear and complex studies in atmospheric science [j]. bulletin of chinese academy of sciences , 1997, 32(5):325-329.(in chinese)
\bibitem{bib2}ipcc. summary for policymakers of climate change 2007: the physical science basis. contribution of working
group i to the fourth assessment report of the intergovernmental panel on climate change. cambridge:
cambridge university press, 2007.
\bibitem{bib3}wei f y, cao h x. detection of abrupt changes and trend prediction of the air temperature in china, the northern hemisphere and the globe[j]. scientia atmospherica sinica, 1995(2):140-148.
\bibitem{bib4}郭志梅,缪启龙,李雄. 中国北方地区近50年来气温变化特征及其突变性[j]. 干旱区地理,2005,28(2):176-182.
guo zhimei , miao qilong , li xiong. change characteristics of temperature in north china since recent 50 years[j]. arid land geography, 2005, 28(2):176-182.(in chinese)
\bibitem{bib5}于淑秋. 近50年我国日平均气温的气候变化[j]. 应用气象学报,2005,16(6):787-793.
yu shuqiu. the change of daily temperature during recent 50 years in china[j]. journal of applied meteorological science, 2005, 16(6):787-793.(in chinese)
\bibitem{bib6}丁一汇, 王会军. 近百年中国气候变化科学问题的新认识[c]. 第32届中国气象学会年会特邀报告. 2015.
ding yihui, wang huijun. new understanding on scientific issues of climate change in china in recent 100 years [c]. special invitation report of the 32nd annual meeting of china meteorological society. 2015.(in chinese)
\bibitem{bib7}陈莹,许有鹏,尹义星. 长江中下游地区20世纪60年代以来气温变化的标度特征[j]. 南京大学学报:自然科学版,2008,44(6):683-690.
chen yin, xu youpeng, yin y x. scaling behavior of atmospheric temperature change since the 1960s in the middle and lower reaches of the yangtze river[j]. journal of nanjing university(natural sciences), 2008, 44(6):683-690.(in chinese)
\bibitem{bib8}江田汉,邓莲堂. 近140年中国、北半球和全球气温的标度律[j]. 高原气象,2005,24(3):410-414.
jiang tianhan, deng liantang. scaling laws of temperature anomaly over global, northern hemisphere, and china in recent 140 years[j]. plateau meteorology, 2005, 24(3):410-414.(in chinese)
\bibitem{bib9}郑祚芳,曹晓彦,曹鸿兴,等. 北京市气温和降水的长程变化特征[c]. 中国气象学会2005年年会论文集. 2005.
zheng zuofang, cao xiaoyan, cao hongxing, et al. characteristics of long-term changes in temperature and precipitation in beijing [c]. proceedings of the 2005 annual meeting of the china meteorological society. 2005.(in chinese)
\bibitem{bib10}shukla j. predictability in the midst of chaos: a scientific basis for climate forecasting[j]. science, 1998, 282(5389):728-31.
\bibitem{bib11}廖孝勇. 浮动车交通参数检测及在道路交通状态分析中的应用研究[d]. 重庆:重庆大学,2011.
liu xiaoyong. traffic parameter detection of floating vehicle and its application in road traffic state analysis [d]. chongqing: chongqing university, 2011.(in chinese)
\bibitem{bib12}孙斌,许明飞,周云龙. 气液两相流波动信号多重分形去趋势波动分析[j]. 工程热物理学报,2011,32(5):795-798.
sun bin, xu mingfei, zhou yunlong. multi-fractal detrended fluctuation analysis of fluctuation signal of gas-liquid two-phase flow[j].
journal of engineering thermophysics, 2011, 32(5):795-798.(in chinese)
\bibitem{bib13}吴建军,徐尚义,孙会君. 混合交通流时间序列的去趋势波动分析[j]. 物理学报,2011,60(1):800-806.
wu jianjun, xu shangyi, sun huijing. state key laboratory of rail traffic control and safety, university b j, beijing. detrended fluctuation analysis of time series in mixed traffic flow[j]. acta physica sinica chinese edition, 2011, 60(1):800-806.(in chinese)
\bibitem{bib14}ausloos m. statistical physics in foreign exchange currency and stock markets [j]. physica a statistical mechanics \& its applications, 2000, 285(s1-2):48-65.
\bibitem{bib15}jánosi i m, janecskó b, kondor i. statistical analysis of 5 s index data of the budapest stock exchange[j]. physica a statistical mechanics \& its applications, 1999, 269(1):111-124.
\bibitem{bib16}施锡铨,艾克凤. 股票市场风险的多重分形分析[j]. 统计研究,2004,21(9):33-36.
shi xiquan, ai kefeng. multiple fractal analysis of stock market risk [j]. statistical research, 2004,21(9):33-36.(in chinese)
\bibitem{bib17}许林, 宋光辉, 郭文伟. 基于滑动窗口mf-dfa的股票风格资产收益多重分形分析[j]. 系统工程理论与实践, 2012, 32(9):1891-1899.
xu lin, song guanghui, guo wenwei. multifractal analysis on stock style asset returns based on sliding windows mf-dfa[j]. xitong gongcheng lilun yu shijian/system engineering theory \& practice, 2012, 32(9):1891-1899.(in chinese)
\bibitem{bib18}严中奇,徐力群,沈振中,等. 基于r/s方法的拱坝变形监测资料分析及性态评估[j].水能电源科学,2015,34(10):54-57.
yan zhongqi, xu liqun, shen zhenzhong, et al. analysis of deformation monitoring data and assessment of sexual state of arch dam based on r/s method [j]. water resources and power, 2015, 34(10):54-57.(in chinese)
\bibitem{bib19}封国林,王启光,侯威,等. 气象领域极端事件的长程相关性[j]. 物理学报,2009,58(4):2853-2861.
bibitem{bib19}feng guolin, wang qiguang, hou wei, et al. long-range correlation of extreme events in meterorological field[j]. acta physica sinica, 2009, 58(4):2853-2861.(in chinese)
\bibitem{bib20}何文平,吴琼,张文,等. 滑动去趋势波动分析与近似熵在动力学结构突变检测中的性能比较[j]. 物理学报,2009,58(4):2862-2871.
he wenping, wu qiong, zhang wen, et al. comparison of characteristics of moving detrended fluctuation analysis with that of approximate entropy method in detecting abrupt dynamic change[j]. acta physica sinica, 2009, 58(4):2862-2871.(in chinese)
\bibitem{bib21}杨萍,侯威,封国林. 基于去趋势波动分析方法确定极端事件阈值[j]. 物理学报,2008,57(8):5333-5342.
yang ping, hou wei, feng guolin. determining the threshold of extreme events with detrended fluctuation analysis[j]. acta physica sinica, 2008, 57(8):5333-5342.(in chinese)
\bibitem{bib22}赵静,吕继强,宁有丰,等. 西安市降雨和气温的非趋势性波动分析[j]. 水资源与水工程学报,2011,22(2):74-76.
zhao jing, lv jiqiang, ning youfeng, et al. detrended fluctuation analysis of precipitation and atmospheric temperature in xi'an[j]. journal of water resources \& water engineering, 2011., 22(2):74-76.(in chinese)
\bibitem{bib23}谢先红,崔远来,周玉桃. 参考作物腾发量时间序列的长程相关性和多重分形分布[j]. 水利学2008,39(12):1327-1333.
xie xianhong, cui yuanlai, zhou yutao. long-term correlation and multi-fractality of reference crop evapotranspiration time series[j]. journal of hydraulic engineering, 2008, 39(12):1327-1333.(in chinese)
\bibitem{bib24}张伟. 融合脑血氧饱和度及面部表情的多诱因非合适驾驶状态识别[d]. 长沙:中南大学,2013.
zhang wei. recognition of the multi-inducement driving condition with cerebral blood oxygen saturation and facial expression [d]. changsha: central south university, 2013.(in chinese)
\bibitem{bib25}赵海勇,邱意弘,胡思钧,等. 冠心病病人脉搏变异性信号的去趋势波动分析[j]. 航天医学与医学工程,2007,20(6):455-457.
zhao haiyong, qiu yihong, hu sijun. detrended fluctuation analysis of pulse rate variability signals of coronary disease patients.[j]. space medicine \& medical engineering, 2007, 20(6):455-457.(in chinese)
\bibitem{bib26}peng c k, buldyrev s v, havlin s, et al. mosaic organization of dna nucleotides.[j]. physical review e statistical physics plasmas fluids \& related interdisciplinary topics, 1994, 49(2):1685-1689.
\bibitem{bib27}weron r. estimating long-range dependence: finite sample properties and confidence intervals[j]. physica a
statistical mechanics \& its applications, 2001, 312(1):285-299.
\bibitem{bib28}kantelhardt j w, koscielny-bunde e, rego h h a, et al. detecting long-range correlations with detrended
fluctuation analysis[j]. physica a statistical mechanics \& its applications, 2001, 295(s3-4):441-454.
\bibitem{bib29}kantelhardt j w, zschiegner s a, koscielny-bunde e, et al. multifractal detrended fluctuation analysis of
nonstationary time series[j]. physica a statistical mechanics \& its applications, 2002, 316(1):87-114(28).
\bibitem{bib31}hu k, ivanov p c, chen z, et al. effect of trends on detrended fluctuation analysis.[j]. physical review e statistical nonlinear \& soft matter physics, 2001, hu k, ivanov p c, chen z, et al. effect of trends on detrended fluctuation analysis[j]. phys rev e stat nonlin soft matter phys, 2001, 64(1):011114..
\bibitem{bib32}montanari a, taqqu m s, teverovsky v. estimating long-range dependence in the presence of periodicity: an
empirical study [j]. mathematical \& computer modelling, 1999, 29(s10-12):217-228.
\bibitem{bib33}zhang q, zhou y, singh v p, et al. comparison of detrending methods for fluctuation analysis in hydrology[j]. journal of hydrology, 2011, 400(1-2):121-132.
\bibitem{bib34}zhang q, zhou y, singh v p. detrending methods for fluctuation analysis in hydrology: amendments and comparisons of methodologies[j]. hydrological processes, 2014, 28(28):753-763.
\bibitem{bib35}rybski d, bunde a. on the detection of trends in long-term correlated records[j]. physica a statistical
mechanics \& its applications, 2009, 388(8):1687-1695.
\bibitem{bib36}perfect e, kay b d. fractal theory applied to soil aggregation[j]. soil science society of america
journal, 1991, 55(6):1552-1558.
\end{thebibliography}
\end{document}