#sdsc6012
English / 中文
平稳性(Stationarity)
严格平稳性(Strict Stationarity)
时间序列 {xt} 是严格平稳的,当且仅当对于任意 k、任意时间点 t1,t2,…,tk 和任意时间偏移量 h,都有:
P{xt1≤c1,…,xtk≤ck}=P{xt1+h≤c1,…,xtk+h≤ck}
核心意义:严格平稳性意味着时间序列的完整概率分布不随时间变化。无论选择哪个时间窗口,其联合分布特性保持不变。这使得从单个时间序列样本中获取的统计量能够成为总体性质的有效估计。
弱平稳性(Weak Stationarity)
时间序列 {xt} 是弱平稳的,如果满足:
-
μt=E[xt] 是常数(与时间 t 无关)
-
γ(t+h,t)=Cov(xt+h,xt) 只依赖于时间间隔 h,而与具体时间点 t 无关
实际意义:弱平稳性只要求一阶矩(均值)和二阶矩(方差、协方差) 稳定,不要求完整的概率分布稳定。这使得"预测"成为可能,因为统计特性不随时间变化。
| 特征 |
严格平稳性 |
弱平稳性 |
| 核心定义 |
对于任意时间点集 t₁, t₂, …, tₙ 和任意时间平移 k,其联合分布满足: F_{X_{t₁},…,X_{tₙ}}(x₁,…,xₙ) = F_{X_{t₁+k},…,X_{tₙ+k}}(x₁,…,xₙ) (所有有限维联合分布保持不变) |
1. E[Xₜ] = μ(常数) 2. Cov(Xₜ, Xₜ₊ₖ) = γ(k)(仅依赖于滞后 k,不依赖于时间 t) |
| 均值 |
未显式要求,但作为推论,若存在则必为常数:E[Xₜ] = μ(对所有 t 为常数) |
明确要求:E[Xₜ] = μ(对所有 t 为常数) |
| 方差 |
未显式要求,但作为推论,若存在则必为常数:Var(Xₜ) = σ²(对所有 t 为常数) |
未直接要求,但由于协方差仅依赖于滞后,方差自然恒定:Var(Xₜ) = γ(0)(常数) |
| 关注焦点 |
完整的概率分布 |
仅前两阶矩(均值、方差、协方差) |
自协方差函数性质
对于平稳过程,自协方差函数 γ(h) 满足:
-
γ(0)≥0(方差非负)
-
∣γ(h)∣≤γ(0)(自协方差绝对值不超过方差)
-
γ(h)=γ(−h)(偶函数)
自相关函数(ACF)
ρ(h)=γ(0)γ(h)=Var(xt)Cov(xt,xt+h)=Corr(xt+h,xt)
注:
γ(h) 是自协方差函数,即 Cov(Xt,Xt+h)。
γ(0) 是该时间序列的方差,即 Var(Xt)。
标准化意义:通过除以方差 γ(0),ACF的取值范围被约束到 [−1,1],便于不同时间序列间的相关性强度比较。
时间序列分析
基本概念复习
对于时间序列观测值 x1,x2,…,xn,我们定义以下样本统计量:
-
样本均值:
xˉ=n1t=1∑nxt
表示时间序列的平均水平。
-
样本自协方差函数(sample autocovariance function):
对于滞后 h(其中 h=0,1,2,…),
γ^(h)=n1t=1∑n−h(xt−xˉ)(xt+h−xˉ)
衡量时间序列中相隔 h 个时间点的观测值之间的协方差。当 h=0 时,就是样本方差。
-
样本自相关函数(sample ACF):
ρ^(h)=γ^(0)γ^(h)
表示自协方差标准化后的值,范围在 [−1,1],用于度量线性相关性。
简单示例计算
假设有一个简单的时间序列样本:[2,4,6,8],即 n=4。
-
计算样本均值:
xˉ=42+4+6+8=5
-
计算 γ^(0)(样本方差):
γ^(0)=41t=1∑4(xt−5)2=41[(2−5)2+(4−5)2+(6−5)2+(8−5)2]=41(9+1+1+9)=5
-
计算 γ^(1)(滞后1的自协方差):
γ^(1)=41t=1∑3(xt−5)(xt+1−5)=41[(2−5)(4−5)+(4−5)(6−5)+(6−5)(8−5)]=41[(−3)(−1)+(−1)(1)+(1)(3)]=41(3−1+3)=1.25
白噪声过程的渐进性质
对于白噪声过程 wt,如果 E[wt4]<∞,则样本ACF ρ^(h) 满足:
-
ρ^(h)∼N(0,1/n) 渐进分布
-
对于 h=0,ρ^(h) 渐进服从均值为0、方差为 1/n 的正态分布
实际意义:在大样本下,我们可以使用正态分布来检验ACF值的显著性,判断某个滞后项是否真正具有统计显著性。
公司销售数据案例分析
销售数据(24个月):
Sales=[100,112,125,138,150,163,177,190,205,220,235,250,265,281,298,315,333,351,370,389,409,430,451,473]

时间序列算子
后移算子(Backshift Operator)
示例:假设有时间序列:x1=5,x2=8,x3=6,x4=9,x5=7
-
Bx3=x2=8
-
B2x4=x2=8
-
Bx5=x4=9
前移算子(Forward-shift Operator)
-
定义:Fxt=xt+1
-
多次应用:Fkxt=xt+k(向前移动k个时间单位)
-
关系:F=B−1,xt=B−1xt−1
示例:使用相同序列:x1=5,x2=8,x3=6,x4=9,x5=7
-
Fx2=x3=6
-
F2x1=x3=6
-
Fx4=x5=7
一阶差分算子(消除线性趋势)
定义与计算
工作原理分析
-
当前值成分:1⋅xt=xt
-
前值成分:−Bxt=−xt−1
-
组合效果:(1−B)xt=xt−xt−1
完整计算示例
| 时间(t) |
观测值(xₜ) |
差分计算过程 |
差分结果(∇xₜ) |
| 1 |
10 |
- |
缺失 |
| 2 |
12 |
12 - 10 = 2 |
2 |
| 3 |
14 |
14 - 12 = 2 |
2 |
| 4 |
16 |
16 - 14 = 2 |
2 |
| 5 |
18 |
18 - 16 = 2 |
2 |
结果分析:差分后的序列为 [缺失, 2, 2, 2, 2],常数差分值表明原序列具有完美的线性趋势。
d阶差分算子(消除高阶趋势)
差分算子的趋势消除能力实证
线性趋势消除的数学证明
当时间序列具有线性趋势:xt=β0+β1t+yt
一阶差分计算过程:
∇xt=xt−xt−1=(β0+β1t+yt)−(β0+β1(t−1)+yt−1)=β1+yt−yt−1
结论:线性趋势项 β1t 被完全消除,只剩下常数项 β1 和平稳成分的差分。
二次趋势消除的数学证明
当时间序列具有二次趋势:xt=β0+β1t+β2t2+yt
一阶差分结果:
∇xt=β1−β2+2β2t+yt−yt−1
二阶差分计算:
∇2xt=∇(∇xt)=(2β2t+β1−β2+yt−yt−1)−(2β2(t−1)+β1−β2+yt−1−yt−2)=2β2+yt−2yt−1+yt−2
结论:二次趋势被完全消除,只剩下常数项 2β2 和平稳成分的二阶差分。
线性过程(Linear Process)
定义
时间序列 {xt} 称为线性过程,如果它可以表示为:
xt=μ+j=−∞∑∞ψjwt−j
其中:
-
{wt}∼wn(0,σw2)(白噪声过程)
-
μ 是过程的均值
-
ψj 是权重系数,满足绝对可和性:∑j=−∞∞∣ψj∣<∞
组成部分分析
-
因果部分:j≥0,表示当前值依赖于现在和过去的冲击
-
非因果部分:j<0,表示当前值依赖于未来的冲击
-
绝对可和条件:∑∣ψj∣<∞ 保证了权重系数最终衰减到零:lim∣j∣→∞∣ψj∣=0
与AR模型的关系
重要结论:所有平稳AR模型都是线性过程的特例,但并非所有线性过程都是AR模型。AR模型通过自身的过去值来存储"记忆",而线性过程则通过白噪声冲击的加权和来表达。
线性过程与自回归模型(AR)
核心关系
线性过程和自回归模型之间的关系可以概括为:
“所有(平稳的)AR模型都是线性过程,但并非所有线性过程都是AR模型。”
示例说明
关键区别:
-
AR模型将"记忆"存储在自身的历史值中(xt−1,xt−2,...)
-
通过历史观测值的线性组合来定义当前值
自回归模型(AR)
直观理解
AR模型的核心理念:时间序列的当前值 xt 可以通过其过去 p 个值的线性组合来解释。
数学表达:
xt=ϕ1xt−1+ϕ2xt−2+⋯+ϕpxt−p+wt
其中:
-
ϕ1,ϕ2,...,ϕp 是自回归系数
-
wt 是白噪声项(当前时刻的随机冲击)
不同阶数的AR模型示例
AR(1) 模型(一阶自回归)
模型形式:
今日温度=ϕ1×昨日温度+随机冲击
实际意义:只考虑昨天对今天的影响
具体示例:假设 ϕ1=0.8,则:
今日温度=0.8×昨日温度+随机波动
AR(2) 模型(二阶自回归)
模型形式:
今日温度=ϕ1×昨日温度+ϕ2×前日温度+随机冲击
实际意义:同时考虑昨天和前天的综合影响
具体示例:假设 ϕ1=0.6, ϕ2=0.3,则:
今日温度=0.6×昨日温度+0.3×前日温度+随机波动
实际应用示例
股票市场价格预测
假设某股票日收盘价遵循AR(2)模型:
今日股价=0.6×昨日股价+0.3×前日股价+随机波动
这表示:
-
今日股价的60%受昨日股价影响
-
30%受前日股价影响
-
剩余10%来自随机波动
适用场景:AR模型适合具有趋势的数据,即当前值依赖于过去观测值的情况
算子表示法
后移算子(Backshift Operator)
AR模型的算子形式
将AR(p)模型:
xt=ϕ1xt−1+ϕ2xt−2+⋯+ϕpxt−p+wt
转换为:
(1−ϕ1B−ϕ2B2−⋯−ϕpBp)xt=wt
定义自回归算子:
ϕ(B)=1−ϕ1B−ϕ2B2−⋯−ϕpBp
最终得到简洁形式:
ϕ(B)xt=wt
算子解释
ϕ(B) 不仅仅是一个缩写,它代表一个系统或滤波器:
-
输入:原始时间序列 xt
-
系统:ϕ(B)(由参数 ϕ1,ϕ2,...,ϕp 定义)
-
输出:白噪声 wt
含义:如果我们将原始序列通过这个ϕ(B)系统滤波,所有可以被过去值捕获的可预测模式都将被移除,最终输出纯随机白噪声。
AR(1)模型的详细分析
模型形式
xt=ϕxt−1+wt
求解过程
通过连续代入:
xt=ϕxt−1+wt=ϕ(ϕxt−2+wt−1)+wt=ϕ2xt−2+ϕwt−1+wt
继续此过程n次:
xt=ϕnxt−n+j=0∑n−1ϕjwt−j
算子解法
使用后移算子:(1−ϕB)xt=wt
应用逆算子(当 ∣ϕ∣<1 时有效):
xt=(1−ϕB)−1wt=j=0∑∞ϕjBjwt=j=0∑∞ϕjwt−j
因果性与平稳性
因果过程
时间序列过程称为因果的,如果其当前值仅依赖于:
AR(1)模型的因果性条件
AR(1)过程 xt=ϕxt−1+wt 是因果的当且仅当:
条件1:∣ϕ∣<1
条件2:多项式 ϕ(z)=1−ϕz 的根 z1 满足 ∣z1∣>1
当 ∣ϕ∣<1 时:过程可以表示为 xt=∑j=0∞ϕjwt−j,仅依赖于过去和现在的噪声
非因果情况
当 ∣ϕ∣>1 时,过程是非因果的,依赖于未来噪声:
xt=−j=1∑∞ϕ−jwt+j
AR(p)模型的平稳性条件
AR(p)模型存在平稳解当且仅当自回归特征多项式:
ϕ(z)=1−ϕ1z−ϕ2z2−⋯−ϕpzp=0
的所有根都在单位圆外(即所有根的模大于1)。
实例:检查因果性
示例1:AR(2)模型
考虑模型:xt=1.5xt−1−0.5xt−2+wt
特征多项式:ϕ(z)=1−1.5z+0.5z2
解方程:1−1.5z+0.5z2=0得根:z1=1, z2=2
由于 ∣z1∣=1(在单位圆上),该过程不是因果的。
示例2:AR(2)模型
考虑模型:xt=0.5xt−1+0.2xt−2+wt
特征多项式:ϕ(z)=1−0.5z−0.2z2
解方程得根:z1≈−1.35, z2≈3.70
由于 ∣z1∣≈1.35>1 且 ∣z2∣≈3.70>1,该过程是因果的。