讨论班第一次课的大致内容

本文最后更新于 2025年10月24日 晚上

speaker:scq 同学

测度论初步 + 高等概率论初步 + GTM 274 Ch01 Gaussian Variables and Gaussian Processes

1. 测度论初步

1.1 基础定义

Definition 1.1.1(σ\sigma-域)

XX 为非空集合,MP(X)\mathcal{M} \subseteq \mathcal{P}(X)(其中 P(X)\mathcal{P}(X)XX 的幂集)且非空。若 M\mathcal{M} 满足:

  1. 对任意 AMA \in \mathcal{M},其补集 AcMA^c \in \mathcal{M}
  2. 对任意可数集族 {An}n=1M\{A_n\}_{n=1}^{\infty} \subseteq \mathcal{M},并集 n=1AnM\bigcup_{n=1}^{\infty} A_n \in \mathcal{M}

则称 M\mathcal{M}σ\sigma-域(或 σ\sigma-代数)。二元组 (X,M)(X, \mathcal{M}) 称为 可测空间

Definition 1.1.2(测度)

(X,M)(X, \mathcal{M}) 为可测空间,其中 XX \neq \emptysetM\mathcal{M}σ\sigma-域。若函数 μ:M[0,+]\mu: \mathcal{M} \to [0, +\infty] 满足:

  1. μ()=0\mu(\emptyset) = 0
  2. 对任意可数个不相交的集合 {An}n=1M\{A_n\}_{n=1}^{\infty} \subseteq \mathcal{M},有 μ(n=1An)=n=1μ(An)\mu\left( \bigcup_{n=1}^{\infty} A_n \right) = \sum_{n=1}^{\infty} \mu(A_n)(可数可加性);

则称 μ\mu测度。三元组 (X,M,μ)(X, \mathcal{M}, \mu) 称为 测度空间

example 1.1.3

  1. (R,L,m)(\mathbb{R}, \mathcal{L}, m),其中 L\mathcal{L} 表示勒贝格可测集族,mm 表示勒贝格测度,是一个测度空间。
  2. {an}nZ\{a_n\}_{n \in \mathbb{Z}} 为一族非负实数(即对所有 nZn \in \mathbb{Z}an0a_n \geq 0)。对任意 AP(Z)A \in \mathcal{P}(\mathbb{Z})Z\mathbb{Z} 的幂集),定义 μ(A)=kAak\mu(A) = \sum_{k \in A} a_k。则 (Z,P(Z),μ)(\mathbb{Z}, \mathcal{P}(\mathbb{Z}), \mu) 是一个测度空间。

1.2 可测映射、简单函数与积分

Definition 1.2.1(可测映射)

(X,M)(X, \mathcal{M})(Y,N)(Y, \mathcal{N}) 为可测空间。若函数 f:XYf: X \to Y 满足:对任意 BNB \in \mathcal{N},原像 f1(B)Mf^{-1}(B) \in \mathcal{M},则称 ff可测映射

Remark(可测函数):若 (Y,N)=(R,BR)(Y, \mathcal{N}) = (\mathbb{R}, \mathcal{B}_{\mathbb{R}})(其中 BR\mathcal{B}_{\mathbb{R}}R\mathbb{R} 上的 Borel σ\sigma-域),则 ff 称为 可测函数

Definition 1.2.2(简单函数)

若函数 φ:XR\varphi: X \to \mathbb{R} 可表示为 φ=i=1naiIAi\varphi = \sum_{i=1}^{n} a_i \mathbb{I}_{A_i},其中 {Ai}i=1n\{A_i\}_{i=1}^{n} 是不相交的可测集,且对每个 iiaiRa_i \in \mathbb{R}(这里 IAi\mathbb{I}_{A_i}AiA_i 的指示函数),则称 φ\varphi简单函数

Definition 1.2.3(非负可测函数的积分)

(X,M,μ)(X, \mathcal{M}, \mu) 为测度空间,f:X[0,+]f: X \to [0, +\infty] 为可测函数。ff 关于 μ\mu 的积分定义为

fdμ:=sup{i=1naiμ(Ai)  0φf, φ=i=1naiIAi 是简单函数}.\int f \, d\mu := \sup \left\{ \sum_{i=1}^{n} a_i \mu(A_i) \ \bigg| \ 0 \leq \varphi \leq f, \ \varphi = \sum_{i=1}^{n} a_i \mathbb{I}_{A_i} \text{ 是简单函数} \right\}.

Remark:对简单函数 φ=i=1naiIAi\varphi = \sum_{i=1}^{n} a_i \mathbb{I}_{A_i}(其中 {Ai}\{A_i\} 不相交),其积分 φdμ=i=1naiμ(Ai)\int \varphi \, d\mu = \sum_{i=1}^{n} a_i \mu(A_i),这与上述定义一致。

Definition 1.2.4(可积函数)

f:XRf: X \to \mathbb{R} 为可测函数。定义其正部 f+:=max{0,f}f^+ := \max\{0, f\},负部 f:=max{0,f}f^- := \max\{0, -f\}。若 f+dμ<\int f^+ \, d\mu < \inftyfdμ<\int f^- \, d\mu < \infty,则称 ff可积的(记为 fL1(μ)f \in L^1(\mu))。此时 ff 的积分定义为

fdμ:=f+dμfdμ.\int f \, d\mu := \int f^+ \, d\mu - \int f^- \, d\mu.

Remark:函数 ff 可积当且仅当 fdμ<\int |f| \, d\mu < \infty。(这是因为 f=f++f|f| = f^+ + f^-,故 fdμ<\int |f| \, d\mu < \infty 当且仅当 f+dμ\int f^+ \, d\mufdμ\int f^- \, d\mu 均有限。)

1.3 几个重要定理

Dylaaan的文章 - 实分析笔记(三):积分

Theorem 1.3.1 Fatou 引理

AAA \in \mathscr{A}fn:A[0,+]f_n: A \to [0, +\infty]μ\mu-可测函数,n=1,2,n = 1,2,\cdots,则

Alim infn+fndμlim infn+Afndμ.\int_A \liminf_{n \to +\infty} f_n d\mu \leq \liminf_{n \to +\infty} \int_A f_n d\mu.

Theorem 1.3.2 Levi 单调收敛定理

AAA \in \mathscr{A}fn,f:A[0,+]f_n, f: A \to [0, +\infty]μ\mu-可测函数,n=1,2,n = 1,2,\cdots,且 fnff_n \to fn+n \to +\infty)。若 {fn}\{f_n\} 单调递增,则

AfkdμAfdμ,k+.\int_A f_k d\mu \to \int_A f d\mu,\quad k \to +\infty.

Theorem 1.3.3 Lebesgue 控制收敛定理

AAA \in \mathscr{A}fn,fL1(A)f_n, f \in L^1(A)n=1,2,n = 1,2,\cdots,且 fnff_n \to fn+n \to +\infty)。若存在函数 g:A[0,+]g: A \to [0, +\infty] 满足 gL1(A)g \in L^1(A),且对所有 n=1,2,n = 1,2,\cdotsfng|f_n| \leq g,则

Afnfdμ0,n+,进而AfndμAfdμ.\int_A |f_n - f| d\mu \to 0,\,n \to +\infty,\quad \text{进而}\quad \int_A f_n d\mu \to \int_A f d\mu.

1.4 推移测度

Theorem 1.4.1(推移测度与变量替换公式)

(X,M,μ)(X, \mathcal{M}, \mu) 为测度空间,(Y,N)(Y, \mathcal{N}) 为可测空间,h:XYh: X \to Y 为可测映射。定义 推移测度 μh1:N[0,+]\mu \circ h^{-1}: \mathcal{N} \to [0, +\infty] 为:对所有 BNB \in \mathcal{N}(μh1)(B):=μ(h1(B))(\mu \circ h^{-1})(B) := \mu(h^{-1}(B))。则:

  1. μh1\mu \circ h^{-1}(Y,N)(Y, \mathcal{N}) 上的测度;
  2. 对任意可积函数 f:YRf: Y \to \mathbb{R}变量替换公式 成立:

(fh)dμ=fd(μh1).\int (f \circ h) \, d\mu = \int f \, d(\mu \circ h^{-1}).

证明

步骤1:证明 μh1\mu \circ h^{-1} 是测度。

(i)空集的测度为 0:(μh1)()=μ(h1())=μ()=0(\mu \circ h^{-1})(\emptyset) = \mu(h^{-1}(\emptyset)) = \mu(\emptyset) = 0

(ii)可数可加性:设 {Bn}n=1\{B_n\}_{n=1}^{\infty}N\mathcal{N} 中的不相交集合,则 {h1(Bn)}n=1\{h^{-1}(B_n)\}_{n=1}^{\infty}M\mathcal{M} 中的不相交集合。

因为原像保持不相交性:对 nmn \neq mh1(Bn)h1(Bm)=h1(BnBm)=h1()=h^{-1}(B_n) \cap h^{-1}(B_m) = h^{-1}(B_n \cap B_m) = h^{-1}(\emptyset) = \emptyset

因此,

(μh1)(n=1Bn)=μ(h1(n=1Bn))=μ(n=1h1(Bn))=n=1μ(h1(Bn))=n=1(μh1)(Bn).(\mu \circ h^{-1})\left( \bigcup_{n=1}^{\infty} B_n \right) = \mu\left( h^{-1}\left( \bigcup_{n=1}^{\infty} B_n \right) \right) = \mu\left( \bigcup_{n=1}^{\infty} h^{-1}(B_n) \right) = \sum_{n=1}^{\infty} \mu(h^{-1}(B_n)) = \sum_{n=1}^{\infty} (\mu \circ h^{-1})(B_n).

μh1\mu \circ h^{-1} 是测度。

步骤2:证明变量替换公式。

分阶段证明:

情形1: ffYY 上的简单函数。

f=i=1kciIBif = \sum_{i=1}^{k} c_i \mathbb{I}_{B_i},其中 {Bi}i=1k\{B_i\}_{i=1}^{k}N\mathcal{N} 中的不相交集合,ciRc_i \in \mathbb{R},则 fh=i=1kciIh1(Bi)f \circ h = \sum_{i=1}^{k} c_i \mathbb{I}_{h^{-1}(B_i)},是 XX 上的简单函数。计算两边积分:

(fh)dμ=i=1kciμ(h1(Bi))=i=1kci(μh1)(Bi)=fd(μh1).\int (f \circ h) \, d\mu = \sum_{i=1}^{k} c_i \mu(h^{-1}(B_i)) = \sum_{i=1}^{k} c_i (\mu \circ h^{-1})(B_i) = \int f \, d(\mu \circ h^{-1}).

情形2: ffYY 上的非负可测函数。

任何非负可测函数都可表示为一列递增的非负简单函数的极限,即存在非负简单函数列 {fn}n=1\{f_n\}_{n=1}^\infty,使得 fnff_n \uparrow f(单调递增且逐点收敛于 ff)。对每个 fnf_n,由第一步结论,有 (fnh)dμ=fnd(μh1)\int (f_n \circ h) d\mu = \int f_n d(\mu \circ h^{-1})

左边应用单调收敛定理(MCT):因 fnff_n \uparrow f,,故 fnhfhf_n \circ h \uparrow f \circ h(复合保持单调性),因此

limn(fnh)dμ=(fh)dμ.\lim_{n \to \infty} \int (f_n \circ h) d\mu = \int (f \circ h) d\mu.

右边应用单调收敛定理(MCT):因 fnff_n \uparrow f,故

limnfnd(μh1)=fd(μh1).\lim_{n \to \infty} \int f_n d(\mu \circ h^{-1}) = \int f d(\mu \circ h^{-1}).

两边极限相等,故非负可测函数情形下公式成立。

情形3: ffYY 上的可积函数。

ff 表示为 f=f+ff = f^+ - f^-,其中 f+,ff^+, f^- 是非负可测函数,则

fh=(f+h)(fh)f \circ h = (f^+ \circ h) - (f^- \circ h)

由情形2,(f+h)dμ=f+d(μh1)\int (f^+ \circ h) \, d\mu = \int f^+ \, d(\mu \circ h^{-1}),且 (fh)dμ=fd(μh1)\int (f^- \circ h) \, d\mu = \int f^- \, d(\mu \circ h^{-1})

ff 可积,故 f+d(μh1)<\int f^+ \, d(\mu \circ h^{-1}) < \inftyfd(μh1)<\int f^- \, d(\mu \circ h^{-1}) < \infty,因此

(fh)dμ=(f+h)dμ(fh)dμ=f+d(μh1)fd(μh1)=fd(μh1).\begin{align*} \int (f \circ h) \, d\mu &= \int (f^+ \circ h) \, d\mu - \int (f^- \circ h) \, d\mu \\ &= \int f^+ \, d(\mu \circ h^{-1}) - \int f^- \, d(\mu \circ h^{-1}) \\ &= \int f \, d(\mu \circ h^{-1}). \end{align*}

2. 高等概率论初步

参考书:《Probability: Theory and Examples》- Rick Durrett (Fifth Edition)

2.1 概率空间

概率空间 (probability space) 是一个三元组 (Ω,F,P)(\Omega, \mathcal{F}, P),其中 Ω\Omega 是“结果” (outcomes) 的集合,F\mathcal{F} 是“事件” (events) 的集合,P:F[0,1]P: \mathcal{F} \to [0,1] 是一个为事件赋予概率的函数。我们假设 F\mathcal{F} 是一个 σ\sigma-域(或 σ\sigma-代数),即 Ω\Omega 的子集的一个(非空)族,满足:

  • (i) 若 AFA \in \mathcal{F},则 AcFA^c \in \mathcal{F}
  • (ii) 若 AiFA_i \in \mathcal{F} 是一列集合,则 iAiF\bigcup_i A_i \in \mathcal{F}

这里及以下,“可数” 指有限或可数无限。由于 iAi=(iAic)c\bigcap_i A_i = (\bigcup_i A_i^c)^c,故 σ\sigma-field 对可数交封闭。我们在定义中省略最后一个性质,以使其更易验证。

不考虑 PP 时,(Ω,F)(\Omega, \mathcal{F}) 称为 可测空间 (measurable space),即可以在其上定义测度的空间。测度 (measure) 是一个非负可数可加集函数;即,一个函数 μ:FR\mu: \mathcal{F} \to \mathbb{R},满足:

  • (i) 对所有 AFA \in \mathcal{F}μ(A)μ()=0\mu(A) \geq \mu(\emptyset) = 0
  • (ii) 若 AiFA_i \in \mathcal{F} 是一列不相交 (disjoint) 的集合,则

μ(iAi)=iμ(Ai)\mu(\bigcup_i A_i) = \sum_i \mu(A_i)

μ(Ω)=1\mu(\Omega) = 1,我们称 μ\mu概率测度 (probability measure)。概率测度通常记为 PP

下一个结果给出了我们稍后会用到的测度定义的一些推论。在所有情况下,我们假设提到的集合都在 F\mathcal{F} 中。

Theorem 2.1.1

μ\mu(Ω,F)(\Omega, \mathcal{F}) 上的测度,

  • (i) 单调性 (monotonicity)
    • ABA \subset B,则 μ(A)μ(B)\mu(A) \leq \mu(B)
  • (ii) 次可加性 (subadditivity)
    • Am=1AmA \subset \bigcup_{m=1}^\infty A_m,则 μ(A)m=1μ(Am)\mu(A) \leq \sum_{m=1}^\infty \mu(A_m)
  • (iii) 下连续性 (continuity from below)
    • AiAA_i \uparrow A(即 A1A2A_1 \subset A_2 \subset \dotsiAi=A\bigcup_i A_i = A),则 μ(Ai)μ(A)\mu(A_i) \uparrow \mu(A)
  • (iv) 上连续性 (continuity from above)
    • AiAA_i \downarrow A(即 A1A2A_1 \supset A_2 \supset \dotsiAi=A\bigcap_i A_i = A),且 μ(A1)<\mu(A_1) < \infty,则 μ(Ai)μ(A)\mu(A_i) \downarrow \mu(A)

Example 2.1.2(离散概率空间)

Ω\Omega 是一个可数集,即有限或可数无限集。设 F\mathcal{F}Ω\Omega 的所有子集的集合。设

P(A)=ωAp(ω), 其中 p(ω)0 且 ωΩp(ω)=1P(A) = \sum_{\omega \in A} p(\omega), \text{ 其中 } p(\omega) \geq 0 \text{ 且 } \sum_{\omega \in \Omega} p(\omega) = 1

稍加思考就会发现,这是该空间上最一般的概率测度。在许多情况下,当 Ω\Omega 是有限集时,我们有 p(ω)=1/Ωp(\omega) = 1/|\Omega|,其中 Ω|\Omega|Ω\Omega 中的点数。

为了准备下一个定义,我们需要注意,由定义可轻易推出:若 Fi\mathcal{F}_iiIi \in I)是 σ\sigma-域,则 iIFi\bigcap_{i \in I} \mathcal{F}_i 也是 σ\sigma-域。这里 II \neq \emptyset 是任意指标集(即可能不可数)。由此可知,若给定一个集合 Ω\OmegaΩ\Omega 的子集族 A\mathcal{A},则存在包含 A\mathcal{A} 的最小 σ\sigma-域。我们将其称为 A\mathcal{A} 生成的 σ\sigma-域,记为 σ(A)\sigma(\mathcal{A})

Rd\mathbb{R}^d 是实向量 (x1,,xd)(x_1, \dots, x_d) 的集合, Rd\mathcal{R}^dBorel 集,即包含所有开集的最小 σ\sigma-域。当 d=1d=1 时,我们省略上标。

Example 2.1.3(实直线上的测度)

(R,R)(\mathbb{R}, \mathcal{R}) 上的测度由具有以下性质的 Stieltjes 测度函数 定义:

  • (i) FF 是非递减的。
  • (ii) FF 是右连续的,即 limyxF(y)=F(x)\lim_{y \downarrow x} F(y) = F(x)

Theorem 2.1.4

与每个 Stieltjes 测度函数 FF 相关联的,是 (R,R)(\mathbb{R}, \mathcal{R}) 上唯一的测度 μ\mu,满足 μ((a,b])=F(b)F(a)\mu((a, b]) = F(b) - F(a)

μ((a,b])=F(b)F(a)(1.1.1)\mu((a, b]) = F(b) - F(a) \tag{1.1.1}

F(x)=xF(x) = x 时,所得测度称为 勒贝格测度

Remark:(a,b](a, b] 中选择“右闭”是由以下事实决定的:若 bnbb_n \downarrow b,则有

n(a,bn]=(a,b]\bigcap_n (a, b_n] = (a, b]

2.2 独立性

Definition 2.2.1(σ\sigma-field 的独立性)

F1,F2,,Fn\mathcal{F}_1, \mathcal{F}_2, \dots, \mathcal{F}_n 是概率空间上的 σ\sigma-域。若对任意 AiFiA_i \in \mathcal{F}_ii=1,2,,ni = 1, 2, \dots, n),有

P(i=1nAi)=i=1nP(Ai)P\left( \bigcap_{i=1}^n A_i \right) = \prod_{i=1}^n P(A_i)

则称 F1,,Fn\mathcal{F}_1, \dots, \mathcal{F}_n 相互独立

Definition 2.2.2(随机变量的独立性)

X1,X2,,XnX_1, X_2, \dots, X_n 是随机变量。若它们生成的σ\sigma-域 σ(X1),σ(X2),,σ(Xn)\sigma(X_1), \sigma(X_2), \dots, \sigma(X_n) 相互独立,则称 X1,,XnX_1, \dots, X_n 相互独立

Definition 2.2.3(集合的独立性)

A1,A2,,AnA_1, A_2, \dots, A_n 是样本空间的子集。若对任意非空子集 I{1,2,,n}I \subseteq \{1, 2, \dots, n\},有

P(iIAi)=iIP(Ai)P\left( \bigcap_{i \in I} A_i \right) = \prod_{i \in I} P(A_i)

则称 A1,,AnA_1, \dots, A_n 相互独立

Definition 2.2.4(集族的独立性)

A1,A2,,An\mathcal{A}_1, \mathcal{A}_2, \dots, \mathcal{A}_n 是样本空间的集族。若对任意非空子集 I{1,2,,n}I \subseteq \{1, 2, \dots, n\} 和任意 AiAiA_i \in \mathcal{A}_iiIi \in I),有

P(iIAi)=iIP(Ai)P\left( \bigcap_{i \in I} A_i \right) = \prod_{i \in I} P(A_i)

则称 A1,,An\mathcal{A}_1, \dots, \mathcal{A}_n 相互独立

2.3 π\pi-λ\lambda定理

Definition 2.3.1(π\pi-系统)

P\mathcal{P} 是样本空间的集族。若 P\mathcal{P}有限交运算封闭(即对任意 A,BPA, B \in \mathcal{P},有 ABPA \cap B \in \mathcal{P}),则称 P\mathcal{P} 是一个**π\pi-系统**。

Definition 2.3.2(λ\lambda-系统)

L\mathcal{L} 是样本空间的集族。若 L\mathcal{L} 满足以下三条:

  1. ΩL\Omega \in \mathcal{L}(包含全空间);
  2. 对差运算封闭:若 A,BLA, B \in \mathcal{L}ABA \subseteq B,则 BALB \setminus A \in \mathcal{L}
  3. 对递增序列的并封闭:若 {An}L\{A_n\} \subseteq \mathcal{L}AnAA_n \uparrow A(即 A1A2A_1 \subseteq A_2 \subseteq \dotsn=1An=A\bigcup_{n=1}^\infty A_n = A),则 ALA \in \mathcal{L}
    则称 L\mathcal{L} 是一个**λ\lambda-系统**。

Theorem 2.3.3(Dynkin π\pi-λ\lambda定理)

P\mathcal{P}π\pi-系统,L\mathcal{L}λ\lambda-系统,且 PL\mathcal{P} \subseteq \mathcal{L},则 σ(P)L\sigma(\mathcal{P}) \subseteq \mathcal{L}。其中,σ(P)\sigma(\mathcal{P}) 是由 P\mathcal{P} 生成的 σ\sigma-域)。

证明:

L(P)\mathcal{L}(\mathcal{P}) 为包含 P\mathcal{P}最小 λ\lambda-系统(即所有包含 P\mathcal{P}λ\lambda-系统的交集,易证其仍为λ\lambda-系统)。我们先证明**L(P)\mathcal{L}(\mathcal{P})σ\sigma-域**,步骤如下:

  1. 证明 L(P)\mathcal{L}(\mathcal{P}) 对有限交封闭
    对任意 AL(P)A \in \mathcal{L}(\mathcal{P}),定义集族 G(A)={BL(P)ABL(P)}\mathcal{G}(A) = \{ B \in \mathcal{L}(\mathcal{P}) \mid A \cap B \in \mathcal{L}(\mathcal{P}) \}。需证 G(A)\mathcal{G}(A)λ\lambda-系统:

    • (包含全空间)ΩG(A)\Omega \in \mathcal{G}(A),因为 AΩ=AL(P)A \cap \Omega = A \in \mathcal{L}(\mathcal{P})
    • (差运算封闭)若 B1B2B_1 \subseteq B_2B1,B2G(A)B_1, B_2 \in \mathcal{G}(A),则 A(B2B1)=(AB2)(AB1)A \cap (B_2 \setminus B_1) = (A \cap B_2) \setminus (A \cap B_1)。由 B1,B2G(A)B_1, B_2 \in \mathcal{G}(A)AB1,AB2L(P)A \cap B_1, A \cap B_2 \in \mathcal{L}(\mathcal{P}),且 AB1AB2A \cap B_1 \subseteq A \cap B_2,故由λ\lambda-系统的差封闭性,(AB2)(AB1)L(P)(A \cap B_2) \setminus (A \cap B_1) \in \mathcal{L}(\mathcal{P}),即 B2B1G(A)B_2 \setminus B_1 \in \mathcal{G}(A)
    • (递增并封闭)若 {Bn}G(A)\{B_n\} \subseteq \mathcal{G}(A)BnBB_n \uparrow B,则 ABnABA \cap B_n \uparrow A \cap B。由λ\lambda-系统的递增并封闭性,ABL(P)A \cap B \in \mathcal{L}(\mathcal{P}),故 BG(A)B \in \mathcal{G}(A)

    因此,G(A)\mathcal{G}(A)λ\lambda-系统。

    • APA \in \mathcal{P},则对任意 BPB \in \mathcal{P}ABPL(P)A \cap B \in \mathcal{P} \subseteq \mathcal{L}(\mathcal{P}),故 PG(A)\mathcal{P} \subseteq \mathcal{G}(A)。而 L(P)\mathcal{L}(\mathcal{P}) 是包含 P\mathcal{P} 的最小λ\lambda-系统,故 L(P)G(A)\mathcal{L}(\mathcal{P}) \subseteq \mathcal{G}(A)。这意味着:对任意 APA \in \mathcal{P}BL(P)B \in \mathcal{L}(\mathcal{P}),有 ABL(P)A \cap B \in \mathcal{L}(\mathcal{P})
    • BL(P)B \in \mathcal{L}(\mathcal{P}),则对任意 APA \in \mathcal{P}ABL(P)A \cap B \in \mathcal{L}(\mathcal{P}),即 PG(B)\mathcal{P} \subseteq \mathcal{G}(B)。同理,L(P)G(B)\mathcal{L}(\mathcal{P}) \subseteq \mathcal{G}(B),即对任意 A,BL(P)A, B \in \mathcal{L}(\mathcal{P}),有 ABL(P)A \cap B \in \mathcal{L}(\mathcal{P})。故 L(P)\mathcal{L}(\mathcal{P}) 对有限交封闭。
  2. 证明 L(P)\mathcal{L}(\mathcal{P})σ\sigma-域
    只需验证σ\sigma-域的三条公理:

    • (包含全空间)ΩL(P)\Omega \in \mathcal{L}(\mathcal{P})λ\lambda-系统的定义);
    • (补集封闭)对 AL(P)A \in \mathcal{L}(\mathcal{P}),令 B=ΩAB = \Omega \setminus A,由差封闭性(AΩA \subseteq \Omega),BL(P)B \in \mathcal{L}(\mathcal{P})
    • (可数并封闭)对可数个 AnL(P)A_n \in \mathcal{L}(\mathcal{P}),令 B1=A1B_1 = A_1Bk=Aki=1k1AiB_k = A_k \setminus \bigcup_{i=1}^{k-1} A_ik2k \geq 2),则 BkB_k 两两不相交,且 n=1An=n=1Bn\bigcup_{n=1}^\infty A_n = \bigcup_{n=1}^\infty B_n。由有限交封闭(已证)和差封闭性,BkL(P)B_k \in \mathcal{L}(\mathcal{P}),再由递增并封闭(Cn=i=1nBin=1BnC_n = \bigcup_{i=1}^n B_i \uparrow \bigcup_{n=1}^\infty B_n),故 n=1AnL(P)\bigcup_{n=1}^\infty A_n \in \mathcal{L}(\mathcal{P})

    因此,L(P)\mathcal{L}(\mathcal{P})σ\sigma-域。而 σ(P)\sigma(\mathcal{P}) 是包含 P\mathcal{P} 的最小σ\sigma-域,故 σ(P)L(P)L\sigma(\mathcal{P}) \subseteq \mathcal{L}(\mathcal{P}) \subseteq \mathcal{L},定理得证。

Theorem 2.3.4(π\pi-λ\lambda定理的推广)

A1,A2,,An\mathcal{A}_1, \mathcal{A}_2, \dots, \mathcal{A}_n 是相互独立的集族,且每个 Ai\mathcal{A}_iπ\pi-系统,则它们生成的σ\sigma-域 σ(A1),σ(A2),,σ(An)\sigma(\mathcal{A}_1), \sigma(\mathcal{A}_2), \dots, \sigma(\mathcal{A}_n) 相互独立。

证明:对 nn 用数学归纳法,先证 n=2n = 2 的情形,再推广到一般 nn

步骤1:n=2n = 2 时的证明
定义集族 L1={A1A1,A2 独立对任意 A2A2}\mathcal{L}_1 = \left\{ A_1 \mid A_1, A_2 \text{ 独立对任意 } A_2 \in \mathcal{A}_2 \right\},需证 L1\mathcal{L}_1λ\lambda-系统且包含 A1\mathcal{A}_1

  • (包含全空间)ΩL1\Omega \in \mathcal{L}_1,因为对任意 A2A2A_2 \in \mathcal{A}_2P(ΩA2)=P(A2)=P(Ω)P(A2)P(\Omega \cap A_2) = P(A_2) = P(\Omega)P(A_2)
  • (差运算封闭)若 A11A12A_1^1 \subseteq A_1^2A11,A12L1A_1^1, A_1^2 \in \mathcal{L}_1,则对任意 A2A2A_2 \in \mathcal{A}_2

    P((A12A11)A2)=P(A12A2)P(A11A2)=P(A12)P(A2)P(A11)P(A2)=P(A12A11)P(A2)P\left( (A_1^2 \setminus A_1^1) \cap A_2 \right) = P(A_1^2 \cap A_2) - P(A_1^1 \cap A_2) = P(A_1^2)P(A_2) - P(A_1^1)P(A_2) = P(A_1^2 \setminus A_1^1)P(A_2)

    A12A11L1A_1^2 \setminus A_1^1 \in \mathcal{L}_1
  • (递增并封闭)若 {A1k}L1\{A_1^k\} \subseteq \mathcal{L}_1A1kA1A_1^k \uparrow A_1,则对任意 A2A2A_2 \in \mathcal{A}_2,由概率的上连续性,

    P(A1A2)=limkP(A1kA2)=limkP(A1k)P(A2)=P(A1)P(A2)P(A_1 \cap A_2) = \lim_{k \to \infty} P(A_1^k \cap A_2) = \lim_{k \to \infty} P(A_1^k)P(A_2) = P(A_1)P(A_2)

    A1L1A_1 \in \mathcal{L}_1

因此,L1\mathcal{L}_1λ\lambda-系统。又因为 A1\mathcal{A}_1π\pi-系统且 A1L1\mathcal{A}_1 \subseteq \mathcal{L}_1(由 A1,A2\mathcal{A}_1, \mathcal{A}_2 独立),根据Dynkin π\pi-λ\lambda定理,σ(A1)L1\sigma(\mathcal{A}_1) \subseteq \mathcal{L}_1,即 σ(A1)\sigma(\mathcal{A}_1)A2\mathcal{A}_2 独立。

步骤2:同理可证 σ(A2)\sigma(\mathcal{A}_2)σ(A1)\sigma(\mathcal{A}_1) 独立

定义类似的 λ\lambda-系统 L2\mathcal{L}_2,可得 σ(A2)L2\sigma(\mathcal{A}_2) \subseteq \mathcal{L}_2,即 σ(A1)\sigma(\mathcal{A}_1)σ(A2)\sigma(\mathcal{A}_2) 独立。

步骤3:归纳到一般 nn

假设对 n1n-1 个相互独立的 π\pi-系统,其生成的 σ\sigma-域也相互独立。对 nn 个集族 A1,,An\mathcal{A}_1, \dots, \mathcal{A}_n,固定 A2,,An\mathcal{A}_2, \dots, \mathcal{A}_n,将 A1\mathcal{A}_1A2An\mathcal{A}_2 \cap \dots \cap \mathcal{A}_n 构成的π\pi-系统(因为π\pi-系统对交封闭)应用上述 n=2n=2 的结论,可证 σ(A1)\sigma(\mathcal{A}_1)σ(A2),,σ(An)\sigma(\mathcal{A}_2), \dots, \sigma(\mathcal{A}_n) 独立。依此类推,可得 σ(A1),,σ(An)\sigma(\mathcal{A}_1), \dots, \sigma(\mathcal{A}_n) 相互独立。

3. Gaussian Variables and Gaussian Processes

高斯随机过程在理论概率论和各种应用模型中都发挥着重要作用。我们首先回顾关于高斯随机变量和高斯向量的基本事实。然后我们讨论高斯空间和高斯过程,并建立高斯框架下关于独立性和条件作用的基本性质。最后,我们引入高斯白噪声的概念,它将在下一章中用于给出布朗运动的简单构造。

3.1 Gaussian Random Variables

在本章中,我们处理定义在概率空间 (Ω,F,P)(\Omega, \mathcal{F}, P) 上的随机变量。对于接下来的一些存在性陈述,这个概率空间应适当选取。对于每个实数 p1p \geq 1Lp(Ω,F,P)L^p(\Omega, \mathcal{F}, P),或者在无歧义时简记为 LpL^p,表示所有满足 Xp|X|^p 可积的实随机变量 XX 的空间,通常约定几乎必然相等的两个随机变量被视为同一。空间 LpL^p 配备通常的范数。

实随机变量 XX 被称为 标准高斯(或正态)变量,如果其概率律关于 R\mathbb{R} 上的勒贝格测度具有密度

pX(x)=12πexp(x22)p_X(x) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2}\right)

此时,XX 的复 Laplace 变换由下式给出:

E[ezX]=ez2/2,zC.E\left[e^{zX}\right] = e^{z^2/2}, \quad \forall z \in \mathbb{C}.

为得到该公式(同时验证复 Laplace 变换是 well defined),先考虑 z=λRz = \lambda \in \mathbb{R} 的情形:

E[eλX]=12πReλxex2/2dx=eλ2/212πRe(xλ)2/2dx=eλ2/2.E\left[e^{\lambda X}\right] = \frac{1}{\sqrt{2\pi}} \int_{\mathbb{R}} e^{\lambda x} e^{- x^2/2} \mathrm{d}x = e^{\lambda^2/2} \frac{1}{\sqrt{2\pi}} \int_{\mathbb{R}} e^{-(x-\lambda)^2/2} \mathrm{d}x = e^{\lambda^2/2}.

该计算确保了对每个 zCz \in \mathbb{C}E[ezX]E\left[e^{zX}\right] 是良定的,并在 C\mathbb{C} 上定义了一个全纯函数。通过解析延拓,对每个 zRz \in \mathbb{R} 成立的恒等式 E[ezX]=ez2/2E\left[e^{zX}\right] = e^{z^2/2},对每个 zCz \in \mathbb{C} 也必须成立。

z=iξz = \mathrm{i}\xiξR\xi \in \mathbb{R},我们得到 XX特征函数

E[eiξX]=eξ2/2.E\left[e^{\mathrm{i}\xi X}\right] = e^{-\xi^2/2}.

由展开式

E[eiξX]=1+iξE[X]++(iξ)nn!E[Xn]+O(ξn+1),E\left[e^{\mathrm{i}\xi X}\right] = 1 + \mathrm{i}\xi E[X] + \cdots + \frac{(\mathrm{i}\xi)^n}{n!} E[X^n] + O(|\xi|^{n+1}),

ξ0\xi \to 0 时(当 XX 属于所有 LpL^p 空间(1p<1 \leq p < \infty)时,该展开式对每个 n1n \geq 1 都成立,这里正是这种情况),我们得到

E[X]=0,E[X2]=1E[X] = 0, \quad E[X^2] = 1

更一般地,对每个整数 n0n \geq 0

E[X2n]=(2n)!2nn!,E[X2n+1]=0.E[X^{2n}] = \frac{(2n)!}{2^n n!}, \quad E[X^{2n+1}] = 0.

σ>0\sigma > 0mRm \in \mathbb{R},我们称实随机变量 YY 服从 N(m,σ2)\mathcal{N}(m, \sigma^2) 分布的 高斯变量,如果 YY 满足以下三个等价性质之一:
(i) Y=σX+mY = \sigma X + m,其中 XX 是标准高斯变量(即 XX 服从 N(0,1)\mathcal{N}(0, 1) 分布);
(ii) YY 的概率律具有密度

pY(y)=1σ2πexp((ym)22σ2);p_Y(y) = \frac{1}{\sigma\sqrt{2\pi}} \exp\left(-\frac{(y - m)^2}{2\sigma^2}\right);

(iii) YY 的特征函数为

E[eiξY]=exp(imξσ22ξ2).E\left[e^{\mathrm{i}\xi Y}\right] = \exp\left(\mathrm{i}m\xi - \frac{\sigma^2}{2}\xi^2\right).

于是我们有

E[Y]=m,var(Y)=σ2.E[Y] = m, \quad \mathrm{var}(Y) = \sigma^2.

通过推广,若 Y=mY = m 几乎必然成立,我们称 YY 服从 N(m,0)\mathcal{N}(m, 0) 分布的高斯变量(此时性质(iii)仍然成立)。

假设 YY 服从 N(m,σ2)\mathcal{N}(m, \sigma^2) 分布,YY^\prime 服从 \mathcal{N}(m^\prime, \sigma^\prime^2) 分布,且 YYYY^\prime 独立。那么 Y+YY + Y^\prime 服从 \mathcal{N}(m + m^\prime, \sigma^2 + \sigma^\prime^2) 分布。这是性质(iii)的直接推论。

命题1.1

(Xn)n1(X_n)_{n \geq 1} 是实随机变量序列,使得对每个 n1n \geq 1XnX_n 服从 N(mn,σn2)\mathcal{N}(m_n, \sigma_n^2) 分布。假设 XnX_nL2L^2 中收敛到 XX。则:
(i) 随机变量 XX 服从 N(m,σ2)\mathcal{N}(m, \sigma^2) 分布,其中 m=limmnm = \lim m_nσ=limσn\sigma = \lim \sigma_n
(ii) 该收敛在所有 LpL^p 空间(1p<1 \leq p < \infty)中也成立。

注记

XnX_nL2L^2 中收敛到 XX 的假设可弱化为依概率收敛(事实上,序列 (Xn)n1(X_n)_{n \geq 1} 的依分布收敛就足以得到部分(i))。我们将其留给读者作为练习。

证明

(i) L2L^2 中的收敛蕴含当 nn \to \infty 时,mn=E[Xn]m_n = E[X_n] 收敛到 E[X]E[X]σn2=var(Xn)\sigma_n^2 = \mathrm{var}(X_n) 收敛到 var(X)\mathrm{var}(X)。然后,令 m=E[X]m = E[X]σ2=var(X)\sigma^2 = \mathrm{var}(X),对每个 ξR\xi \in \mathbb{R},有

E[eiξX]=limnE[eiξXn]=limnexp(imnξσn22ξ2)=exp(imξσ22ξ2),E[e^{\mathrm{i}\xi X}] = \lim_{n \to \infty} E[e^{\mathrm{i}\xi X_n}] = \lim_{n \to \infty} \exp\left(\mathrm{i}m_n\xi - \frac{\sigma_n^2}{2}\xi^2\right) = \exp\left(\mathrm{i}m\xi - \frac{\sigma^2}{2}\xi^2\right),

这表明 XX 服从 N(m,σ2)\mathcal{N}(m, \sigma^2) 分布。

(ii) 由于 XnX_nσnN+mn\sigma_n N + m_n 有相同的分布(其中 NN 是标准高斯变量),且序列 (mn)(m_n)(σn)(\sigma_n) 是有界的,我们立即看到

supnE[Xnq]<,q1.\sup_n E[|X_n|^q] < \infty, \quad \forall q \geq 1.

由此可得

supnE[XnXq]<,q1.\sup_n E[|X_n - X|^q] < \infty, \quad \forall q \geq 1.

p1p \geq 1。序列 Yn=XnXpY_n = |X_n - X|^p 依概率收敛到 00,且是一致可积的(因为它在 L2L^2 中有界,由前面 q=2pq = 2p 时的界保证)。由此可知该序列在 L1L^1 中收敛到 00,这就是所需的结果。
\square

1.2 Gaussian Vectors

EEdd 维欧几里得空间(EE 同构于 Rd\mathbb{R}^d,我们可以取 E=RdE = \mathbb{R}^d,配备通常的内积,但在抽象空间中处理会更方便)。我们用 u,v\langle u, v \rangle 表示 EE 中的内积。取值于 EE 的随机变量 XX 称为 高斯向量,如果对每个 uEu \in Eu,X\langle u, X \rangle 是(实)高斯变量。(例如,若 E=RdE = \mathbb{R}^d,且 X1,,XdX_1, \dots, X_d 是独立高斯变量,由独立高斯变量和的性质可知,随机向量 X=(X1,,Xd)X = (X_1, \dots, X_d) 是高斯向量。)

XX 是取值于 EE 的高斯向量。则存在 mXEm_X \in EEE 上的非负二次型 qXq_X,使得对每个 uEu \in E

E[u,X]=u,mX,E[\langle u, X \rangle] = \langle u, m_X \rangle,

var(u,X)=qX(u).\mathrm{var}(\langle u, X \rangle) = q_X(u).

事实上,设 (e1,,ed)(e_1, \dots, e_d)EE 的一组标准正交基,在该基下将 XX 表示为 X=j=1dXjejX = \sum_{j=1}^d X_j e_j。注意到随机变量 Xj=ej,XX_j = \langle e_j, X \rangle 是高斯的。于是立即可得,前面的公式对 mX=j=1dE[Xj]ej=(not.)E[X]m_X = \sum_{j=1}^d E[X_j] e_j \stackrel{(\text{not.})}{=} E[X] 成立,且若 u=j=1dujeju = \sum_{j=1}^d u_j e_j,则

qX(u)=j,k=1dujukcov(Xj,Xk).q_X(u) = \sum_{j,k=1}^d u_j u_k \mathrm{cov}(X_j, X_k).

由于 u,X\langle u, X \rangle 服从 N(u,mX,qX(u))\mathcal{N}(\langle u, m_X \rangle, q_X(u)) 分布,我们得到随机向量 XX 的特征函数:

E[exp(iu,X)]=exp(iu,mX12qX(u)).(1.1)E[\exp(\mathrm{i}\langle u, X \rangle)] = \exp\left(\mathrm{i}\langle u, m_X \rangle - \frac{1}{2}q_X(u)\right). \tag{1.1}

命题1.2

在上述假设下,随机变量 X1,,XdX_1, \dots, X_d 相互独立当且仅当协方差矩阵 (cov(Xj,Xk))1j,kd(\mathrm{cov}(X_j, X_k))_{1 \leq j, k \leq d} 是对角的,或者等价地,当且仅当 qXq_X 在基 (e1,,ed)(e_1, \dots, e_d) 下是对角形式。

证明 若随机变量 X1,,XdX_1, \dots, X_d 相互独立,则协方差矩阵 (cov(Xj,Xk))j,k=1,,d(\mathrm{cov}(X_j, X_k))_{j, k=1, \dots, d} 是对角的。反之,若该矩阵是对角的,对每个 u=j=1dujejEu = \sum_{j=1}^d u_j e_j \in E,有

qX(u)=j=1dλjuj2,q_X(u) = \sum_{j=1}^d \lambda_j u_j^2,

其中 λj=var(Xj)\lambda_j = \mathrm{var}(X_j)。因此,利用(1.1),

E[exp(ij=1dujXj)]=j=1dexp(iujE[Xj]12λjuj2)=j=1dE[exp(iujXj)],E\left[ \exp\left( \mathrm{i}\sum_{j=1}^d u_j X_j \right) \right] = \prod_{j=1}^d \exp\left(\mathrm{i}u_j E[X_j] - \frac{1}{2}\lambda_j u_j^2\right) = \prod_{j=1}^d E\left[\exp(\mathrm{i}u_j X_j)\right],

这蕴含 X1,,XdX_1, \dots, X_d 相互独立。
\square

与二次型 qXq_X 相关联,我们引入 EE 上唯一的对称自同态 γX\gamma_X,使得

qX(u)=u,γX(u)q_X(u) = \langle u, \gamma_X(u) \rangle

γX\gamma_X 在基 (e1,,ed)(e_1, \dots, e_d) 下的矩阵是 (cov(Xj,Xk))1j,kd(\mathrm{cov}(X_j, X_k))_{1 \leq j, k \leq d},但显然 γX\gamma_X 的定义不依赖于基的选取)。注意 γX\gamma_X 是非负的,即其所有特征值都是非负的。

从现在起,为简化陈述,我们将注意力限制在 中心化高斯向量 上,即满足 mX=0m_X = 0 的高斯向量,但以下结果容易推广到非中心化情形。

定理1.3

(i) 设 γ\gammaEE 上的非负对称自同态。则存在高斯向量 XX 使得 γX=γ\gamma_X = \gamma

(ii) 设 XX 是中心化高斯向量。设 (ε1,,εd)(\varepsilon_1, \dots, \varepsilon_d)EE 的一组基,在该基下 γX\gamma_X 是对角的,即对每个 1jd1 \leq j \leq dγXεj=λjεj\gamma_X \varepsilon_j = \lambda_j \varepsilon_j,其中

λ1λ2λr>0=λr+1==λd\lambda_1 \geq \lambda_2 \geq \cdots \geq \lambda_r > 0 = \lambda_{r+1} = \cdots = \lambda_d

于是 rrγX\gamma_X 的秩。则

X=j=1rYjεj,X = \sum_{j=1}^r Y_j \varepsilon_j,

其中 YjY_j1jr1 \leq j \leq r)是独立的(中心化)高斯变量,且 YjY_j 的方差为 λj\lambda_j。因此,若 PXP_X 表示 XX 的分布,则 PXP_X 的拓扑支撑是由 ε1,,εr\varepsilon_1, \dots, \varepsilon_r 张成的向量空间。此外,PXP_X 关于 EE 上的勒贝格测度绝对连续当且仅当 r=dr = d,此时 XX 的密度为

pX(x)=1(2π)d/2detγXexp(12x,γX1(x)).p_X(x) = \frac{1}{(2\pi)^{d/2} \sqrt{\det \gamma_X}} \exp\left(-\frac{1}{2}\langle x, \gamma_X^{-1}(x) \rangle\right).

1.3 高斯过程与高斯空间

从现在起到本章结束,我们仅考虑 中心化高斯变量,且经常省略“中心化”一词。

定义1.4

(中心化)高斯空间L2(Ω,F,P)L^2(\Omega, \mathcal{F}, P) 的一个闭线性子空间,其中仅包含中心化高斯变量。

例如,若 X=(X1,,Xd)X = (X_1, \dots, X_d)Rd\mathbb{R}^d 中的中心化高斯向量,由 {X1,,Xd}\{X_1, \dots, X_d\} 张成的向量空间是一个高斯空间。

定义1.5

(E,E)(E, \mathcal{E}) 是可测空间,TT 是任意指标集。取值于 EE 的(以 TT 为指标的)随机过程 是一族 (Xt)tT(X_t)_{t \in T} 的取值于 EE 的随机变量。若未指定可测空间 (E,E)(E, \mathcal{E}),我们默认 E=RE = \mathbb{R}E=B(R)\mathcal{E} = \mathcal{B}(\mathbb{R})R\mathbb{R} 上的 Borel σ\sigma-域

在此及本书中,我们用 B(F)\mathcal{B}(F) 表示拓扑空间 FF 上的 Borel σ\sigma-域。大多数时候,指标集 TTR+\mathbb{R}_+ 或实直线的另一个区间。

定义1.6

(实值)随机过程 (Xt)tT(X_t)_{t \in T} 称为(中心化)高斯过程,若对任意有限个 XtX_ttTt \in T)的线性组合都是中心化高斯的。

命题1.7

(Xt)tT(X_t)_{t \in T} 是高斯过程,则由变量 XtX_ttTt \in T)张成的 L2L^2 闭线性子空间是一个高斯空间,称为 由过程 XX 生成的高斯空间

证明 只需注意到由命题1.1,中心化高斯变量的 L2L^2 极限仍然是中心化高斯的。
\square

我们现在转向高斯空间中的独立性性质。我们需要以下定义。

定义1.8

HH 是定义在 (Ω,F,P)(\Omega, \mathcal{F}, P) 上的随机变量族。HH 生成的 σ\sigma-域,记为 σ(H)\sigma(H),是 Ω\Omega 上使所有 ξH\xi \in H 关于该 σ\sigma-域可测的最小 σ\sigma-域。若 C\mathcal{C}Ω\Omega 的子集族,我们也用 σ(C)\sigma(\mathcal{C}) 表示 Ω\Omega 上包含 C\mathcal{C} 所有元素的最小 σ\sigma-域。

下一定理表明,在某种意义上,独立性等价于高斯空间中的正交性。这是高斯分布的一个非常特殊的性质。

定理1.9

HH 是中心化高斯空间,(Hi)iI(H_i)_{i \in I}HH 的线性子空间族。则子空间 HiH_iiIi \in I)在 L2L^2 中(两两)正交当且仅当 σ\sigma-域 σ(Hi)\sigma(H_i)iIi \in I)相互独立。

注记

向量空间 HiH_i 是公共高斯空间 HH 的子空间这一点至关重要。例如,考虑一个服从 N(0,1)\mathcal{N}(0, 1) 分布的随机变量 XX,另一个与 XX 独立的随机变量 ε\varepsilon 满足 P[ε=1]=P[ε=1]=1/2P[\varepsilon = 1] = P[\varepsilon = -1] = 1/2。则 X1=XX_1 = XX2=εXX_2 = \varepsilon X 都服从 N(0,1)\mathcal{N}(0, 1) 分布。此外,E[X1X2]=E[ε]E[X2]=0E[X_1 X_2] = E[\varepsilon] E[X^2] = 0。尽管如此,X1X_1X2X_2 显然不独立(因为 X1=X2|X_1| = |X_2|)。在这个例子中,(X1,X2)(X_1, X_2) 不是 R2\mathbb{R}^2 中的高斯向量,尽管两个坐标都是高斯变量。

证明

假设 σ\sigma-域 σ(Hi)\sigma(H_i) 相互独立。则若 iji \neq j,若 XHiX \in H_iYHjY \in H_j

E[XY]=E[X]E[Y]=0,E[XY] = E[X]E[Y] = 0,

故线性空间 HiH_i 两两正交。

反之,假设线性空间 HiH_i 两两正交。由无限个 σ\sigma-域独立性的定义,只需证明若 i1,,ipIi_1, \dots, i_p \in I 是不同的,σ\sigma-域 σ(Hi1),,σ(Hip)\sigma(H_{i_1}), \dots, \sigma(H_{i_p}) 相互独立。为此,只需验证若 ξ11,,ξn11Hi1,,ξ1p,,ξnppHip\xi_1^1, \dots, \xi_{n_1}^1 \in H_{i_1}, \dots, \xi_1^p, \dots, \xi_{n_p}^p \in H_{i_p} 是固定的,则向量 (ξ11,,ξn11),,(ξ1p,,ξnpp)(\xi_1^1, \dots, \xi_{n_1}^1), \dots, (\xi_1^p, \dots, \xi_{n_p}^p) 相互独立(事实上,对每个 j{1,,p}j \in \{1, \dots, p\},形如 {ξ1jA1,,ξnjjAnj}\{\xi_1^j \in A_1, \dots, \xi_{n_j}^j \in A_{n_j}\} 的事件构成一个对有限交封闭的类,生成 σ\sigma-域 σ(Hij)\sigma(H_{i_j}),由标准的单调类论证可得所需结果,见附录A1)。然而,对每个 j{1,,p}j \in \{1, \dots, p\},我们可以找到由 {ξ1j,,ξnjj}\{\xi_1^j, \dots, \xi_{n_j}^j\} 张成的 L2L^2 线性子空间的一组标准正交基 (η1j,,ηmjj)(\eta_1^j, \dots, \eta_{m_j}^j)。则向量

(η11,,ηm11,η12,,ηm22,,η1p,,ηmpp)(\eta_1^1, \dots, \eta_{m_1}^1, \eta_1^2, \dots, \eta_{m_2}^2, \dots, \eta_1^p, \dots, \eta_{m_p}^p)

的协方差矩阵是单位矩阵(因为 iji \neq j 时,E[ηijηlk]=0E[\eta_i^j \eta_l^k] = 0,因 HiH_iHjH_j 正交)。此外,该向量是高斯的,因为其分量属于 HH。由命题1.2,该向量的分量是独立随机变量。这进而蕴含向量 (η11,,ηm11),,(η1p,,ηmpp)(\eta_1^1, \dots, \eta_{m_1}^1), \dots, (\eta_1^p, \dots, \eta_{m_p}^p) 相互独立。等价地,向量 (ξ11,,ξn11),,(ξ1p,,ξnpp)(\xi_1^1, \dots, \xi_{n_1}^1), \dots, (\xi_1^p, \dots, \xi_{n_p}^p) 相互独立,这就是所需结果。
\square


SDE 讨论班 Lec 01-2
http://dbqdss.github.io/2025/10/24/个人学习笔记/Math Notes/SDE讨论班/SDE-Lec01-2/
作者
失去理想的獾
发布于
2025年10月24日
许可协议