度量空间

度量空间必须满足四个性质:(1) 非负性;(2) 非退化性;(3) 对称性;(4) 三角不等式。

$C[a, b]$ 上的 $d_p$ 度量不够好,有的时候不收敛;而 $d_\infty$ 度量比较好用。

离散度量:

$$ d(x, y) = \begin{cases} 0, x=y\\ 1, x\ne y \end{cases} $$

p 阶可和:

$$ \sum_{i=1}^\infty|x_n|^p \lt \infty $$

无穷可和:

$$ \exist C \ge 0, \forall n \ge 1, |x_n| \le C. $$

开集和闭集

设 $(X, d)$ 为度量空间,令

$$ B(x_0,r)=\lbrace x\in X{:}d(x_0,x) < r\rbrace \\ \bar{B}(x_0,r)=\lbrace x\in X{:}d(x_0,x)\leqslant r\rbrace \\ S(x_0,r)=\lbrace x\in X{:}d(x_0,x)=r\rbrace $$

称 $B$, $\bar{B}$, $S$ 分别为开球、闭球、球面。

对于 $M \subset X$, $x_0 \in M$,如果存在 $r > 0$ 使得 $B(x_0, r)\subset M$,则 $x_0$ 为 $M$ 的内点,$M$ 的所有内点称为“内部”,记为 $M\degree$。如果 $M = M\degree$,则称 $M$ 为开集。若 $F^c = X\setminus F$ 为开集,则 $F$ 称为闭集。

$M\degree$ 是 M 内的最大开集。

开集的基本性质:

(1) $X$,空集都是开集。(X 本身可以是闭区间、半开半闭区间,这都无所谓,因为我们是在度量空间 (X, d) 上定义的开和闭)

(2) 任意多个开集的并集仍然是开集。

(3) 有限个开集的交集仍然是开集。(无限多个开集的交集未必是开集,$X=\R$,$G_n=(\frac1n, +\infty)$,则 $\cap_{n=1}^\infty G_n = [0, \infty]$ 不是开集,因为 0 不是它的内点。)

基于上述的三条性质还可以定义拓扑空间的概念,度量空间属于一种特殊的拓扑空间。

离散度量空间中,所有的集合都是开集,并且所有的集合也都是闭集。

闭集的基本性质:

(1) $X$,空集都是闭集。

(2) 任意多个闭集的交集仍然是闭集。

(3) 有限个闭集的并集仍然是闭集。

闭集可以定义聚点,导集 $M^\prime$,闭包 $\bar{M}$ 的概念。如果某个集合 $M$ 满足 $M=\bar{M}$,则可以断定 $M$ 为闭集。同时,闭包是包含 M 的最小闭集。(这概念的定义是否与内点、内部的概念对偶?一个是并,一个是交。相交非空,取反就是集合的包含关系。)

连续映射:
设两个度量空间 $(X_1, d_1)$,$(X_2, d_2)$,映射 T 满足对任意 $\varepsilon > 0$,存在 $\delta > 0$,当 $d(x_1, x_2) < \delta$ 时,有 $d(Tx_1, Tx_2) \le \varepsilon$。

反直觉的事情:离散度量空间 $(X_1, d_1)$ 的映射总是连续映射。

连续映射可以用逆像的开集刻画:连续映射的充要条件是任意开集的逆像为开集。类似的,闭集的逆像为闭集同样可以刻画映射的连续性。

稠密子集:如果 $M\sub X$ 且 $\bar M = X$,称 $M$ 为 $X$ 的稠密子集。如果 $X$ 有 至多可数的稠密子集,称 $X$ 为可分度量空间。(我一直理解错了,认为是“至多可数个”稠密子集,实际上是“存在一个稠密子集,它是至多可数的”。

$M \sub X$ 可以推出 $\bar M \sub X$(奇怪,X 是整个空间,我们讨论的任意集合都应该被包含于 $X$,不需要任何条件才对),因此稠密实际上是说 $X \sub \bar M$,也就是给定任意 $x\in X, r>0$,一定存在 $m\in M$ 使得 $d(x,m) < r$。稠密本质上就是说 X 中任意元素可以用 M 的元素任意逼近。另外,$K^n$ 是可分的。

可数

关于映射的性质:

  1. 单射的复合是单射;
  2. 满射和满射的复合是满射;
  3. 双射的复合是双射。

逆映射:

$$ T T^{-1} = I_Y\\ T^{-1}T = I_X $$

如何比较两个集合的大小?

有限集:直接计算个数即可;

无穷集:如果存在 $A\to B$ 的双射,则 $A, B$ 为等势。记为 $A\sim B$。等势关系具有反身性,对称性,传递性。

可数集:如 $A \sim \N = \lbrace1,2, 3,\dots\rbrace$,称 $A$ 为可数集。

可以证明:如果我能够把集合的所有元素列出来:$A = \lbrace a_1, a_2, \dots, a_n, \dots\rbrace$,元素两两不等,那么 $A$ 就是一个可数集。

有理数是可数的,这个好证。另外,代数数也是可数的。

至多可数:如果一个集合为有限集或者可数集,则称之为至多可数。

一个可数集的子集是至多可数的。

至多可数个可数集的并集为可数集。(证明:对角线遍历即可)由此可以推出,有限个可数集的笛卡尔积还是可数集。因此 $\mathbb Q^n$ 是可数集。

$(0,1)$ 不是可数集。$\R \setminus \mathbb Q$ 是可数集, $(a, b) \cap \mathbb Q$ 是可数集。

$(0,1)\sim(a, b)\sim\R$

可数个可数集的笛卡尔积不一定是可数集。例子:无限长的二进制序列$\lbrace0,1\rbrace^\N = \lbrace0,1\rbrace \times \lbrace0,1\rbrace \times …$ 不是可数集。

$\mathcal P_n$ 为次数≤ n 的整系数多项式集合。代数数集合$\mathcal A = \lbrace P_1的根, P_2的根, …\rbrace$ 是可数的。

可分度量

回到稠密和可分度量空间的讨论来。

$({\mathcal l}^p, d_p)$ 为可分空间。例如,$\mathbb K = \R$ 的情况下, $M=\lbrace(x_n)_{n\ge1}, x_n\in\mathbb Q, \exist N, \forall n \gt N,x_n=0\rbrace \subset l^p$ 是一个稠密子集。首先可以证明 $\bar M = l^p$。接下来,对 M “分层”:$M=\bigcup_{n=1}^{\infty}\lbrace(x_n)_{n\ge1}| x_n\in \mathbb Q, \forall n\ge m, x_n=0\rbrace$,可数个可数集的并集还是可数集,因此 $M$ 是可数的,$l^p$ 是可分度量空间。

但是,$(l^\infty, d_\infty)$ 不是可分度量空间。我们可以构造 $M=\lbrace \lbrace x_n\rbrace \in\ell^\infty:x_n=0,\text{或者 }x_n=1\rbrace \sim \lbrace0, 1\rbrace^\N$,对任意稠密子集 $N$,利用稠密性可以构造一个从 $M\to N$ 的单射($m_1\ne m_2\Rightarrow n_1\ne n_2$),$M$ 是不可数的,从而 $M$ 的像集也是不可数的,而 $M$ 的像集是 $N$ 的子集,一个可数集的子集怎么可能是不可数的呢?所以 $N$ 一定是不可数的。

可以证明 $\bar {\mathbb Q^n} = \R^n$,$\overline{\mathbb Q^n + i\mathbb Q^n} = \mathbb C^n$,因此 $K^n$ 是可分的。

对于离散度量空间,$X$ 为至多可数集是 $(X, d)$ 可分的充要条件。因为离散度量空间中任何子集都是闭集,因此 $M = \bar M$,稠密又必须有 $\bar M = X$,因此只能是 $M = X$ 成立,$M$ 至多可数等价于 $X$ 至多可数。

$C[a, b]$ 也是可分度量空间。实际上整系数多项式集合 $\mathcal P$ 满足 $\bar{\mathcal P} = C[a, b]$。对于 $d_\infty$ 度量,可以用 stone-weirstrass 定理直接证明,而对于 $d_p$ 度量,$d_p(x, y) \le (b-a)^{1/p}d_\infty(x, y)$,自然也可证明。

收敛性,完备性及紧性

收敛性

若存在 $x\in X$ 使得

$$ \underset{n\to\infty}{\operatorname*{\operatorname*{\lim}}}d(x_n,x)=0, $$

则称 ${x_n}$ 在 $X$ 中收敛。记为 $\lim_{n\to\infty}x_{n}=x$,或者$x_n\to x$。

如果非空子集 $M$ 被包含在 $X$ 的某个开球内,称 $M$ 为有界集。实际上,$M$ 有界等价于 $\forall x \in X,\exists r > 0,M\subset B(x, r)$。

定理:$x_n\to x$,则

(1)${x_n: n\ge1}$ 为有界集。

(2)$x$ 唯一。

利用序列的收敛性,我们可以更方便地证明一个集合为闭集了。

定理:对于 $M\subset X$

(1) $x\in \bar M$ 当且仅当存在 $M$ 的序列 $x_n$,满足 $x_n\to x$;

(2) $M$ 为闭集 当且仅当 对任意收敛到 $x$ 的 $M$ 中序列 $x_n$,有 $x\in M$。

(1) 证明:若 $x\in M$,则必然存在 $x_n \in B(x, \frac1n)\cap \bar M$,因此 $0\le d(x, x_n) \le \frac1n$,取极限即可;

若从右边证明左边,对任意 $\delta \gt 0$,存在 $n \gt N$ 使得 $d(x, x_n) \lt \delta$,因此,$x_n \in B(x, \delta)$,又因为 $x_n\in M$,因此$B(x, \delta)\cap M \ne \empty$,从而 $x \in \bar M$。

(2) 证明:从左到右:由于 $x_n\to x$,根据 (1) 从右推左,得到 $x\in \bar M = M$;

从右到左:首先 $M \subset M\cup M^\prime = \bar M$ 显然成立。接下来,对任意 $x\in \bar M$,根据 (1) 左推右,存在 M 中序列 $x_n$ 使得 $x_n\to x\in \bar M$,又根据条件可以推出 $x\in M$,因此 $\forall x\in \bar M \Rightarrow x\in M$,从而得知 $\bar M \subset M$。综合得到 $\bar M = M$,即 $M$ 为闭集。

这里最迷惑的地方是 (2) 的“对任意收敛到 $x$ 的 $M$ 中序列 $x_n$”,我们知道任意可以推存在而存在不能推任意。但是 (2) 的从左到右证明是证明任意性成立,过程用到了 (1) ,而(1) 是一个存在性的定理,存在怎么推任意呢,似乎出现了逻辑问题。(我有点难以表达这段话的意思,总之就是在这里的理解出现了差错。)实际上并不矛盾,因为他们的“任意”和“存在”描述的并不是同一个对象!实际上我们完全可以把 (1) 的充分性定理写成:“对任意$M$中序列 $x_n$,如果 $x_n$ 收敛到 $x$,则 $x\in \bar M$”,所谓的存在性本质上也是任意性罢了,当然这样写的话必要性定理就不好表达,所以书上没有采用这种写法。

收敛性可以用来刻画映射的连续性:

定理:$T: X_1\to X_2$,$y\in X_1$,则 $T$ 在 $x=y$ 处连续等价于 $\forall x_n\in X_1, x_n\to y$ 有 $Tx_n \to Ty$。

柯西列:$\forall \varepsilon \gt 0$,$\exist N$,$s.t. \forall m, n \ge N$,$d(x_m, x_n) \lt \varepsilon$。

收敛列都属于柯西列,反之不一定。

完备性

如果所有柯西列都是收敛列(收敛到 $X$ 中的某个点),则称度量空间 $(X,d)$ 是完备的:$\forall x_n \in X$ 为柯西列,$\exist x \in X$,$s.t. x_n\to x$。

$X=\R,\mathbb C$,$d(x,y)=|x-y|$,是完备的。

离散度量空间为完备的。

设 $M = \lbrace(x_n)_{n\ge1}, \exist N, \forall n \ge N, x_n=0\rbrace\subset \ell^1$,$(M, d_1)$ 是不完备的。

首先,取序列 $x_n = (\frac12,\frac14,\dots,\frac1{2^n}, 0, 0, \dots) \subset M$(注意这里的 $n$ 含义为序列的下标,与 $M$ 定义的 $n$ 不同,$M$ 中的 $n$ 是分量的下标),对任意 $m \ge n \ge 1$,$d_1(x_m,x_n) = \sum_{i=n+1}^m\frac{1}{2^i} \le \frac{1}{2^n}$。因此 $x_n$ 是柯西列。但是,假设存在 $x \in M$ 使得 $x_n\to x$,则存在 $N$ 使得 $x$ 从第 $N$ 个分量起都是 $0$。对于任意 $n\ge N+1$, $d_1(x_n, x) \ge \frac1{2^N}$,因此 $x_n \not\to x$。

定理:柯西列均为有界列。

证明:取 $\varepsilon = 1$,存在 $N$,使得对任意 $m,n \ge N$,有 $d(x_m, x_n)\lt 1$,因此 $d(x_m, x_N)\le1$。只要取 $r = \max\lbrace1, d(x_N, x_1), d(x_N, x_2), \dots, d(x_{N-1}, x_N)\rbrace + 1$,就有 $\forall n \gt 1, x_n \in B(x_N, r)$。

定理:$M\in X$
(1)若 $M$ 是完备的,则 $M$ 为闭集。
(2)若 $(X,d)$ 是完备的, 则 $M$ 完备当且仅当 $M$ 为闭集。

(1)证明:对任意收敛列 $x_n\in M\to x \in X$,则 $x_n$ 为 $X$ 中的柯西列,也为 $M$ 中的柯西列,由于 $M$ 完备,存在 $y \in M$ 使得 $x_n \to y$,所以 $x = y \in M$,所以 $M$ 为闭集。

(2)证明:只要从右往左证明。 $M\in X$ 为闭集,则对任意 $x_n \in M \to x$,$x \in M$。对任意 $M$ 中的柯西列 $x_n$,它也是 $X$ 中的柯西列,$X$ 的完备性推出 $x_n \to x \in X$,由闭集的性质得到 $x\in M$,因此 $(M,d)$ 是完备的。

对于同集合,可以有不同的度量,度量之间可能有强弱之分:

$$ d_1(x, y) \le \alpha d_2(x, y), \forall x, y \in X, \exist \alpha \gt 0 $$

称 $d_2$ 强于 $d_1$.

此时构造映射 $T: (X, d_1) \to (X, d_2)$, $x \mid\to x$,为 Lipschitz 映射,因此为连续映射。由连续映射的等价定义,$(X, d_2)$ 中的开集、闭集在 $(X, d_1)$ 中也是开集、闭集。此外,容易得到,$(X, d_1)$ 上的收敛列、柯西列,在 $(X, d_2)$ 上也是收敛列、柯西列,且收敛到的点不变。

如果

$$ \alpha d_1(x, y) \le d_2(x, y) \le \beta d_1(x, y), \forall x, y \in X, \exist \alpha,\beta \gt 0 $$

称 $d_1$ 和 $d_2$ 是等价度量。

等价度量:具有相同的开集、闭集、内点、内部、聚点、闭包、柯西列、收敛性(收敛点相同)、完备性、稠密性、可分性。

对于 $X=\mathbb K^n$,$d_\infty(x, y) \le d_p(x, y) \le n^{\frac1p}d_\infty(x, y)$,因此 $d_p$ 与 $d_\infty$ 等价,$d_p$ 之间相互也等价。要想探究它的完备性,只需要证明 $(\mathbb K^n, d_\infty)$ 是完备的。

假设我们已经在高等数学里面证明过了 $\R, \mathbb C$ 是完备的。对任意 $\mathbb K^n$ 中的柯西列,存在 $N$ 使得对任意 $k, l \ge N$, $d_\infty(x_k, x_l)< \varepsilon/2$,即 $|x_{k,i}-x_{l,i}|\lt \varepsilon/2$,因此 $(x_{k,i})_{k\ge1}$ 是 $\mathbb K$ 中的柯西列也是收敛列,取 $l\to\infty$,$x_{l,i}\to a_i$,则 $|x_{k,i} - a_i| \le \varepsilon/2$,因此 $d_\infty(x_l, a) \le \varepsilon/2 \lt \varepsilon$,$x_n$ 是收敛的。因此 $\mathbb K^n$ 是完备的。

$\mathbb Q$ 在 $\R$ 中是不完备的,因为 $\mathbb Q$ 在 $\R$ 中不是闭集。

完备性的判断只需要看柯西列是不是收敛列就行,而这里的反例之所以“不完备”,不是因为柯西列不收敛,而是因为柯西列没有收敛到给定度量空间的某个点,它收敛到外面的点去了!假如我们扩张度量空间的集合范围,有可能找到一个完备的空间。
反过来呢,如果我们有一个完备的空间,我们只需要从这个空间里找一个闭集就可以构造另一个完备的空间。

$(\ell^\infty, d_\infty)$ 是完备的度量空间。证明:对任意柯西列 $x_n$,存在 $N$ 使得对任意 $k, l \ge N$, $d_\infty(x_k, x_l)< \varepsilon/2$,即 $|x_{k,i}-x_{l,i}|\lt \varepsilon/2$,因此 $(x_{k,i})_{k\ge1}$ 是 $\mathbb K$ 中的柯西列也是收敛列,取 $l\to\infty$,$x_{l,i}\to a_i$,则 $|x_{k,i} - a_i| \le \varepsilon/2$,因此 $d_\infty(x_l, a) = \sup|x_{l,i} - a_i| \le \varepsilon/2 \lt \varepsilon$。接下来的关键问题是证明 $a \in \ell^\infty$。$|a_i| \le |a_i + x_{k, i}| \le \varepsilon / 2 + C_k$ 因此 $a\in \ell^\infty$。因此 $x_n \to a\in M$,$(\ell^\infty, d_\infty)$ 完备。

$(\ell^p, d_p)$ 是完备的。$\forall \varepsilon > 0$,$\exist K, \forall k, l \ge K$, $d_p(x_l, x_k) = (\sum_{n=1}^\infty |x_{k,n} - x_{l, n}|^p)^{1/p}\lt \varepsilon / 2$。对任意 $n \ge 1$,$|x_{k, n} - x_{l, n}| \lt \varepsilon / 2$,因此 $(x_{l, n})_{k\ge1}$ 是 $\mathbb K$ 中的柯西列,因此设 $x_{l, n} \to a_n$,$a = (a_1, a_2, \dots)$。从而 $d(x_k, a) = \sum_{n=1}^\infty(|x_{k,n} - a_{n}|^p)^{1/p} = \lim\limits_{l\to\infty}\sum_{n=1}^\infty(|x_{k,n} - x_{l, n}|^p)^{1/p} \le \varepsilon / 2 \lt \varepsilon$,此时只需要证明 $a\in \ell^p$。

对于连续函数 $X=C[a, b]$,$(C[a, b], d_\infty)$ 是完备的.$d_\infty$,$d_p(x, y)\le (b-a)^{1/p}d_\infty(x,y)$。对任意 $\varepsilon \gt 0$,$\exist K, \forall k,l\ge K, d_\infty(x_k, x_l) \le \varepsilon/8$。即 $\forall t \in [a, b], |x_k(t) - x_l(t)| \lt \varepsilon / 8$。因此 $x_k(t)$ 是 $\mathbb K$ 中的柯西列。我们假设在每个点 $t$,$x_k(t) \to x(t)$。$d(x(t), x_k(t)) = \lim\limits_{l\to\infty} d(x_l(t), x_k(t)) \le \varepsilon / 8 \Rightarrow \forall t\in[a, b], |x(t) - x_k(t)| \le \varepsilon / 8$。接下来我们只要证明 $x \in C[a, b]$,也就是证明它的连续性:$\lim_{t\to t_0}x(t) = x(t_0)$。由于 $x_k \in C[a,b]$,因此 $\exist \delta \gt 0, |t-t_0| \lt \delta, |x_k(t) - x_k(t_0)| \lt \varepsilon / 8$。

$$ |x(t) - x(t_0)| \le |x(t) - x_k(t)| + |x_k(t) - x_k(t_0)| + |x_k(t_0) - x(t_0)|\\ \le \varepsilon / 8 + \varepsilon / 8 + \varepsilon / 8 \lt \varepsilon $$

从而 $x \in C[a,b]$ 得证。

$(C[a, b], d_p)$ 不完备。例如,当 $p=1$ 时可以构造如下函数:

$$ x_n(t) = \begin{cases} 0, & t\le \frac12\\ 2n(t-1/2), & \frac12 \lt t \le \frac12 + \frac{1}{2n}\\ 1, & t\gt \frac12 + \frac{1}{2n}\\ \end{cases} $$

$d(x_m, x_n) = \frac{1}2(\frac1m - \frac1n)$ 是柯西列,但是它的极限是:

$$ x_n(t) = \begin{cases} 0, & t\le \frac12\\ 1, & t\gt \frac12\\ \end{cases} $$

不是连续函数。

如何证明 $(X, d)$ 是完备的?

  1. 任取柯西列 $x_k \in X$
  2. 找到可能的极限 $x$
  3. 求证 $x\in X$
  4. $x_k \to x$

$c_0=\lbrace {x_n\rbrace \in\ell^\infty:\lim_{n\to\infty}x_n=0}$,$(c_0, d_\infty)$ 是完备的,和前面不同,这里 $c_0 \subset \ell^\infty$,因此只需要证明 $c_0$ 是闭集就可以了!

对于双射 $T$,若满足

$$ d_2(Tx,Ty)=d_1(x,y),\quad x,y\in X_1 $$

称 $T$ 为等距同构。

设$(X,d)$为度量空间,则存在完备度量空间($\hat{X},\hat{d}$)及$\hat{X}$的子空间(M, $\hat{d}|_{M\times M}),M\subset\hat{X}$,使得 $M$ 在$\hat{X}$ 中稠密$,M$ 与($X,d$)等距同构.上述$(\hat{X},\hat{d})$在等距同构意义下是唯一的,即若存在完备度量空间($X^\prime,d^{\prime}$)及其子空间($M^\prime,d^{\prime}|_{M\times M^{\prime}}$),$M^\prime\subset X^{\prime}$,使得 $M^\prime$在$X^{\prime}$中稠密$,(M^\prime,d^{\prime}|_{M\times M^{\prime}})$与$(X,d)$等距同构,则$(\hat{X},\hat{d})$与$(X^\prime,d^{\prime})$等距同构.

上述过程称为完备化,每个度量空间只有一个完备化。

Banach 不动点定理

设$(X,d)$为度量空间$,T:X\boldsymbol{\rightarrow}X$ 为映射、若存在常数$0 \le a< 1$,任给 $x,y\in X$,

$d(Tx,Ty)\leqslant\alpha d\left(x,y\right)$

成立,则称$T$为 压 缩 映 射.

Banach 不动点定理(压缩映像原理)

非空完备度量空间 $(X, d)$ 的压缩映射 $T: X\to X$ 必有唯一的不动点。

证明:$\forall x_0 \in X$,$x_1 = Tx_0$,$x_{n+1} = Tx_n$,则 $x_n$ 为柯西列,因此 $\exist x, x_n \to x$,因此 $Tx = x$,下证 $x$ 为唯一的不动点。实际上如果有 $Tx = x, Ty = y$,则 $d(x, y) = d(Tx, Ty) \le \alpha d(x, y)$,因此 $(1-\alpha)d(x, y) \le 0$,只能有 $d(x, y) = 0$ 即 $x = y$。

注 1:不动点 $x$ 与 初始点 $x_0$ 的选取无关。任取一个点都会收敛到同一个不动点。

注 2:$d(x_n, x) \le \frac{\alpha^n}{1-\alpha}d(x_1, x_0)$(先验估计,可以用来估计 n 次迭代之后 $x_n$ 与不动点之间的距离。)

注 3: $d(x_n, x) \le \frac{\alpha}{1-\alpha}d(x_n, x_{n-1})$

更强的定理:

非空度量空间 $(X, d)$ 有映射 $T: X\to X$,设 $\exist m \ge 1$,$T^m$ 为压缩的映射,则 $\exist ! x \in X$,$Tx = x$。

证明:$S = T^m$ 有唯一不动点 $x$,$Sx = x$。

则 $S^n(Tx) = T^{mn+1}x = T(S^nx) = Tx$,令 $n\to \infty$ 则 $S^n(Tx) \to x$,因此 $Tx = x$ 为不动点。

设闭区间 $I \subset \R$,$d(x, y) = |x - y|$,则 $I$ 是完备的,设 $g: I \to I$ 是 $C^1$ 的,$\forall 0 \le \alpha \lt 1$,有 $|g^\prime(x)| \le \alpha$,则 $\exist ! x_0 \in I, g(x_0) = x_0$。

例子:开平方计算。取 $g(x) = \frac12(x + \frac{c}{x})$,任取 $x_0 \ge \sqrt c$,可以得到 $g(x)$ 有唯一的不动点 $\sqrt c$,且 $g^\prime (x) \le \frac{1}{2} = \alpha$, $d(x_n, \sqrt c) \le \frac{\alpha^n}{1-\alpha}d(x_1, x_0) = \frac{1}{2^{n-1}}d(x_1, x_0)$,因此求解速度是指数收敛的。

例子:线性方程求解。$X = \mathbb K^m, d_\infty(x, y) = \max_{1\le i\le m} |x_i - y_i|$,设 $\mathbb C$ 为 $n$ 阶方阵,且 $b \in \mathbb K^m$,$C = (a_{ij})_{1 \le i, j \le m}$,$T: \mathbb K^m \to \mathbb K^m, x \mapsto Cx + b$。

此时

$$ d_\infty(Tx, Ty) = \max_{1\le i \le m}|\sum_{j = 1}^m a_{ij}(x_j - y_j)| \le \max_{1\le i \le m}\sum_{j = 1}^m |a_{ij}||x_j - y_j| \\ \le (\max_{1\le i \le m}\sum_{j = 1}^m |a_{ij}|)d_\infty(x, y) $$

只要 $\sum\limits_{j = i}^m |a_{ij}| \lt 1$,则 $T$ 为压缩映射,有不动点 $\xi_0 \in \mathbb K^m, T\xi_0 = \xi_0$。

由此,对于任意矩阵 $A$,如果我们想求解 $Ax = b$,可以把 $A$ 分解成 $A = B + G$,其中 $B$ 是可逆矩阵,则

$$ x = B^{-1}Gx + B^{-1}b $$

我们可以设映射 $T: x \mapsto B^{-1}Gx + B^{-1}b$。如果 $\sum\limits_{j = 1}^m |(B^{-1}G)_{ij}| \lt 1$,则 $T$ 为压缩映射,存在唯一不动点 $x = Tx$,从而 $x$ 也是 $Ax = b$ 的唯一解,我们可以通过选取初始值 $x_0$,不断迭代 $T^nx_0$ 来求解矩阵。

我们可以选取合适的 $B$ 和 $G$ 来简化计算。例如,我们取 $B$ 为所有对角线元素构成的矩阵,而 $G$ 为非对角线元素构成的矩阵。

$$ B=\begin{bmatrix}a_{11}&&&&\\&a_{22}&&&\\&&\ddots&&\\&&&&a_{mm}\end{bmatrix} \\ \boldsymbol{B}^{-1}\boldsymbol{G}=\begin{bmatrix}0&a_{11}^{-1}a_{12}&a_{11}^{-1}a_{13}&\cdots&a_{11}^{-1}a_{1m}\\a_{22}^{-1}a_{21}&0&a_{22}^{-1}a_{23}&\cdots&a_{22}^{-1}a_{2m}\\\vdots&\vdots&\vdots&&\vdots\\a_{m}^{-1}a_{m1}&a_{m}^{-1}a_{m2}&a_{m}^{-1}a_{m3}&\cdots&0\end{bmatrix} $$

因此当 $\sum\limits_{j = 2}^{m} |a_{ij}| \lt |a_{ii}|$ 时,$A$ 可逆。这个不等式条件称为行和判据。

定理:若方阵 $A$ 的对角线元素非零且满足行和判据,则 $A$ 可逆。

第三个例子:微分方程局部解的存在性

$a, b\gt 0, R=\lbrace (t,x)\in\mathbb{R}^2:\mid t-t_0\mid\leqslant a,\mid x-x_0\mid\leqslant b\rbrace $,假设 $f: R\to R$ 是矩形区域 $R$ 的连续函数,$\exist k \ge 0, |f(t, u) - f(t, v)| \le k|u - v|$ (Lipschitz 条件),求解初值问题:

$$ \begin{cases}x^{\prime}(t)=f(t,x(t))\\x(t_0)=x_0&\end{cases} $$

在整个矩形内的性质不太好找,但是如果允许缩小范围,我们可以找到一个小的区域,在这个区域中,上述微分方程存在唯一解。

定理:若 $c=\max_{(t,x)\in R}\mid f(t,x)\mid$,$0< \beta<\min\left\lbrace a,\frac{b}{c},\frac{1}{k}\right\rbrace $,此时存在唯一的 $x \in C^1[t_0 - \beta, t_0 + \beta]$,使得 $t\in [t_0 - \beta, t_0 + \beta]$ 时有 $x(t) \in [x_0 - b, x_0 + b]$ 且 $x(t)$ 为上述方程的解。

实际上,我们需要证明 $(\bar B(x_0, c\beta), d_\infty)$ 是完备的,并构造一个压缩映射 $T$.

记 $X = \bar B(x_0, c\beta), I = [t_0 - \beta, t_0 + \beta]$,显然 $X \subset C(I)$ 是闭集,而 $(C(I), d_\infty)$ 是完备的,因此 $(X,d_\infty)$ 是完备的。

定义映射 $T$,$\forall x \in X$,

$$ (Tx)(t) = x_0 + \int_{t_0}^t f(\tau, x(\tau))\mathrm d\tau $$

此时 $|x(\tau) - x(0)| \le c\beta \lt b$,$|\tau - t_0| \le \beta \le a$,因此 $(\tau, x(\tau)) \in R$,上式有意义。$(Tx)(t)$ 当然也是连续函数。

$$ |(Tx)(t) - x_0| = |\int_{t_0}^t f(\tau, x(\tau))\mathrm d\tau| \le c\beta $$

因此 $(Tx)(t) \in X$。因而 $T$ 确实是从 $X$ 到 $X$ 的映射。

另一方面,

$$ \begin{align*} d_\infty(Tx, Ty) &= \max_{t\in I} |\int_{t_0}^t f(\tau, x(\tau)) - f(\tau, y(\tau))\mathrm d\tau|\\ &\le k \max_{t\in I} \int_{t_0}^t |x(\tau) - y(\tau)|\mathrm d\tau\\ &\le k\beta d_\infty(x, y) \end{align*} $$

因此,$T$ 是压缩映射,有唯一不动点 $x$ 使得

$$ x = Tx \Rightarrow\\ x(t) = x_0 + \int_{t_0}^t f(\tau, x(\tau))\mathrm d\tau $$

不难验证 $x(t)\in C^1(I)$,且满足原来的微分方程。

假设还有 $y(t)$ 满足原来的微分方程。则

$$ \int_{t_0}^t y^\prime(\tau)\mathrm d\tau = y(t) - x_0 = \int_{t_0}^t f(\tau, y(\tau))\mathrm d\tau $$

同时

$$ |y(t) - x_0| = |\int_{t_0}^{t} f(\tau, y(\tau))\mathrm d\tau| \le c\beta $$

因此 $y \in X$,$Ty = y$。因此只能 $y = x$。

注意,压缩映射不仅可以从题目给的定义域去找,也可找一个间接的完备度量空间,例如本题中的 $C[a, b]$,原问题求的是 $C^1[a, b]$。但是要注意,不能直接从不动点定理的唯一性证明原问题的唯一性!因为你已经换了一个度量空间,不能直接推出唯一了。因此还需要显式地证明这个东西的唯一性。

接下来是第二类 Fredholm 积分方程的例子:

设 $R = [a, b]^2$ 是连续的,$K: R \to \R$ 是连续的,$v\in C[a, b]$,求解

$$ x(t) = \int_a^b k(t, s)x(s)\mathrm ds + v(t), t\in[a, b] $$

由于 $K \in C[a, b]^2$,$[a, b]^2$ 是有界闭集,因此

$$ C = \max_{t, s \in [a, b]} |K(t, s)| \lt \infty $$

因此定义 $T: C[a, b] \to C[a, b]$,

$$ (Tx)(t) = \int_a^b k(t, s)x(s)\mathrm ds + v(t) $$

由于

$$ d_\infty(Tx, Ty) = \max_{t \in [a, b]} |\int_a^b k(t, s)(x(s) - y(s))\mathrm ds|\\ \le C(b - a) d_\infty(x, y) $$

当 $C(b - a) \lt 1$ 的时候,有唯一的不动点 $x$ 满足积分方程。

下一个例子:Volterra 积分方程

设三角形区域 $R = \lbrace (t, s): a \le t \le b, a \le s \le t\rbrace $,$K: R \to \R$ 是连续的。$v\in C[a, b]$,求解:

$$ x(t) = \int_a^t k(t, s)x(s)\mathrm ds + v(t), t\in[a, b] $$

$$ C = \max_{t, s \in [a, b]} |K(t, s)| \lt \infty $$

定义映射 $T: C[a, b] \to C[a, b]$,

$$ (Tx)(t) = \int_a^t k(t, s)x(s)\mathrm ds + v(t) $$

我们证明:$\forall m \ge 1$,

$$ \begin{align*} |(T^mx)(t) - (T^my)(t)| \le \frac{(C(t-a))^m}{m!} d_\infty(x, y) \end{align*} $$

首先,当 $m = 1$ 的时候成立:

$$ \begin{align*} |(Tx)(t) - (Ty)(t)| &= |\int_a^t K(t, s)(x(s) - y(s))\mathrm ds|\\ &\le (C(t-a)) d_\infty(x, y) \end{align*} $$

假设 $m = k$ 的时候成立,当 $m = k+1$ 时

$$ \begin{align*} |(T^{k+1}x)(t) - (T^{k+1}y)(t)| &= |(TT^{k}x)(t) - (TT^{k}y)(t)|\\ &= |\int_a^t K(t, s)((T^kx)(s) - (T^ky)(s))\mathrm ds|\\ &\le C \int_a^t |(T^kx)(s) - (T^ky)(s)|\mathrm ds\\ &\le C \int_a^t \frac{(C(s-a))^k}{k!} d_\infty(x, y) \mathrm ds\\ &\le C \frac{(C(t-a))^{k+1}}{C(k+1)!} d_\infty(x, y)\\ &= \frac{(C(t-a))^{k+1}}{(k+1)!} d_\infty(x, y) \end{align*} $$

因此对于所有的 $m \ge 1$,结论成立。

由于 $m\to \infty, \frac{(C(t-a))^m}{m!} \to 0$,因此必然存在 $M$ 使得 $\frac{(C(t-a))^M}{M!} \lt 1$。此时 $T^M$ 为压缩映射,由不动点定理的推广可知存在唯一的不动点 $x$ 使得 $x = Tx$。

或者说,任给 $v \in C[a, b]$,题目给的积分方程在 $C[a, b]$ 上有唯一的解。

下一个例子:隐函数存在定理

设 $a\le b$ 固定,$R = \lbrace (x, y): a \le x \le b, y\in \R\rbrace $,$f: R \to \R$ 连续,$f^\prime_y(x, y)$ 在 $L$ 上处处存在,存在 $0 \lt m \lt M$,使得 $m \le f_t^\prime(x, y) \le M$,则 $\exist ! y \in C[a, b]$,$f(x,y(x)) = 0, a \le x \le b$。

$\forall y \in C[a, b]$,

$$ (Ty)(x) = y(x) - \frac1Mf(x, y(x)) $$

则 $T: C[a, b]\to C[a, b]$,$y_1, y_2 \in C[a, b]$。

$$ \begin{align*} &|(Ty_1)(x) - (Ty_2)(x)|\\ &=|y_1(x) - y_2(x) - \frac1M(f(x, y_1(x)) - f(x, y_2(x)))|\\ &= |y_1(x) - y_2(x) - \frac1M(y_1(x) - y_2(x))f^\prime_y(x, y_1(\xi))|\\ &= |y_1(x) - y_2(x)||1 - \frac1Mf^\prime_y(x, y_1(\xi))|\\ &\le (1 - \frac mM)|y_1(x) - y_2(x)|\\ &\le (1 - \frac mM) d_\infty(y_1, y_2) \end{align*} $$

因此 $T$ 为压缩映射,存在唯一的不动点 $y$ 使得

$$ y = Ty \Rightarrow \\ y(x) = y(x) - \frac1Mf(x, y(x)) \Rightarrow \\ f(x, y(x)) = 0 $$

赋范空间

线性空间,维数

在 $X\ne \varnothing$ 上定义加法:$\forall x, y \in X, x + y \in X$。

定义数乘:$\forall x \in X, \forall \lambda \in \mathbb K, \lambda x \in X$。

满足下列8条公理:

  1. $x + y = y + x$
  2. $(x + y) + z = x + (y + z)$
  3. $\exist 0 \in X, 0 + x = x + 0$
  4. $\forall x \in X, \exist -x, (-x) + x = 0$
  5. $\alpha(\beta x) = (\alpha\beta)x$
  6. $1\cdot x = x$
  7. $(\alpha + \beta)x = \alpha x + \beta x$
  8. $\alpha(x + y) = \alpha x + \alpha y$

称 $X$ 是 $\mathbb K$ 上的线性空间。

对于 $C[a, b]$,定义 $f + g$ 和 $\alpha f$,显然 $C[a, b]$ 是一个线性空间。

对 $\ell^p$,可以定义 $(x_n)_{n\ge1} + (y_n)_{n\ge1} = (x_n + y_n)_{n\ge1} \in \ell^p$,$\lambda (x_n)_{n\ge1} = (\lambda x_n)_{n\ge1} \in \ell^p$ 是线性空间。

对于 $S = \lbrace (x_n)_{n\ge1}, x_n \in\mathbb K\rbrace $,${n\ge1} = (x_n + y_n)_{n\ge1} \in S$,$\lambda (x_n)_{n\ge1} = (\lambda x_n)_{n\ge1} \in S$,也是线性空间。

线性子空间:如果 $Y \subset X$ 对加法、数乘封闭,则 $Y$ 是 $X$ 的线性子空间。

$C[a, b]$ 是 $F[a, b]$ 的线性子空间。

$\ell^p$, $\ell^\infty$ 是 $S$ 的线性子空间。

$Y_1, Y_2$ 是 $X$ 的线性子空间,$Y_1 \cup Y_2$ 未必是线性子空间。但是 $Y_1 \cap Y_2$ 是线性子空间。

设 $(Y_i)_{i\in I}$ 是一族线性子空间,则 $\bigcap_{i \in I} Y_i$ 仍然是 $X$ 的线性子空间。

设 $X$ 是线性空间,$M\subset X$ 非空,存在唯一最小的线性子空间包含 $M$,称这个最小的线性子空间为 $\text{span}(M)$

称 $\lambda_1x_1 + \lambda_2x_2 + \dots + \lambda_nx_n$ 为 $x_1, \dots, x_n$ 的线性组合。则

$$ \text{span}(M) = \lbrace \lambda_1x_1 + \lambda_2x_2 + \dots + \lambda_nx_n: n \ge1, x_i\in M, \lambda_i \in \mathbb K\rbrace $$

证明:假设 $N = \lbrace \lambda_1x_1 + \lambda_2x_2 + \dots + \lambda_nx_n: n \ge1, x_i\in M, \lambda_i \in \mathbb K\rbrace $,则 $\forall x \in M, x = 1 \cdot x \in N$,因此 $M\subset N$。

$N$ 中的加法和数乘封闭,因此 $N$ 是 $X$ 的线性子空间。

任取 $X$ 中的线性子空间 $Q$ 且 $M \subset Q$。对任意 $x \in N$,$x = \lambda_1x_1 + \lambda_2x_2 + \dots + \lambda_nx_n \in M \subset Q$,因此 $N \subset Q$。这也就证明了 $N$ 是最小的包含 $M$ 的子空间,从而 $\text{span}(M) = N$。

若存在 $\lambda_1, \dots, \lambda_n \in \mathbb K$ 不全为 0,且 $\lambda_1x_1 + \lambda_2x_2 + \dots + \lambda_nx_n = 0$,则 $x_1, \dots, x_n$ 为线性相关的。

若 $\lambda_1x_1 + \lambda_2x_2 + \dots + \lambda_nx_n = 0 \Rightarrow \lambda_1=\dots=\lambda_n=0$,则称 $x_1, \dots, x_n$ 为线性无关的。

例子:假设 $X = C(\R)$,$\lambda_1 \lt \lambda_2 \lt \dots\ \lt \lambda_n \lt \dots, f_n(t) = e^{\lambda_nt}$,证明:$\lbrace f_1, \dots, f_n, \dots\rbrace $ 线性无关。

假设 $\mu_1, \dots, \mu_n \in \R$ 使得

$$ \mu_1f_1 + \mu_2f_2 + \dots + \mu_nf_n = 0 $$

那么

$$ \mu_1e^{\lambda_1t} + \mu_2e^{\lambda_2t} + \dots \mu_ne^{\lambda_nt} = 0\\ \mu_1\lambda_1e^{\lambda_1t} + \mu_2\lambda_2e^{\lambda_2t} + \dots \mu_n\lambda_ne^{\lambda_nt} = 0\\ $$

第一个式子乘以 $\lambda_n$ 减去第二式:

$$ \mu_1(\lambda_n - \lambda_1)e^{\lambda_1t} + \mu_2(\lambda_n - \lambda_2)e^{\lambda_2t} + \dots \mu_n(\lambda_n - \lambda_{n-1})e^{\lambda_{n-1}t} = 0\\ \mu_1(\lambda_n - \lambda_1)\lambda_1e^{\lambda_1t} + \mu_2(\lambda_n - \lambda_2)\lambda_2e^{\lambda_2t} + \dots \mu_n(\lambda_n - \lambda_{n-1})\lambda_{n-1}e^{\lambda_{n-1}t} = 0\\ $$

接下来又可以乘系数消元,继续求导,乘系数消元,…,直到剩下一个项:

$$ \mu_1(\lambda_n - \lambda_1)(\lambda_{n-1} - \lambda_1)\dots(\lambda_2 - \lambda_1)e^{\lambda_1t} = 0 $$

因此 $\mu_1 = 0$,同理可以证明 $\mu_2=\dots=\mu_n = 0$。

若存在 $X$ 中的 $n$ 个元素线性无关,且任取 $n+1$ 个元素为线性相关,则称 $X$ 为 $n$ 维空间,$\dim X = n$。

$n$ 维空间中的任意元素 $x \in X$,存在唯一的一组系数 $\alpha_1,\dots ,\alpha_n \in \mathbb K$ 使得

$$ x = \alpha_1x_1 + \dots + \alpha_nx_n $$

不为有限维的空间称为无穷维空间。

$\R^n$ 是 $n$ 维的。$\ell^p, \ell^\infty, S, C[a, b]$ 是无穷维的。

Hamel 基:$M \subset X$

  1. $M$ 是线性无关的
  2. $\text{span}(M) = X$

称 $M$ 是 Hamel 基。

任取 $x\in X$,存在唯一的两两不等的元素 $x_1, \dots, x_n \in M$ 以及全部非 0 的 $\alpha_1, \dots, \alpha_n$ 使得

$$ x = \alpha_1x_1 + \dots + \alpha_nx_n $$

由于 $\text{span}(M)$ 的定义可知上述线性组合的存在性。

假设存在 $\lbrace y_1, \dots, y_m\rbrace \ne {x_1, \dots, x_n}$ 使得

$$ x = \beta_1y_1 + \dots + \beta_my_m $$
$$ y_m = \frac1{\beta_m}(\alpha_1x_1 + \dots + \alpha_nx_n - \beta_1y_1 - \dots - \beta_{m-1}y_{m-1}) $$

因此

$$ y_m \in \text{span}\lbrace x_1, \dots, x_n, y_1, \dots, y_{m-1}\rbrace $$

假设 $y_m \not\in \lbrace x_1, \dots, x_n\rbrace $,则得出 $y_m$ 可以由 $\lbrace x_1, \dots, x_n, y_1, \dots, y_{m-1}\rbrace $ 线性表出,且 $y_m$ 不等于其中的任何一个元素,也就是说 $\lbrace x_1, \dots, x_n, y_1, \dots, y_m\rbrace $ 是线性相关的!与 Hamel 基的定义矛盾!

因此 $y_m \in \lbrace x_1, \dots, x_n\rbrace $,同理可以证明 $y_i \in \lbrace x_1, \dots, x_n\rbrace $,从而 $\lbrace y_1, \dots, y_m\rbrace \subset {x_1, \dots, x_n}$,同理
$\lbrace x_1, \dots, x_n\rbrace \subset {y_1, \dots, y_m}$,因此只能有 $\lbrace y_1, \dots, y_m\rbrace = {x_1, \dots, x_n}, m = n$,由线性无关性不难得出 $\beta_1 = \alpha_1, \dots, \beta_n = \alpha_n$。

例子:

$$ C_0 = \lbrace (x_n)_{n\ge1}: x_n\to0\rbrace \\ C_{00} = \{(x_n)_{n\ge1}: \exist N, \forall n \ge N, x_n = 0\}\\ $$

$e_n = (\underbrace{0, 0, \dots, 0}_{(n-1)个}, 1, 0, \dots)$, 此时 $M = \lbrace e_1, \dots, e_n, \dots\rbrace $ 为 $C_{00}$ 的 Hamel 基(需证明:线性无关、能表示所有的元素),但不是 $C_0$ 的 Hamel 基。

反例如下:
$(1, \frac12, \dots, \frac1{2^n}, \dots) \in C_0$ 无法被上述 $M$ 表示出来。

定理:设 $X$ 为线性空间,则 $X$ 必有 Hamel 基。证明需要用到 Zorn 引理。

Zorn 引理:等价于选择公理。

赋范空间,Banach 空间

设 $X$ 为 $\mathbb K$ 上的线性空间,设

$$ ||\cdot||: X \to \R $$

满足:

  1. $||x|| \ge 0$(非负性)
  2. $||x|| = 0 \Leftrightarrow x = 0$(非退化性)
  3. $||\lambda x|| = |\lambda| ||x||$(齐次性)
  4. $||x + y|| \le ||x|| + ||y||$(三角不等式)

称 $||\cdot||$ 为 $X$ 上的范数,$(X, ||\cdot||)$ 为赋范空间。

可以在赋范空间中定义度量:

$$ d(x, y) = ||x - y|| $$

可验证 $d$ 满足非负性、非退化性、对称性、三角不等式。

这里的 $d$ 具有一般度量不具备的性质(显然一般度量空间不存在加法和数乘):

  1. 平移不变性:$d(x + a, y + a) = d(x, y)$
  2. 齐次性:$d(ax, ay) = |a|d(x, y)$

不是所有的度量空间都有范数:

$$ S = \lbrace (x_n)_{n\ge1}, x_n \in \mathbb K\rbrace \\ d((x_n), (y_n)) = \sum_{n=1}^\infty \frac1{2^n}\frac{|x_n - y_n|}{1 + |x_n - y_n|} $$

例子:

$X = \mathbb K^n$, $||x|| = \max_{1 \le i \le n}|x_i|$,$d_\infty((x_n), (y_n)) = \max_{1 \le i \le n} |x_i - y_i|$。

还有 $p$ 范数:$||x||_p = (\sum_{i=1}^n |x_i|^p)^{1/p}$,可以诱导对应的 $d_p$。

对于 $\ell^p$,定义 $||x||_p = (\sum_{i=1}^\infty |x_i|^p)^{1/p}$,$||x||_\infty = \sup ||x_n||$。

对于 $C[a, b]$,定义 $||x||_\infty = \max_{t\in [a,b]}|x(t)|$,$||x||_p = (\int_a^b|x(t)|^p\mathrm dt)^{1/p}$

离散度量也定义不了范数,首先齐次性就不可能满足了。

若 $(X, d)$ 为完备的,称 $(X, ||\cdot||)$ 为 Banach 空间。

$Y$ 为赋范空间 $X$ 的线性子空间。如果 $Y$ 是 Banach 空间,则可知 $Y$ 是 $X$ 中的闭集。如果 $X$ 是 Banach 空间,则 $Y$ 为 Banach 空间的充要条件是 $Y$ 为 $X$ 的闭子集。

设 $(X, ||\cdot||_X)$,$(Y, ||\cdot||_Y)$ 为赋范空间,称 $T: X\to Y$ 为线性算子,如果

$$ T(\alpha x + \beta y) = \alpha Tx + \beta Ty, \quad x, y \in X, \quad \alpha, \beta \in \mathbb K $$

若 $T$ 是一一映射,且

$$ ||Tx||_Y = ||x||_X $$

则称 $T$ 为从 $X$ 到 $Y$ 的等距同构。$X$ 与 $Y$ 之间为等距同构。

我们可以把等距同构的空间看成一个空间。

完备化定理

设 $X$ 为赋范空间,则存在 Banach 空间 $\hat X$ 及其线性子空间 $Y$,使得 $X$ 与 $Y$ 等距同构,$Y$ 在 $\hat X$ 中为稠密的。$\hat X$ 在等距同构意义下是唯一的。即,若 $\hat X_1$ 为 Banach 空间,且 $Y$ 为 $\hat X_1$ 的稠密线性子空间且 $Y$ 与 $X$ 等距同构,则 $\hat X$ 与 $\hat X_1$ 等距同构。

$\hat X$ 称为 $X$ 的完备化。

赋范空间中,我们可以给出无穷和的定义:

$$ s_n = \sum_{i=1}^n x_i \in X $$

若存在 $s \in X$,使得 $s_n \to s$,则称 $\sum_{i\ge1} x_i$ 收敛,记为 $s = \sum_{i=1}^\infty x_i$。

同样可以定义柯西列的概念。

$S_N$ 为 $X$ 中柯西列,如果 $(X, ||\cdot||_X)$ 为 Banach 空间,则存在 $S\in X$ 使得 $S_n \to S$。

定义:若 $(X, ||\cdot||_X)$ 为 Banach 空间,$e_n\in X, (n\ge1)$ 称为 $X$ 的 Schauder 基,如果 $\forall x \in X$,$\exist ! \lambda_n \in \mathbb K$, $\lambda_1, \dots, \lambda_n$ 全不为 0,$x = \sum_{n=1}^{\infty}\lambda_n e_n$。

有限维赋范空间

引理:$Y$ 为 $X$ 的闭线性子空间,且 $Y\ne X$,则对任意 $0\lt \theta \lt 1$,存在 $x_0 \in X$ 使得 $||x_0||=1$ 且 $\forall y \in Y$,$||y - x_0|| \ge \theta$。

进一步地,如果 $\dim Y \lt \infty$,则 $\exist x_0 \in X$,使得 $||x_0||=1$ 且 $\forall y \in Y$,$||y - x_0|| \ge 1$。

线性算子

称 $T: X\to Y$ 为线性算子,若

$$ T(x + y) = Tx + Ty\\ T(\lambda x) = \lambda Tx\\ \Leftrightarrow T(\lambda x + \mu y) = \lambda Tx + \mu Ty $$

$N(T) = \ker(T) = \lbrace x \in X: Tx = 0\rbrace$ 为 $T$ 的零空间

$R(T) = \lbrace Tx: x \in X\rbrace$ 为像空间。

注:

  1. $N(T)$ 为 $X$ 的线性子空间。
  2. $R(T)$ 为 $Y$ 的线性子空间。
  3. $T0_X = 0_Y$。因此 $0 \in N(T)$。

例子:

恒等映射 $I_X: X\to X, x \mapsto x$,$N(I_X) = \lbrace 0\rbrace$,$R(I_X) = X$

零算子:$0_X: X\to X, x\mapsto 0$,$N(I_X) = X$,$R(I_X) = \lbrace 0\rbrace$。

求导算子:$T: C^1[a, b]\to C[a, b], x\mapsto x^\prime$,$N(T) = \lbrace 常函数\rbrace$,$R(T) = C[a, b]$。

积分算子:$T: C[0, 1]\to C[0, 1]$,$(Tx)(t) = \int_0^t x(\tau)\mathrm d\tau$,则 $N(T) = \lbrace 0 \rbrace$,$R(T) = \lbrace x\in C^1[0,1]: x(0)=0\rbrace$。

若 $\dim X \lt \infty$,则 $\dim R(T) \le n$。假设 $e_1,\dots, e_n$ 为 $X$ 的 Hamel 基,则 $R(T) = \operatorname{span}\lbrace Te_1, \dots Te_n\rbrace$,因此 $\dim R(T) \le n$。

$T$ 为单射 $\Leftrightarrow N(T) = \lbrace 0\rbrace$

若 $T$ 为双射,则 $T^{-1}$ 仍然为线性算子。

有界线性算子:若 $\exist C \ge 0$,$\forall x \in X$,$x\ne 0$,都有 $||Tx||_Y \le C||x||_X$,称 $T$ 是有界线性算子。

$||T||=\sup_{x\in X, x\ne0}||Tx||_Y/||x||_x$ 为 $T$ 的范数,则 $||Tx||_Y \le ||T||||X||_X, \forall x \in X$,$||T||$ 为有界线性算子定义中的最小的 $C$。

注:

  1. $||T|| = \sup_{x\in X, ||x||_X=1}||Tx||_Y$ 为 $T$ 范数的等价定义。
  2. $||T|| = \sup_{x\in X, ||x||_X\le 1} ||Tx||_Y$。
  3. $||T|| = \sup_{x\in X, ||x||_X \lt 1} ||Tx||_Y$。

$B(X, Y)$ 表示所有从 $X$ 到 $Y$ 的有界线性算子之集。$S, T \in B(X,Y)$,定义加法:$(S+T)x = Sx + Tx$,定义数乘:$\lambda \in \mathbb K,(\lambda S)x = \lambda Sx$。可以证明 $B(X, Y)$ 是线性空间。其上的范数 $||T|| = \sup_{x\ne 0}\frac{||Tx||}{||x||}$ 满足非负性、非退化性、齐次性、三角不等式。

举例:$X = Y = C[a, b]$,其上赋予范数 $||\cdot||_\infty$,令

$$ (Tx)(t) = \int_a^tx(\tau)\mathrm d\tau, t\in [a, b] $$

此时 $T$ 是线性算子,

$$ ||Tx||_\infty = \max_{a\le t \le b}|\int_0^t x(\tau)\mathrm d\tau| \le \max_{0\le t \le 1} \int_0^t |x(\tau)|\mathrm d\tau \le (b-a)||x||_\infty $$

因此 $||T|| \le (b-a)$。下面我们验证等号可以取到。我们取 $x(t) =1$,

$$ (Tx)(t) = t\\ ||Tx||_\infty = (a-b) = (a-b)||x||_\infty $$

因此 $||T|| \ge (b-a)$,从而 $||T|| = (b-a)$。