ノリの悪い日記

古今東西の映画、ポピュラー音楽、その他をいまここに交錯させながら随想します。

A. 線形代数の復習


A-1. 生成系と基底

K 線型空間 V を考え有限部分集合  \{x_1,\cdots, x_n\} \subset V をとる。すると、
 
 Kx_1+\cdots+Kx_n  \\
= \{\alpha_1 x_1 + \cdots + \alpha_n x_n | \alpha_i \in K\}
 
は、 \{x_1,\cdots, x_n\} を含む 最小の V 部分空間であることはすぐにわかる。
 
 (\alpha_1, \cdots, \alpha_n) \in K^n について、写像  f : K^n \to V
 
 f(\alpha_1, \cdots, \alpha_n) = \alpha_1x_1 +\cdots+ \alpha_nx_n
 
という一次結合として定めると、写像 f K 準同型写像 (線型写像) であることが容易に確認できる。この  K 準同型写像 fK 線型空間 V への全射であるとき、 \{x_1,\cdots, x_n\}V の「生成系」であるといい、前記の vector の組は、 K 線型空間 V を生成するという。また、写像 f K 線型空間 V への単射であるとき、すなわち

 \ker f = \{0\}

のとき、前記の vector の組は「線型独立」という。また「線型独立」でない場合「線型従属」という。写像 f K 線型空間 V への全単射、すなわち  K 同型写像であるとき、前記 vector の組は「基底」であるという。
 
 K 線型空間の次元 (基底 vector の濃度)は有名な次元定理により、基底となる vector の取り方に係わらず、ただ一つに定まる。

A-2. 線型写像

 K 線型写像 (準同型写像) の行列表現は、 K 線型空間に基底がとれるからこそ成立しているものであって、考えている基底を別の基底にとれば、一般的に変わる。
 
 K 線型空間  K^n の基底を  e_1, \cdots, e_n とし、 K 線型空間  K^m の基底を  f_1, \cdots, f_m とする。 K^n の任意の vector x は、
 
 x = [e_1,\cdots, e_n](x_1,\cdots, x_n)^t             
 
と表せる。ここで、縦 vector を横 vector  (x_1, \cdots, x_n) の転置で書いており、肩にある記号 t で転置であることを示す。また、 [e_1, \cdots, e_n] は、基底を縦ベクトルで書いて横に並べた行列を意味する。
 
ここではまず、K 準同型 (線型) 写像  F: K^n \to K^m は、mn 列の行列の形で表されることを示す

(証明)

写像  F は、 K 準同型写像なので、
 
 F(x)\\
= F([e_1,\cdots, e_n](x_1,\cdots, x_n)^t)
= [F(e_1),\cdots, F(e_n)](x_1,\cdots, x_n)^t

つまり、ガロア理論のときにやったように、 K 準同型 (線型) 写像とは、vector である基底のみに作用するものである。
 
ここで、 F(e_j) を、R^m の基底、 f_1,\cdots, f_m で書くことを考えると、
 
 F(e_j) = [f_1, \cdots, f_m](a_{1j}, \cdots, a_{mj})^t
 
とおける。これから
 
 F(x)\\
=[[f_1, \cdots, f_m](a_{11}, \cdots, a_{m1})^t, \cdots, [f_1, \cdots, f_m]\\(a_{1n}, \cdots, a_{mn})^t](x_1,\cdots, x_n)^t

=[f_1,\cdots, f_m]\begin{pmatrix}a_{11} & \ldots&a_{1n}\\\vdots&\ddots& \vdots\\ a_{m1}&\ldots&a_{mn}\end{pmatrix}(x_1, \cdots, x_n)^t  
         
A = \begin{pmatrix}a_{11} & \ldots&a_{1n}\\\vdots&\ddots& \vdots\\
a_{m1}&\ldots&a_{mn}\end{pmatrix}          

とおけば、これは、mn 列の行列である。

 x = [e_1,\cdots, e_n](x_1,\cdots, x_n)^t    

であったから、x の座標は、基底が  e_1, \cdots, e_n のとき、

 x = (x_1, \cdots, x_n)^t

であり、それが K 準同型写像  F によって  K^m に送られると、基底  f_1, \cdots, f_m でみた 座標

 y = (y_1, \cdots, y_m)

は、
 
 y = Ax
 
になっていることを意味する。//
 
逆に、 y = Ax ならば、 K 準同型写像であることは簡単に示せるので、 K 線型写像と行列表現は同値である。
 
少し、具体例をあげてみる。
 
2 次元の  R 線型空間 R^2 (平面) を考え、基底を

 e_1 = (1, 0)^t, e_2 = (0, 1)^t

とする。任意の  x \in  R^2 を反時計まわりに  \theta 回転させる写像  F: R^2 \to R^2 を考えるとこの写像は  R 線型写像であることが簡単に確認できる。行き先の基底も同じ

 e_1 = (1, 0)^t, e_2 = (0, 1)^t

だとして、この  R 線型写像に対応する行列表現を求める。
 
 R 線型空間 R^2 の任意の要素は、
 
 x = [e_1, e_2](x_1, x_2)^t
 
と表すことができる。
 
 F(x) = [F(e_1), F(e_2)](x_1, x_2)^t
 
であり、写像の行く先の基底は元の基底そのままとしたから、
 
 F(e_1) = [e_1, e_2] (\cos{ \theta}, \sin{ \theta})^t
 F(e_2) = [e_1, e_2](- \sin {\theta}, \cos{ \theta})^t
 
したがって、
 
 F(x) = [e_1, e_2 ] \begin{pmatrix}\cos{ \theta} & -\sin{ \theta}\\ \sin{ \theta} & \cos{ \theta} \end{pmatrix}\begin{pmatrix} x_1\\x_2 \end{pmatrix}
 
さて、今度は平面 の vector を反時計まわりに  \theta 回転させるかわりに、今度は行き先の基底がもとの基底に対して 反時計回りに \theta 回転していたらどういう関係になるか調べる。もとの基底を 同じように

 e_1 = (1, 0)^t, e_2 = (0, 1)^t

とし、 e_1, e_2 \theta 回転したものをそれぞれ  f_1, f_2 と、それらを  e_1, e_2 であらわすと、
 
 f_1 = [e_1, e_2](\cos{ \theta}, \sin {\theta})^t
 f_2= [e_1, e_2](- \sin{ \theta}, \cos {\theta})^t
 
なので、
 
 [f_1, f_2] = [e_1, e_2]\begin{pmatrix}\cos{ \theta} & -\sin {\theta}\\ \sin{ \theta} & \cos{ \theta }\end{pmatrix}

これを使って先程の  F の基底を  f_1, f_2 にかえてみると、
 
 F(x) \\
= [f_1, f_2] \begin{pmatrix}\cos{ \theta} & -\sin {\theta}\\ \sin{ \theta} & \cos {\theta} \end{pmatrix}^{-1}
\begin{pmatrix}\cos{ \theta} & -\sin {\theta} \\\sin{ \theta} & \cos{ \theta} \end{pmatrix} \begin{pmatrix} x_1 \\
x_2 \end{pmatrix}
 = [f_1, f_2] \begin{pmatrix} x_1\\x_2 \end{pmatrix}

となり、あたりまえすぎる結果であるが、座標の値は変わらない。
 
それでは、今度は回転前に基底を  f_1, f_2 にかえて、回転後も基底  f_1, f_2 で表すとすると、これもあたり前だが、結果は最初と変わらない。

 F(x) = [f_1, f_2 ] \begin{pmatrix}\cos{ \theta} & -\sin{ \theta}\\ \sin{ \theta} & \cos{ \theta} \end{pmatrix}\begin{pmatrix} x_1^{\prime}\\x_2^{\prime} \end{pmatrix}

 以上のことを一般化すると、元の基底

 e_1,\cdots, e_n

 e_1^{\prime}, \cdots, e_{n}^{\prime}

に変更し、行き先の基底

 f_1,\cdots, f_m

 f_1^{\prime},\cdots, f_m^{\prime}

に変更するとして、その基底変換行列  P,Qをそれぞれ、
 
 [e_1^{\prime}, \cdots, e_{n}^{\prime}] = [e_1, \cdots, e_n]P\\
 [f_1^{\prime},\cdots, f_m^{\prime}]= [f_1,\cdots, f_m]Q
 
として、新しい基底を元の基底で表した場合、

  [F(e_1),\cdots, F(e_n)]
=[f_1, \cdots, f_m]A

  [F(e^{\prime}_1),\cdots, F(e^{\prime}_n)]
=[f^{\prime}_1, \cdots, f^{\prime}_m]A^{\prime}

とおくと、最後の式と  R 準同型写像の性質により、

 [F(e_1),\cdots, F(e_n)]P
=[f_1, \cdots, f_m]QA^{\prime}

が成立する。したがって、

 A = QA^{\prime}P^{-1} または
 A^{\prime} = Q^{-1}AP

行列  A は、新しい基底のもとで、 Q^{-1}AP に変わる (可換図式を書けばすぐにわかることだが念のため)。

A-3. 一次連立方程式と準同型

行列の行 vector の階数と列 vector の階数が一致することを示す。

その前に準備として、転置行列の関係

 (AB)^t = B^t A^t

という関係を証明する。
 
(証明)

 C = AB

とする。C^t の要素 c^t_{ij} とすると、
 
 c^t_{ij}\\
= c_{ji}\\
= (a_{j1}, \cdots, a_{jk})(b_{1i}, \cdots, b_{ki})^t
 = (b_{1i}, \cdots, b_{ki})(a_{j1},\cdots, a_{jk})^t\\
= (b^t_{i1},\cdots, b^t_{ik})(a^t_{1j}, \cdots, a^t_{kj})^t
//

準同型写像  F: R^n \to R^m に対応する行列を

 A = (A_1,\cdots, A_n)

とし、像   \mathrm{Im} \,F の次元、 つまり階数 ( \mathrm{rank}) を

 r \,(\leq m)

とする。 \mathrm{Im} \,F は、 e_1, \cdots, e_n R^n の基底としたときに、 F(e_1), \cdots, F(e_n) によって生成される空間であり、階数  r はその次元のことである。つまり、

 \mathrm{rank}\,F = \dim{\mathrm{Im} \, F}

行列 A の各列 vector

 A_1,\cdots, A_n

は、

 F(e_1), \cdots, F(e_n)

 R^m の基底で表したときの座標に相当するもので、 F(e_i) A_i は同一視される。したがって、 A_i r 個のある基底

 v_1,\cdots, v_r \in R^m

であらわされる。
 
 A_i = [v_1, \cdots, v_r](c_{1i}, \cdots, c_{ri})^t
 
ここで、行列  A  の  i 行,  j 列 の要素を  a_{ij} と書くことにする。
 
ここで、行列 Ai 行目の横 vector に注目すると
 
 (a_{i1}, \cdots, a_{in})=(v_{i1}, \cdots, v_{ir})\begin{pmatrix}
c_{11}&\ldots&c_{1n}\\\vdots&\ddots&\vdots\\
c_{r1}&\cdots&c_{rn}\end{pmatrix}
 
この転置をとると、

 (a_{i1}, \cdots, a_{in})^t \\=\begin{pmatrix}
c_{11}&\ldots&c_{r1}\\\vdots&\ddots&\vdots\\
c_{1n}&\cdots&c_{rn}\end{pmatrix} (v_{i1}, \cdots, v_{ir})^t


 (c_{i1}, \cdots, c_{in})^t = c_i

とおくと、
 
 (a_{i1}, \cdots, a_{in})^t=[c_1, \cdots, c_r](v_{i1}, \cdots, v_{ir})^t

となり、行列  A の行 vector は、 r 個の vector

 c_1, \cdots, c_r

により生成されることがわかった。したがって、行列  A の行 vector の階数 s は、
 
 s \leq r
 
であることが、結論される。

今度は、転置行列  A^t に対して、同じことをする。転置行列  A^t の列 vectorは、行列  A の行 vector であり、その階数は s とした。ところが、転置行列  A^t の行 vector は、上とまったく同じ議論によって、 s 個の vector によって生成されるから、
 
 r \leq s
 
である。したがって、

 r = s

であることが証明された。//
 
なお、

 \mathrm{rank}\, F\\
= \dim{ \mathrm{Im} \, F} \\
= \dim {R^n/\ker{F}}\\
=\dim {R^n} - \dim {\ker{F}}
 
という関係が存在する。なお、線形代数では同型写像のことを正則写像、対応する行列を正則行列といったりする。以下は明らかにみな同値である。

1)  F が同型写像
2) 準同型写像  F が全単射
3) 準同型写像  F が逆写像をもつ
4)  F(e_1), \cdots, F(e_n) R^nの基底
5)  \mathrm{rank}\, F = n
6)  \ker{F} = \{0\}

//

vector

 v_1, \cdots, v_r

が線形独立であるとき、

 v_1, \cdots, v_i + cv_j, \cdots, v_r

もまた線形独立である。また、各 vector の順番を置換しても線形独立である。また、この vector の組が生成系であるとき、前述の変換を行なってもまた生成系である。

これを線形写像に対応する行列の列ベクトルに対して適用すると、列の基本変形 (行の入れ替え、行を  c \,(\neq 0) 倍する、ある行を  c 倍して他の行に加えることで、前述した線形独立性は失われない。それは、この操作が可逆な正則行列として表すことができることからも明らかである。行 vector と列 vector は、双対空間を成すので、行 vector に対しても全く同じ操作が可能である。ここでは詳述しないが、よく知られているように、行列の基本変形によって、 \mathrm{rank} \, F \dim {\ker{F}} を求めることができる。

※ 行の基本変形は基本行列を左からかけることに対応し、列の基本変形は基本変形を右からかけることに対応する。基本変形を用いて逆行列を求める際には二つの変形は混在できないことに注意する。//

一次連立方程式

 Ax = b

を解くことは、行列  A に対応する準同型写像  F_A b についての逆像を求めることと同値である。

まず、 b=0 とする。

 Ax = 0

の解は  \ker{F_A} を求めることと同値である。もっと言えば  \ker{F_A} の基底の一組を求めて  \ker{F_A} を明示的に書くことである。

次に  b \neq 0 とする。

 b \not \in \mathrm{Im} \, F_A

だとすると、解は空集合である。

※ それを判定するためには列 vector b を行列  A の列 vector に加えたときに次元が拡大するかを調べればよい。つまり  b が一次従属ならば次元は拡大しないので、 b \mathrm{Im} \, F に含まれていると判定できる。

したがって  b \in \, F_A とする。今、一組の解  x_0 が求まったとし、他の解  x があれば、

 F_A(x) - F_A(x_0) = F_A(x-x_0) = 0

となるので

 x-x_0 \in \ker{F}

であり、解は同じ剰余類に属することがわかる。もちろん、

 \ker{ F}= \{0\}

であれば解は一つに定まる。//

A-4. 直積と直和

直和について触れておくと、直積と直和は本来異なる概念だが、有限個の場合については、直積と直和は本質的な差はない。K 線形空間でいえば、 V, W を線形空間としたとき、直積

 V \times W=\{(x, y)| x \in V, y \in W\}

に成分毎の加法

 (x_1, y_1)+(x_2,y_2)=(x_1+x_2, y_1+y_2)

K の作用

 \alpha(x,y)=(\alpha x, \alpha y)

を入れて K 線形空間とする。有限個の直積の場合はこれは直和と同じであり、

 V \oplus W

と書く。 V \oplus W は部分空間として

 V \times \{0\}, \{0\} \times W

を有しているが、これはしばしば  V, W と同一視される。

また、このように定めた直和は、 V, W X の部分空間のときになされる、

 V + W, V \cap W = \{0\}

とも同型である。

(証明)

 (x,x^{\prime}) x + x^{\prime} へ移す写像

 V \oplus W \to V + W

を考えたとき、

 V \cap W = \{0\}

であるとすると、

 x,y \in V, x^{\prime}, y^{\prime} \in W

 x+ x^{\prime} = y + y^{\prime}

を満たせば

 x-y=x^{\prime} - y^{\prime} =0

から

 x=y, x^{\prime} = y^{\prime}

となるので単射であり、したがって全単射であることがわかる。逆は、もし、

 x \in V \cap W

となる  x が存在すると仮定すれば

 (x,0) = (0,x) =x

となり、これから

 (x,0) =(0, x)

となって、

 x=0

となる。//

以上を有限個の空間について拡張するのは正しい。

無限次元の場合、直積と直和は一般に異なる。一般的にいえば、添字の集合 (index set)  I を考え K 線型空間の族 (family)

 (V_i)_{i \in I}

とその元の族

 (x_i)_{i \in I}

を考えることができる。

直積については、有限のときと基本同じで、直積集合

 \prod_{i \in I} V_i

を考え、成分毎に元の加法と作用を定義して K 線型空間とする。

V の族 (family)

 (V_i)_{i \in I}

の元の族

 (x_i)_{i \in I}

に対して

 \{i \in I| x_i  \neq 0\}

が有限集合であるとき、言い回しとして

「有限個の  i \in I を除き  x_i = 0

という。直積  \prod_{i \in I} V_i の部分空間

 \bigoplus_{i \in I} V_i \\
=\{(x_i)_{i  \in I} \in \prod_{i \in I} V_i |
有限個の  i \in I を除き  x_i = 0\}

を直和と呼ぶ。たとえば、

 (1,0,1,0,\cdots)

は直積の要素ではあるが、直和の要素にはならない。直和は  V_i が無限個の場合でも、要素の零ではない (座標) 成分は有限個である。

A-5. 射影

 K 線型空間  V が部分空間  W_1W_2 の直和であるとき、任意の  K 線型空間の要素 x は、  W_1 のある要素 y, W_2 のある要素 z を使って、
 
 x = y + z
 
と一意的に表すことができる。したがって写像

 pr_1: V \to W_1
 pr_2: V \to W_2

を以下のように考えることができる。
 
 pr_1 (x) = y
 pr_2 (x) = z
 
これらの写像を「射影」という。「射影」は要するに、座標の成分をとるということに対応する写像のことである。この「射影」の性質を調べてみると、まず、「射影」は  K 準同型写像であることがすぐに確認できる。また、
 
 (pr_1 + pr_2)(x) \\
= pr_1(x) + pr_2(x) \\
= y + z = x
 
となり、

 pr_1 + pr_2

は、恒等写像である。
 
また、y, z 自体の分解は、
 
 y = y + 0 \\z = 0 + z
 
なので、

 pr_1(y) = y\\pr_1(z) = 0\\pr_2(y) = 0\\pr_2(z) = z

となる。さらに、
 
 pr_1(pr_2(x)) = pr_1(z) = 0
 pr_2(pr_1(x)) = pr_2(y) = 0
 
となる。つまり、

 pr_1\circ pr_2, pr_2 \circ pr_1

は、零写像である。さらに
 
 pr_1(pr_1(x)) = pr_1(y) = y =pr_1(x)
 pr_2(pr_2(x)) = pr_2(z) = z = pr_2(x)
 
したがって、

 pr_1^2 = pr_1, pr_2^2 = pr_2

である。
 
それで、これのどこが面白いのかというと、逆に、 K 線型写像を  pr_1, pr_2: V \to V として、
 
1)   pr_1 ^2 = pr_1
2)  pr_1 + pr_2 が恒等写像                
 
となるように定め、対応する正方行列を  P ( pr_1 に対応), Q ( pr_2 に対応) とすると、上の条件は、
 
 P^2 = P
 P + Q = E
 
ということになる。これから
 
 PQ = P(E - P) = 0 \\
QP = (E - P)P = 0\\
Q^2 = (E - P)(E - P) = E - P = Q
 
となる。また、任意の  x \in V にたいして、
 
 Px^{\prime} = x
 
となる  x^{\prime} が存在しているとき、
 
 P^2 x^{\prime}=Px
 
 P^2=P より、
 Px^{\prime}=Px
 
結局、
 
 Px= x
 
となっている。 pr_1 + pr_2 は、恒等写像であったから、全単射である。いま像  pr_1(V) , pr_2(V) を考えたとき、 pr_1(V) \cap pr_2(V) に属する任意の要素  x について、先ほどの結果より、

 x = Px 

となり、

 Qx = QPx = 0

から

 x= 0

となる。したがって、
 
  pr_1(V) \cap pr_2(V) = \{0\}
 
となるので、pr_1(V)pr_2(V) V の直和になっている。つまり、2 つの写像が上記の 1), 2) の性質を満たせば、二つの写像の像 (部分空間) は  K 線型空間の直和になるということである (もちろん、写像は二つに限らず、線型空間の次元の範囲で一般化できる)。

※ 要するに
 \mathrm{Im} \,pr_1 ,\ker{pr_1} \ker{pr_2}, \mathrm{Im} \, pr_2 の間には共軛的な関係が成立している。//
 
例として、3 次元空間  R^3 で、

 x + y + z = 0

で表されている平面上に基底をとることとし、その基底を適当に

(1, 0, -1)^t, (0, 1, -1)^t

ととると、平面は

 \begin{pmatrix}x\\y\\z\end{pmatrix}=\alpha \begin{pmatrix}1\\0\\-1\end{pmatrix} + \beta \begin{pmatrix}0\\1\\-1\end{pmatrix}

で表される。さらにもう一つの基底を z 軸の、

 (0, 0, 1)^t

にとるものとする。そうすると、この平面への射影 pr_1 は、

 pr_1 ((1, 0, -1)^t) = (1, 0, -1)^t\\
pr_1((0, 1, -1)^t) = (0, 1, -1)^t\\
pr_1((0, 0, 1)^t) = (0, 0, 0)^t

だから、
 
 PR_1 \\= \begin{pmatrix}1&0&0\\0&1&0\\-1&-1&0\end{pmatrix} \begin{pmatrix}1&0&0\\0&1&0\\-1&-1&1\end{pmatrix}^{-1}
 =\begin{pmatrix}1&0&0\\0&1&0\\-1&-1&0\end{pmatrix} \begin{pmatrix}1&0&0\\0&1&0\\1&1&1\end{pmatrix}
 =\begin{pmatrix}1&0&0\\0&1&0\\-1&-1&0\end{pmatrix}

また, z 軸への射影は、
 
 PR_2 = E - PR_1 \\
=\begin{pmatrix}0&0&0\\0&0&0\\1&1&1\end{pmatrix}

となる。なお、平面上の基底を直交させたかったら、シュミットの直交化をもちいればよいし、平面の法線 vector は

(1, 1, 1)(x, y, z)^t = 0

なので、

 u_3=\frac{1}{\sqrt{3}}(1, 1, 1)^t

で求められるので、直交基底を構成するのは簡単である (もっとも、座標の向きまで考慮して基底を取るのならば平面上の二つの基底の外積から求める方が一般的だろう)。

※ 「グラム-シュミットの直交化法」というのは、その名称から勘違いしやすいが、単なる手法に留まるものではなく、「有限次内積空間は正規直交基底をもつ」ということを保証する基本的なものである。//

ここで、平面上の基底は直交していなかったから、正規直交基底にしてみると、グラム・シュミットの直交化法をもちいて、
 (1, 0, -1)^t から、 単位ベクトル  u_1 を作る。

 u_1=\frac{1}{\sqrt{2}}(1, 0, -1)^t
 
 (0, 1, -1)^t - \frac{1}{2}(1, 0, -1)^t = \frac{1}{2}(-1, 2, -1)^t
 
長さを 1 にすると、

 u_2 = \frac{1}{\sqrt{6}}(-1, 2, -1)^t
 
平面に垂直な  u_3 は、
 
 u_3 = \frac{1}{\sqrt{3}}(1, 1, 1)^t
 
今度は直交しているので、逆行列はすぐ求まる。
 
 PR_1
 = \begin{pmatrix} \frac{1}{\sqrt 2}& - \frac{1}{\sqrt 6}& 0\\
0&\frac{2}{\sqrt 6}&0\\ -\frac{1}{\sqrt 2}& -\frac{1}{\sqrt 6}& 0\end{pmatrix}\begin{pmatrix}\frac{1}{\sqrt 2} & 0 &-\frac{1}{\sqrt 2}\\-\frac{1}{\sqrt 6} & \frac{2}{\sqrt 6} & -\frac{1}{\sqrt 6}\\\frac {1}{\sqrt 3} & \frac{1}{\sqrt 3} & \frac{1}{\sqrt 3}\end{pmatrix}

=\frac{1}{3}\begin{pmatrix}  2& -1 & -1\\-1 & 2 & -1\\ -1 & -1 & 2 \end{pmatrix}

PR_2=\frac{1}{3}\begin{pmatrix}  1 & 1 & 1\\ 1 & 1 & 1\\ 1 & 1 & 1 \end{pmatrix}
 
※こんな回りくどいやり方しなくても良いんだが、射影を使って大学入試問題を解いてみる (近い将来、日本の文系志望の高校生はベクトルを学ばなくなるそうだが)。

【例題】

直線  l: y = 2x -1 に関して、点 (0, 4) と対称な点  B の座標を求めよ。
 
【回答】

直線

 l: 2x -y = 1

は、明らかに  (0,0) を零点に持たないので、線型部分空間ではない。そこで、

 \begin{pmatrix} x\\ y \end{pmatrix} = \alpha \begin{pmatrix}1\\2\end{pmatrix} + \begin{pmatrix}0\\ -1 \end{pmatrix}

と経数表示をしてみると、

 x^{\prime} = x, y^{\prime} = y + 1

を考えれば、アフィン空間は線型空間になる (この引戻し写像は明らかに同型である)。

基底 として、ひとつは

 u_1 = \frac{1}{\sqrt 5}(1, 2)^t

がとれ、

 2x^{\prime}-y^{\prime} = (2, -1)(x^{\prime}, y^{\prime})^t = 0

から、vector

 (2, -1)^t

は直線に垂直なので、もう一つの基底として、

 u_2=\frac{1}{\sqrt 5} (2, - 1)^t

になり、 u_1, u_2 は、 R^2 と同型な線形空間の正規直交基底となる。直線への射影行列  PR_1は、
 
 PR_1 = \frac{1}{5}\begin{pmatrix} 1 & 0\\ 2 & 0 \end{pmatrix}  \begin{pmatrix} 1 & 2\\ 2 & -1 \end{pmatrix} ^{-1}
  = \frac{1}{5}\begin{pmatrix} 1 & 0\\ 2 & 0 \end{pmatrix}  \begin{pmatrix} 1 & 2\\ 2 & -1 \end{pmatrix}
  = \frac{1}{5}\begin{pmatrix} 1 & 2\\ 2 & 4 \end{pmatrix}

直線に垂直な基底への射影行列  PR_2 は (この問題を解くためには求める必要はないのだが、一応やっておく)

  PR_2 =\begin{pmatrix} 1 & 0\\ 0 & 1 \end{pmatrix} - \frac{1}{5}\begin{pmatrix} 1 & 2\\ 2 & 4 \end{pmatrix}
 = \frac{1}{5}\begin{pmatrix} 4 & -2\\ -2& 1\end{pmatrix}

 点  A^{\prime} は、現在考えている空間では  (0, 5) に相当する。
この点に関し、
 
 pr_1(0, 5) =  \frac{1}{5}\begin{pmatrix} 1 & 2\\ 2 & 4 \end{pmatrix}\begin{pmatrix} 0\\5 \end{pmatrix}= \begin{pmatrix} 2\\4 \end{pmatrix}
 
また、 u_2 の 軸への射影は、直和であることより、

 (0, 5)^t - (2, 4)^t = (-2, 1)^t

となる ( pr_2 で計算してもよいが

 x - PR_1 x =(E -PR_1)x=PR_2x

なので同値である)。
 
求める点  B^{\prime} の変換した空間での座標は、

 (2, 4)^t - (-2,1)^t = (4, 3)^t

であり、座標を元に戻して、点  B の座標は  (4,2) となる。 //

A-6. Vandermonde 行列式

Vandermode 行列式を 4 \times 4 の例で求めておく。もちろん Vandermonde 行列を転置させても行列式の結果は同じである。
 
 \begin{vmatrix}1 &1& 1&1\\
a_1 & a_2 & a_3  & a_4\\
a_1^2 & a_2^2 & a_3^2 & a_4^2\\
a_1^3 & a_2^3 & a_3^3 &a_4^3 \end{vmatrix}
 
まず、2, 3, 4 列から 1 列目を引く。

 \begin{vmatrix}1 &0& 0&0\\
a_1 & a_2-a_1 & a_3-a_1  & a_4-a_1\\
a_1^2 & a_2^2 - a_1^2 & a_3^2 - a_1^2 & a_4^2 - a_1^2\\
a_1^3 & a_2^3 - a_1^3& a_3^3 - a_1^3 &a_4^3 - a_1^3 \end{vmatrix}
 
余因子展開をする。

 \begin{vmatrix} a_2-a_1 & a_3-a_1  & a_4-a_1\\a_2^2 - a_1^2 & a_3^2 - a_1^2 & a_4^2 - a_1^2\\a_2^3 - a_1^3& a_3^3 - a_1^3 &a_4^3 - a_1^3 \end{vmatrix}

3 行目から 2 行目に a_1 をかけたものをひく。
 
 \begin{vmatrix} a_2-a_1 & a_3-a_1  & a_4-a_1\\a_2^2 - a_1^2 & a_3^2 - a_1^2 & a_4^2 - a_1^2\\a_2^2(a_2 - a_1)& a_3^2(a_3- a_1) &a_4^2(a_4 - a_1)\end{vmatrix}

2 行目から 1 行目に  a_1 をかけたものをひく。

 \begin{vmatrix} a_2-a_1 & a_3-a_1  & a_4-a_1\\a_2(a_2 - a_1) & a_3(a_3 - a_1) & a_4(a_4- a_1)\\a_2^2(a_2 - a_1)& a_3^2(a_3- a_1) &a_4^2(a_4 - a_1)\end{vmatrix}

各列の共通因子を外に出す。以下、再帰的に反復する。

 (a_2-a_1)(a_3-a_1)(a_4-a_1)\\
\times \begin{vmatrix} 1 & 1  & 1\\a_2 & a_3 & a_4 \\a_2^2 & a_3^2  &a_4^2\end{vmatrix}


 (a_2-a_1)(a_3-a_1)(a_4-a_1)\\
\times \begin{vmatrix} 1 & 0  & 0\\a_2 & a_3 - a_2 & a_4 - a_2 \\a_2^2 & a_3^2 - a_2^2 &a_4^2 - a_2^2\end{vmatrix}


 (a_2-a_1)(a_3-a_1)(a_4-a_1)\\
\times \begin{vmatrix} a_3 - a_2 & a_4 - a_2 \\a_3^2 - a_2^2 &a_4^2 - a_2^2\end{vmatrix}


 (a_2-a_1)(a_3-a_1)(a_4-a_1)
\\ \times \begin{vmatrix} a_3 - a_2 & a_4 - a_2 \\a_3(a_3- a_2) &a_4(a_4- a_2)\end{vmatrix}


 (a_2-a_1)(a_3-a_1)(a_4-a_1)(a_3-a_2)(a_4-a_2)\\
\times\begin{vmatrix} 1 & 1 \\a_3 & a_4\end{vmatrix}


 (a_2-a_1)(a_3-a_1)(a_4-a_1)(a_3-a_2)(a_4-a_2)\\ \times (a_4-a_3)
 
以上で、結果が求まった。
 
 \begin{vmatrix}1 &1& 1&1\\
a_1 & a_2 & a_3  & a_4\\
a_1^2 & a_2^2 & a_3^2 & a_4^2\\
a_1^3 & a_2^3 & a_3^3 &a_4^3 \end{vmatrix}\\
= (a_2-a_1)(a_3-a_1)(a_4-a_1)\\
(a_3-a_2)(a_4-a_2)(a_4-a_3)

クラメルの公式とあわせて使うと、
 
 x + y + z = 1\\
ax + by + cz = d \\
a^2 x + b^2 y + c^2 z = d^2
 
の解は、 a, b, c が二つずつ異なるとき、ほとんど考えずに、
 
 x = \frac{(c - d)(d- b)(b - c)} {(c- a)(a- b)(b- c)}

 y = \frac{(c - a)(a- d)(d - c)} {(c- a)(a- b)(b- c)}

 z  = \frac{(d- a)(a- b)(b - d)} {(c- a)(a- b)(b- c)}

と書ける。

A-7. 固有値

基底の取り替えを議論したときに、始域での基底変換の行列を P, 終域での基底変換の行列を Q とすると、準同型写像の表現行列が、基底変換前の行列  A に対して
 
 Q^{-1}AP
 
の形になることをやったが、自己同型写像を考え、基底変換行列 Q を同じ  P にしてやると、 A, P は正方行列になる。また  P は逆行列が存在するので正則である。すると基底変換後の写像の表現行列は、
 
 P^{-1}AP
 
という形になる。もちろん、写像自体は変わらず、ただ座標の取り方が変わっただけなので、  A P^{-1}AP は共軛であると考えられる。空間そのものと座標系を区別して考えることは、案外重要なことだと思う。空間とは座標系をどう取ろうとも存在しているもので、魑魅魍魎の住まうところである (さらに恐ろしいのは、一見したところ、それが単なるのっぺらぼうにしか見えないことである)。功利性や実用性ばかり考えて空間と座標系を同一視してはいけない。そうはいっても座標系を取り去っても空間に零点だけは存在しているのではないか。その零点はイデアルが必ず  0 を含んでいるのと何か関係がありそうである。

実際に同値律

1)  A \sim A

2)  A \sim A^{\prime} \Rightarrow A^{\prime} \sim A

3) A \sim A^{\prime}, A^{\prime} \sim A^{\prime\prime} \Rightarrow A \sim A^{\prime\prime}

が満たされることが容易に確認できる。自然演繹風に証明してみる。

(証明)

1) A から

 A=A

である。すると

 A = E^{-1}AE

である。

2)
 A \sim A^{\prime}

を仮定する。すると、

 A^{\prime} = P^{-1}AP

である。つまり

 A = PA^{\prime}P^{-1} 

である。

 P^{\prime} = P^{-1}

とおくと

 A^{\prime} \sim A

が出る。したがって

 A \sim A^{\prime} \Rightarrow A^{\prime} \sim A

であり、仮定  A \sim A^{\prime} を落とす。

3)
 A \sim A^{\prime}

かつ

A^{\prime} \sim A^{\prime\prime}

を仮定する。そうすると、

 A \sim A^{\prime}

である。ということは、

 A^{\prime} = P^{-1}A P

とおける。また、

A^{\prime} \sim A^{\prime\prime}

である。ということは、

 A^{\prime\prime} = Q^{-1}A^{\prime} Q

とおける。

 A^{\prime\prime} \\
= Q^{-1}A^{\prime} Q \\
=   Q^{-1} P^{-1}A PQ\\
=(PQ)^{-1}A(PQ)

したがって

 A \sim A^{\prime}, A^{\prime} \sim A^{\prime\prime} \Rightarrow A \sim A^{\prime\prime}

であり、仮定、 A \sim A^{\prime} かつ A^{\prime} \sim A^{\prime\prime} を落とす。//

任意の正方行列  A に対して,ある正則行列  P が存在して,

 P^{-1}AP=J
(J は Jordan ブロックを対角に並べた行列)

になるようにできるというのが、線形代数が教えてくれることで、つまり任意の正方行列は本質的には ジョルダン標準形と相似なのである。ジョルダン標準形のところで行列多項式のイデアルが出てくるが、これが、 P^{-1}AP で不変であり、群の正規部分群との対応を明白に感じる。
 
 それで、まず、固有値を簡単に振り返っておく。
 
【定義】

 体  K を 複素数体(代数的閉体)  \mathbb{C} とし、その上で  n 次元の線形空間  V を考える。

※ 代数的閉体: 1 次以上の任意の  K[X] の多項式が  K 上ですべて 1 次多項式に分解するとき、体  K を代数的閉体という (似たような言葉に代数閉包というのがあってガロア理論では飛ばしてしまったが、意味は異なる)。ガウスの「代数学の基本定理」により  \mathbb{C}[X] の方程式は必ず解をもつので、複素数体  \mathbb{C} は、代数的閉体である。//


線形写像 (自己準同型写像/線形作用素)

 T \in \mathrm{End} _{\mathbb{C}}(V) = \mathrm{Hom}_{\mathbb{C}}(V, V)

を考え、それを表現する  n \times n の正方行列を  A \in M_n (K) とする。
 
 T(u) = \lambda u
 
となる

 \lambda \in \mathbb{C}

と、

 u \in V
(ただし,  u \neq 0

があるとき、 \lambdaT の「固有値 (eigenvalue)」,  u を固有値  \lambda に属する  T の「固有 vector (eigenvector)」と呼ぶ。また、
 
  W(\lambda; T) = \{u \in V | T(u) = \lambda u\}
 
 V の部分空間 (証明は確認するだけなので省略する) で、線形写像 T による固有値 \lambda の「固有空間(eigenspace)」とよぶ。また、 \mathbb{C}[X] の多項式

 \varphi_{A}(\lambda) = \det{(\lambda E - A)}

を行列 A の「固有(特性)多項式」という。//
 

 (\lambda E  - A)x = 0

から、固有vector を持つための必要十分条件は、x 0 とは異なる自明でない解を持つことであり、それは、

 W(\lambda; T) = \ker{ (\lambda E - A)} \neq \{0\}

であることと同値である。また  \lambda T の固有値である必要十分条件は、

 \varphi_A(\lambda) = 0

の根であることである (言い換えとして、 (\lambda E - A) は正則行列ではない)。

※ 固有多項式はモニック多項式である。//

※ 固有多項式は、基底の取り替えに対して不変である。実際、行列 A

 A^{\prime} =P^{-1}AP

に取り替えても、つまり  A \sim A^{\prime} ならば、固有多項式は不変である。ただし、固有多項式が一致するならば、 A \sim A^{\prime} は一般には成立しない。実際、
 
 \lambda E -  P^{-1}AP\\
= \lambda(P^{-1}P)E -P^{-1}AP\\
= P^{-1}(\lambda E)P -P^{-1}AP\\
= P^{-1}(\lambda E-A)P
 
   \begin{vmatrix}  P^{-1}(\lambda E -A)P) \end{vmatrix}\\
= \begin{vmatrix}P^{-1}\end{vmatrix} \begin{vmatrix}  \lambda E -A\end{vmatrix}  \begin{vmatrix}P\end{vmatrix}
= \begin{vmatrix}  \lambda E -A\end{vmatrix}

である。//

一般に自己準同型写像  T を調べるには、 T を複数回合成したものや写像の線形結合を考えるが、それは自己準同型の多項式への代入を考えることで形式化される。

自然数 n \geq 0 について、 T^n: V \to V n 個の T の合成とし、 T^0 = 1 を恒等写像とする。多項式

 f = a_0 +a_1X+\cdots+a_nX^n \in \mathbb{C}[X]

に対し自己準同型写像  f(T) \in \mathrm{End}(V)

 f(T) = a_0id_V +a_1T+\cdots+a_nT^n

として定める。また、与えられた基底での行列表示は
 
 f(A) = a_0E +a_1A+\cdots+a_nA^n

で定める。

いま、行列 A を多項式の根に持つ多項式全体の集合、

 I_A=\{f(x) \in \mathbb{C}[X]|f(A)=O\}

同様に、自己準同型についても、

 I_T=\{f(x) \in \mathbb{C}[X]|f(T)=0\}

を考えることができる (0 は すべての V の要素を 0 ベクトル に移す 0 写像の意)。

すぐに確認できるように、集合  I_A, I_T はイデアルである。また、置換の共軛変換で示したように、

 (P^{-1}AP)^n=P^{-1}A^n P

であることもわかり、今考えているイデアルも基底の取り方に依存しないことがわかる。

(Cayley - Hamilton の定理)
 
固有多項式 \varphi_A(x) に関して、

 \varphi_A (A) = O

が成り立つ。すなわち、 \varphi_A(x) \in I_A である。//

(証明)
 
 P(\lambda)=\lambda E - A

とおく。\tilde{P}(\lambda)P(\lambda) の余因子行列 ( P(\lambda) の各行列成分を、 P(\lambda) (n - 1) 次の小行列式におきかえ、転置した行列) とする。このとき、余因子行列によって逆行列を求める公式としてよく知られているように、
 
 P(\lambda)\tilde{P}(\lambda) = \det{ (P(\lambda) )}E \qquad (1)    
 
が成立する。余因子行列 \tilde{P}(\lambda) の各行列成分は、 \lambda に関し、たかだか  (n - 1) 次だから、
 
 \tilde{P}(\lambda) = \lambda^{n-1}Q_{n-1} + \cdots + Q_1
 
とかける。また、
 
 \det{(P(\lambda))} \\
= \lambda^n + q_{n-1}\lambda^{n-1} + \cdots + q_1
 
とおいて、上の (1) 式の左辺と右辺を比較する。
 
  (\lambda E - A) (\lambda^{n-1}Q_{n-1} + \cdots + Q_1)\\ = \lambda^n Q_{n-1} + \lambda^{n-1}(Q_{n-2} - AQ_{n-1})
 + \lambda(Q_1 - AQ_2) - AQ_1
 = \lambda^n E + q_{n-1} \lambda^{n-1} E + \cdots + q_1 E
 
すると、
 
 Q_{n-1} = E
 Q_{n-2} - AQ_{n-1} = q_{n-1}E
\ldots
 Q_1 - AQ_2 = q_1 E
 - A Q_1 = q_1 E
 
となっている。したがって、
 
 \varphi_A (A) \\
= A^n + \cdots + q_1 E
 = A^n E + A^{n-1} (q_{n-1}E) + \cdots + q_1 E
 = A^n Q_{n-1} + A^{n-1} (Q_{n-2} - A Q_{n-1} )
 + \cdots + A(Q_1 - A Q_2) - A Q_1
 = O //

この結果から、ガロア理論でやったように、イデアル  I_A は、単項イデアルであり、行列  A を根に持つ最小多項式  \psi_A(x) が存在し、固有多項式  \varphi_A(x) を必ず割り切る。

 固有多項式  \varphi_A(x) の根であることと固有値であることは同値だったが、 最小多項式  \psi_A(x) の根であることとも同値であることを示す。

(証明)

まず、行列 A の任意の固有値を \lambda としたとき、
 
 Ax = \lambda x x は固有 vector なので  x \neq 0)
 
から、
 
 A^2x = A(Ax) \\= A(\lambda x) = \lambda (A x)=\lambda^2 x
 
がいえ、帰納法で、任意の自然数  k > 0 にたいして
 
 A^k x = \lambda^k x
 
が簡単に証明できるので、
 
 \psi_A(A) x = \psi_A(\lambda)x = 0
 
となり、 x \neq 0 だったので、

 \psi_A(\lambda)=0

となる。逆は、最小多項式  \psi_A(x) は最小多項式  \psi_A(x) と固有多項式  \varphi_A(x) の最大公約式であるので、最小多項式  \psi_A(x) の根は、固有多項式  \varphi_A(x) の根である。//

以上より、最小多項式  \psi_A(x) と、固有多項式の根は、重複度を除いて、固有多項式  \varphi_A(x) と一致する。また、すぐにわかるように、固有値が全て相異なるならば (分離的ならば)、最小多項式  \psi_A(x) と固有多項式  \varphi_A(x) は、単元倍を除いて一致する。また、最小多項式  \psi_A(A) も. AP^{-1}AP に変換しても不変であることはすぐに示せる。
 
行列 A に関する次の三つの命題は同値である。
 
1) 行列 A は対角化できる
2) 行列 A の最小多項式は重根をもたない
3) 線形空間 V は固有部分空間の直和に分解される。
 
(証明)
 
1) ⇒ 2)
 
 B を対角行列とする。 B の対角成分で、相異なる成分を  b_1, \cdots, b_s とする。そうすると、
 
 (B - b_1 E)(B - b_2 E)\cdots (B - b_s E) \\= O
 
となる。したがって、

 \tau(x)=(x-b_1)(x-b_2)\cdots(x-b_s)

とおくと、行列 A の最小多項式  \psi_A(x) は、 \tau(x) の公約式となる。 \tau(x) は作り方から、重根を持っていないので、行列 A の最小多項式  \psi_A(x) も重根をもつことはない。
 
2) ⇒ 3)
 
各固有値に対応する固有値  \lambda_i に対応する固有部分空間 W_i から、部分空間の基底 vector u_{ij} を一組ずつ取り出す。その基底 vector の数を  n_i とする。
 
 v_1= c_{11}u_{11} + \cdots + c_{1n_1}u_{1n_1}
 \ldots
 v_s= c_{s1}u_{s1} + \cdots + c_{sn_s}u_{sn_s }
 
とおき、

 v_1 + \cdots + v_s = 0
 
が成り立っているとする。ここで、  v_i は 固有部分空間  W_i に入っているから、

 Av_i = \lambda_i v_i

となる。したがって、

 A(v_1 + \cdots + v_s)=0

から


  \lambda_1 v_1 + \cdots + \lambda_s v_s = 0
 
同じことを繰り返すと
 
 (v_1, \cdots, v_s)P =0
 
ここで、
 
 P =\begin{pmatrix}
1&\lambda_1&\ldots&\lambda_1^{s-1}\\
1&\lambda_2&\ldots&\lambda_2^{s-1}\\
\vdots&\vdots&&\vdots\\
1&\lambda_s&\ldots&\lambda_s^{s-1}
\end{pmatrix}

 行列 P は Vandermonde 行列を転置した形で行列式は、
 
 \det{(P)} \\
= (\lambda_s - \lambda_1)\cdots (\lambda_2- \lambda_1)\\
(\lambda_s -\lambda_2) \cdots (\lambda_s - \lambda_{s-1})
 
となって、互いに異なる固有値の対の差積となる。したがって

 \det{ (P)} \neq 0

つまり、

 (v_1, \cdots, v_s) = 0

以上より、
 
 v_1= c_{11}u_{11} + \cdots + c_{1n_1}u_{1n_1}=0
 \ldots
 v_s= c_{s1}u_{s1} + \cdots + c_{sn_s}u_{sn_s }=0

となり、各部分空間の基底をなしていることから、

 c_{ij} = 0

となってすべてのベクトルが線形独立になる。したがって、各固有部分空間の和は直和である (ただし線形空間 V の生成系かどうかはわからない)。
 
 \dim{ W_1} + \cdots + \dim{ W_s} \\
= \dim {(W_1 + \cdots + W_s)} \leq n
 
が、まず証明された。
 
次に、最小多項式  \psi_A(x) が重根をもたなければ、

 \psi_A(x)= (x - \lambda_1)\cdots (x - \lambda_s)

と書ける。

 \psi_A(A)=0

から、
 
 (A - \lambda_1 E)\cdots (A - \lambda_s E) = 0    
 
となる。この左辺を合成写像とみると、右辺 は 0 写像なので、この合成写像の核の次元は、n である。

各部分空間の次元は、次元定理から、
 
 \dim{W_i} \\
= \dim{\ker{ (A - \lambda_i E)}}\\
= n_i - \mathrm{rank} (A - \lambda_i E)
 
が成立している。

ところで、一般に合成写像

(F\circ G)x = 0

の核の次元をみると、

 \mathrm{Im}\, G = W

として
 
 \dim{\ker{FG}}\\
= n - \dim{F(W)}\\
= n - (\dim{W} - \dim{\ker{(F \cap W)}})
 \leq n - \dim{\mathrm{Im}\, G }+ \dim{\ker{F}}
 = (n - \mathrm{rank}\, G) + (n - \mathrm{rank}\, F)
 
が成立する。これを使って、

 \dim{\ker{(A - \lambda_1 E)\cdots (A - \lambda_s E)}}    
  = n \leq \dim{W_1} + \cdots + \dim{W_s}
 
が成立し、前の結果と合わせて

 \dim{W_1} + \cdots +\dim{W_s} = n

すなわち 線形空間 V は、固有部分空間の直和となる。
 
3)⇒ 1)
 
V = \bigoplus W_i

となっているので、各  W_i の固有vector  u_i を一つずつとって列として並べ行列

 P=[u_1, u_2, \cdots, u_n]

を作ると、列 vector は一次独立であることから、 P は、正則行列である。vector  u_i

 A = [a_1, \cdots, a_n]

で変換すると、固有 vector であるので、
 
 [a_1,\cdots, a_n ]u_i =\lambda_i u_i

 [a_1,\cdots, a_n ][u_1,\cdots, u_n] \\
=[\lambda_1 u_1, \cdots, \lambda_n u_n]
 =[u_1, \cdots, u_n]\begin{pmatrix}\lambda_1&0&0&\ldots&0\\
0&\lambda_2&0&\ldots&0\\
0&0 &\lambda_3 & &\vdots\\
\vdots&\vdots& &\ddots &\vdots\\
0&0&\ldots&\ldots&\lambda_n
\end{pmatrix}
 
 B=\begin{pmatrix}\lambda_1&0&0&\ldots&0\\
0&\lambda_2&0&\ldots&0\\
0&0 &\lambda_3 & &\vdots\\
\vdots&\vdots& &\ddots &\vdots\\
0&0&\ldots&\ldots&\lambda_n
\end{pmatrix}

とおけば、

 AP = PB

であり、


  B = P^{-1}AP 

で、B は対角化される。//

※ 行列 A の最小多項式

 \psi_A(x)
( \psi_A(A)=0)

 \psi_A(x)= \prod_{i=1}^{n}(x-\lambda_i)^{d_{i}}

とおく。いま、

 f_k(x) = \frac{\psi_A(x)}{(x-\lambda_k)^{d_k}} = \prod _{i \neq k} (x-\lambda_i)^{d_{i}}

と定めると  f_1, f_2,\cdots, f_n の最大公約式は  1 となるので、

 1= f_1(x)g_1(x)+ \cdots + f_n(x)g_n(x)

となる

 g_k(x) \in \mathbb{C}[X]

が存在する。

そこで、

 p_k(x) = f_k(x)g_k(x)

とすれば、

 1 = p_1(x) + \cdots + p_n(x)

となって「1 の分割」が定まる。

 p_k(A) = P_k

とすれば、

 E = P_1 + \cdots + P_n

ここで、 k \neq l とすれば、

 p_k(x)p_l(x) \\
= f_k(x)g_k(x)f_l(x)g_l(x)\\
=\prod_{i \neq k}(x-\lambda_i)^{d_i}\prod_{i \neq l}(x - \lambda_i)^{d_i}g_k(x)g_l(x)\\
= \psi_A(x)g_k(x)g_l(x)\prod_{i \neq k, l}(x- \lambda_i)^{d_i}

したがって

 P_kP_l = 0 \quad (k \neq l)

がわかる。また、

 P_k \\
= P_kE \\
= P_k(P_1+ \cdots +P_n)
= P_k^2

であることもすぐに確認できる。

 W_k = \{v \in \mathbb{C}^n| (A-\lambda_k E)^{d_k}v= 0\}

と定めれば、

 (x-\lambda_k)^{d_k}p_k(x) = \psi_A(x)g(x)

だから、

 P_ku \in W_k

であり、逆に

 v\in W

とすれば、

 v = (P_1 + \cdots + P_n)v = P_kv

であるから、

 v\in \mathrm{Im} P_k

である。以上より

 \mathrm{Im} P_k = W_k

である ( W_k(A-\lambda_k E)^{d_k} という写像の核である)。

これから

 \mathbb{C}^n = W_1 \oplus W_2 \oplus \cdots \oplus W_n

が言える。

線形空間が直和分解ができることと射影 (1の分割) が存在することは同値である。

 1= p_1 + \cdots + p_n

準同型写像  \varphi を合成すると、

 \varphi \\= \varphi \circ p_1 + \cdots + \varphi \circ p_n

となるので、固有値があるならば、

 \varphi \\= \lambda_1 p_1 + \cdots + \lambda_n p_n

となることは明らかであり、これを ( \varphi の)「スペクトル分解」と呼ぶ。

射影の性質

 p_i p_k = 0 \quad (i \neq k),
 p_i^2 = p_1

を使えば直ちに、

 \varphi^m \\= \lambda_1^m p_1+\cdots +\lambda_n ^m p_n

であることがわかる。

ところで、初歩的な複素函数論の話で、 \lambda を複素変数とし、 f(\lambda) を複素平面のある領域 \Omega で一価正則 (一価とは値がひとつに決まること、正則とは点 z の周りで微分可能で Taylor 展開できることである...念のため) な複素函数とすると、正則函数の単連結な領域でのコーシーの積分定理によって、 C を点  z を囲む単一閉曲線とするとき、

 0 = \frac{1}{2\pi i}\oint_C f(\lambda)d\lambda
 f(z) =  \frac{1}{2\pi i}\oint_C \frac{f(\lambda)}{\lambda-z}d\lambda
 f(z)^{(k)} =  \frac{k!}{2\pi i}\oint_C \frac{f(\lambda)}{(\lambda-z)^{k+1}}d\lambda

が成立する。また、f(\lambda) が、有限個の点  \lambda_1, \cdots, \lambda_n を除いて一価正則であるとき、これらの有限個の点を含む単一曲線 C に関する積分は、

 \frac{1}{2\pi i}\oint_C f(\lambda)d\lambda \\= \frac{1}{2\pi i}\oint_{C_1}  f(\lambda)d\lambda + \cdots +  \frac{1}{2\pi i}\oint_{C_n} f(\lambda)d\lambda

となる ( C_1, \cdots, C_n は、それぞれ、点  \lambda_1, \cdots, \lambda_n を中心とする円で、その領域の中では中心を除いて  f(\lambda) は正則であるとする)。右辺の各項の値を  f(\lambda) \lambda_1, \cdots, \lambda_n の留数と呼び

 Res_{\lambda=\lambda_j}f(\lambda)= \frac{1}{2\pi i}\oint_{C_j} f(\lambda)d\lambda

と書く。

実は、線形写像  \varphi の固有値  \lambda_k のみを囲む単一閉曲線  C_k をとり、

 Res_{\lambda=\lambda_k} \frac{1}{\lambda - \varphi} =\frac{1}{2\pi i}\oint_{C_k} \frac{1}{\lambda - \varphi}d \lambda

を考えると、それは 射影  p_k に他ならないのである。

  p_k = \mathrm{Res}_{\lambda
\\=\lambda_k} \frac{1}{\lambda - \varphi}

射影で成立する「1の分割」

1= p_1 +\cdots + p_n

とは、固有値を複素平面の特異点の集合と見なせば、留数の和の公式に他ならないということである。

A-8. 冪零行列

 N = \begin{pmatrix}
0&1&0&0&0\\
0&0&1&0&0\\
0&0&0&1&0\\
0&0&0&0&1\\
0&0&0&0&0
\end{pmatrix}

 N^2 = \begin{pmatrix}
0&0&1&0&0\\
0&0&0&1&0\\
0&0&0&0&1\\
0&0&0&0&0\\
0&0&0&0&0
\end{pmatrix}

 N^3 = \begin{pmatrix}
0&0&0&1&0\\
0&0&0&0&1\\
0&0&0&0&0\\
0&0&0&0&0\\
0&0&0&0&0
\end{pmatrix}

 N^4 = \begin{pmatrix}
0&0&0&0&1\\
0&0&0&0&0\\
0&0&0&0&0\\
0&0&0&0&0\\
0&0&0&0&0
\end{pmatrix}

 N^5 = \begin{pmatrix}
0&0&0&0&0\\
0&0&0&0&0\\
0&0&0&0&0\\
0&0&0&0&0\\
0&0&0&0&0
\end{pmatrix}

 (P^{-1}NP)^5 = P^{-1}N^5 P = 0

A-9. 双対空間

VK 線形空間としたとき、その線形空間 V から体 K への線形写像全体の集合  V^* を考え、その要素である写像  F , G に対して和とscalar 倍を次のように定義する。
 
 (F + G)(v) = F(v) + G(v)
 (\alpha F)(v) = \alpha(F(v))
 
なお、零元は、

0(v) = 0

をとる写像と考えればよい。このとき、証明は省略するが、 V^* は線形空間となり、線形空間  V の「双対線形空間」と呼ぶ。また、その vector である線形空間  V から 体  K への線形写像を「線形形式」「一次形式」あるいは「一形式」と呼ぶ。
 
線形空間  V の次元が  n であるとし、その基底を  v_1, \cdots,v_n にとるとする。そうすると、線形空間  V の任意の要素  x は、
 
 x = [v_1, \cdots, v_n](x_1, \cdots, x_n)^t
 
とあらわされる。双対空間  V^* の任意の要素  \phi を、この  x に作用させると以下のようになる。
 
 \phi(x) = (\phi(v_1), \cdots, \phi(v_n))(x_1, \cdots, x_n)^t
 
となる。ここで、

 \phi(v_i) = \alpha_i \in K

とおくと、
 
 \phi(x) = (x_1,\cdots, x_n)(\alpha_1, \cdots, \alpha_n)^t
 
と書ける。
 
いま、

 \phi_i(v_j) = \delta_{ij}

という線形形式を考えると、上式は、

 \phi(x) = (\phi_1(x),\cdots, \phi_n(x))(\alpha_1, \cdots, \alpha_n)^t

となり、 \phi_1, \cdots, \phi_n は、双対空間  V^* の基底となり、双対空間  V^* の次元は  V と同じ  n になる。なぜなら、任意の線形型式は、 \phi_1, \cdots, \phi_n の線形結合で表されることはいままでの説明から明らかであり、
 
 c_1\phi_1 + \cdots + c_n\phi_n = 0 (0 は 0 写像を意味する)

のとき、
 
 c_j = (c_1\phi_1 +\cdots + c_n\phi_n)(v_i) = 0
 
となるからである。
 
いま、 K 上の線形空間  V, W を考え、

 \dim{V} = n, \dim{W }= m

とする。 V の基底を  v_1, \cdots, v_nW の基底を  w_1, \cdots, w_m とする。

線形写像  F: V \to W を考え、線形空間 V の任意の要素 v は、
 
 v = [v_1, \cdots, v_n](x_1, \cdots, x_n)^t

であるとすると、

 F(v) \\ 
=[F(v_1), \cdots, F(v_n)](x_1, \cdots, x_n)^t\\ = [w_1, \cdots, w_m]A(x_1, \cdots, x_n)^t
 
とする。ここで、 A = (a_{ij}) である。
 
さらに 写像  F^*: W^* \to V^* を考え,

 \forall \phi \in W^*

に対して以下のように定義する。
 
 F^* (\phi)=\phi  \circ F
 
写像  F^* が線形写像になることは簡単に確認でき、この  F^*を 線形写像 F の「双対写像」であるという。
 
双対空間  W^* の基底を  w^*_1, \cdots, w^*_m,  双対空間  V^* の基底を、 v^*_1, \cdots, v^*_n とする。
 
 F^*(w^*_j(v_i)) \\
= w^*_j (F(v_i))\\
= w^*_j (a_{1i}w_1 + \cdots + a_{mi}w_m)\\= a_{ji}
 
これより、線形空間  V の任意の要素

 v = x_1v_1 + \cdots + x_nv_n

にたいして、
 
 F^*(w^*_j(v))\\
= w^*_j(F(v))\\
= w^*_j([w_1, \cdots, w_m]A(x_1, \cdots, x_n)^t)
 = (x_1, \cdots, x_n)(a_{j1}, \cdots, a_{jn})^t\\
=(v^*_1(v), \cdots, v^*_n(v))(a_{j1}, \cdots, a_{jn})^t
 
双対空間  W^* の 任意の要素を
 
 w^* = (w^*_1, \cdots, w^*_m)(k_1, \cdots,k_m)^t
 
とおくと、
 
 F^*(w^*) \\
= [F^*(w^*_1), \cdots, F^*(w^*_m)](k_1, \cdots, k_m)^t
 = (v^*_1, \cdots, v^*_n) \begin{pmatrix}a_{11}&\ldots&a_{m1}\\
\vdots&\ddots&\vdots\\
a_{1n}&\ldots&a_{mn}\end{pmatrix}(k_1, \cdots, k_m)^t
 =(v^*_1, \cdots, v^*_n) A^t (k_1, \cdots, k_m)^t
 
となることから、線形写像  F に対応する行列  A の転置行列  A^t は、双対写像  F^* に対応している行列だということがわかる。 \mathrm{Im}\,F の階数 (rank) を  r としたとき、r は、対応する行列の 行 vector および列 vector の階数に等しかった。したがって、
 
 \mathrm{dim} (\mathrm{Im} \, F) = \mathrm{dim} (\mathrm{Im}\, F^*)
 
である。

A-10. 二重双対空間

双対空間  V^* は、 K 線形空間  V から体  K に値をもつ線形写像の集合、つまり  \mathrm{Hom} (V, K) によって構成されていた。 K 線形空間と双対空間は、体  K を介して繋がっている。ここで双対空間  V^* の双対空間を考える。すなわち
 
 (V^*)^* = V^{**}
 
である。この空間を「二重双対空間 (Double Dual Space)」という。 V^{**} は、 K 線形空間  V^* から体  K へ値をとる線形写像全体の集合である。この写像の集合が線形空間になることは、 V^* が線形空間だったのだから、まったく同じように証明できる(証明略)。
 
さて、線形空間  V の任意の要素を  \alpha とし、写像

 \varphi_{\alpha} : V^* \to K

を次のように定義する。 V^* に属する任意の写像を  f としたとき、
 
 \Phi_{\alpha}(f) =f (\alpha)
 
ここで、

 f(\alpha) \in K

だから、写像  \Phi は実際に  V^* \to K になっている。この写像  \Phi が線形写像であることを確認してみると、
 
 \Phi_{\alpha} (f + g) \\
= (f + g) (\alpha)\\
= f(\alpha) + g(\alpha) \\
= \Phi_{\alpha}(f) + \Phi_{\alpha}(g)

 \phi_{\alpha}(kf) \\
= (kf)(\alpha) \\
= kf(\alpha) \\
= k\Phi_{\alpha}(f)
 
となるから、写像  \Phi は線形写像であり、したがって、二重双対空間 V^{**} の要素である。
 
任意の  x, y \in V, k \in K に対して、
 
 \Phi_{x+y}(f) \\
= f(x+y) \\
= f(x) + f(y) \\
= \Phi_x(f) + \Phi_y(f) \\
= (\Phi_x + \Phi_y)(f)

 \Phi_{kx}(f) \\
= f(kx) \\
= kf(x) \\
= k\Phi_x(f) = (k\Phi_x)(f)
 
したがって、
 
 \Phi_{x+y} = \Phi_x + \Phi_y
 \Phi_{kx} = k\Phi_x
 
という結果になり、V から V^{**} への線形写像が得られた。この線形写像が同型写像であることを示す。まず、
 
 \mathrm{dim}\, V \\
= \mathrm{dim}\, V^*\\
 = \mathrm{dim}\, V^{**}
 
となる。線形空間  V とその双対空間 V^* の基底をそれぞれ、

 \{v_1,\cdots, v_n \}, \{v^*_1, \cdots, v^*_n\}

とすれば
 
 v^*_i(v_j) = \delta_{ij}
 
の関係が成立していた。ここで、先程の  \Phi をつかうと
 
 \Phi_{v_j} (v^*_i) = v^*_i(v_j) = \delta_{ij}
 
となり、 \Phi_{v_j} は、V^{**} の基底となる。つまり、この写像は、線形空間 V の基底 v_i を 基底 \Phi_{v_i} に移し、 v_i が異なれば対応する \Phi_{v_i} も異なる。さらに先程みたように次元は等しいことから、 \Phi は全単射である。したがって、 \Phi_x は、線形空間 V から V^{**} への線形同型写像になり、しかも  \Phi は基底の取り方によらず空間全体に一貫して自動的に定まる。このような場合、線形空間 V と線形空間 V^{**} は「自然同型 (標準同型)」であるという。なお、
 
 V \simeq V^{**} 
 
なので、これ以上の双対空間を作っても、結果は同じである。つまり、
 
V^{***} = (V^{**})^* = V^*
V^{****} = (V^{***})^* = (V^*)^* = V^{**} = V
\cdots
 
数学では、写像を一つの点や数と同格に考えるのは基本である。モノとコトの区別などもともとない。

A-11. Levi-Civita の記号 (番外編)

Levi-Civita の記号は、いかにもお洒落なイタリア的記号である。

 (i, j, k) が、(1, 2, 3) の偶置換のとき、 \epsilon_{ijk} = 1
 (i, j, k) が、 (1, 2, 3) の奇置換のとき  \epsilon_{ijk} = -1
それ以外は、 \epsilon_{ijk} = 0 として、Levi-Civita の記号を定める。

※ 任意の置換は互換の積に分解できるのだった。互換が奇数個のときが奇置換、偶数個のときが偶置換である。長さ 3 の巡回置換は (1,2,3) = (1,3)(1,2) だからすべて偶置換である。また偶置換、奇置換は互換の分解の仕方によらず一意に定まる。

 \epsilon_{123}= \epsilon_{231}= \epsilon_{312} = 1
 \epsilon_{132}= \epsilon_{213}= \epsilon_{321} = -1//


ところで、外積  a \times b は、行列式の形式を借りて、以下のように書ける (もちろん、e_i は vector なので行列式は求められない)。

 a \times b = \begin{vmatrix} e_1 & e_2 & e_3\\a_1 & a_2 & a_3\\b_1 & b_2 & b_3 \end{vmatrix}

これを行列の 1 行目をつかって余因子展開すると、

 a \times b \\= \begin {vmatrix} a_2 & a_3 \\b_2 & b_3 \end {vmatrix}e_1 - \begin {vmatrix} a_1  & a_3 \\b_1 & b_3 \end{vmatrix}e_2   +  \begin {vmatrix} a_1  & a_2 \\b_1  & b_2 \end{vmatrix}e_3

となる。これを

 (a \times  b)_i = \epsilon_{ijk}a_j b_k

と表すことにする。たとえば、

 (b \times c)_1 = \epsilon_{123}b_2 c_3 + \epsilon_{132}b_3 c_2  = b_2 c_3 - b_3 c_2
 (b \times c)_2 = \epsilon_{231}b_3 c_1 + \epsilon_{213}b_1 c_3  = b_3 c_1 - b_1 c_3

という具合になっている。

まず、外積に関する基本的性質を確認しておこう。

 a \times b = - b \times a

つまり、交換法則を満たさず、交代性をもっている。
これは、

 (a \times b)_i  = \epsilon_{ijk}a_j b_k = -\epsilon_{ijk} b_j a_k = - (b \times a)_i

で証明できる。また、結合法則は成立しない。

 e_1 \times  (e_1 \times e_2) = e_1 \times  \epsilon_{312} e_3 \\= e_1 \times e_3  =  \epsilon_{213} e_2  = - e_2

(e_1 \times e_1) \times  e_2 = 0

したがって、外積の三重積の括弧を外して書くことなどありえない。

次は成り立つ。

 a \times  (\alpha b + \beta c) = \alpha (a  \times  b) + \beta ( a  \times  c) \\
 (\alpha b + \beta c) \times a = \alpha (b \times a) + \beta  (c \times  a)

これは、外積が 双線形の性質を有していることを意味している。 証明は、最初だけやると

   (a \times (\alpha b + \beta c))_i \\= \epsilon_{ijk} a_j (\alpha b + \beta c)_k \\= \alpha \epsilon_{ijk} a_j b_k + \beta \epsilon_{ijk} a_j c_k\\= \alpha (a \times b)_i + \beta (a  \times  c)_i

である。

次の関係が成立する。 \langle , \rangle は内積を表す。

  \langle e_i  \times e_j, e_k \rangle = \epsilon_{ijk}


 \epsilon_{ijk}\\= \langle e_i \times e_j, e_k \rangle\\= \begin {vmatrix} (e_k)_1 & (e_k)_2 & (e_k)_3\\
(e_i)_1& (e_i)_2&(e_i)_3\\ (e_j)_1& (e_j)_2&(e_j)_3\end{vmatrix}

 = \begin {vmatrix} (e_i)_1 & (e_i)_2 & (e_i)_3\\
(e_j)_1& (e_j)_2&(e_j)_3\\ (e_k)_1& (e_k)_2&(e_k)_3\end{vmatrix}

となり (二つ目は行を偶置換した)、

 \epsilon_{ijk}\epsilon_{pqr}
 = \begin {vmatrix} (e_i)_1 & (e_i)_2 & (e_i)_3\\(e_j)_1& (e_j)_2&(e_j)_3\\ (e_k)_1& (e_k)_2&(e_k)_3\end{vmatrix} \begin {vmatrix} (e_p)_1 & (e_p)_2 & (e_p)_3\\(e_q)_1& (e_q)_2&(e_q)_3\\ (e_r)_1& (e_r)_2&(e_r)_3 \end{vmatrix}

 = \begin {vmatrix} (e_i)_1 & (e_i)_2 & (e_i)_3\\(e_j)_1& (e_j)_2&(e_j)_3\\ (e_k)_1& (e_k)_2&(e_k)_3\end{vmatrix} \begin {vmatrix} (e_p)_1 & (e_q)_1 & (e_r)_1\\(e_p)_2& (e_q)_2&(e_r)_2\\ (e_p)_3& (e_q)_3&(e_r)_3 \end{vmatrix}

 = \begin {vmatrix} \delta_{ip}& \delta_{iq}& \delta_{ir}\\\delta_{jp}& \delta_{jq}&\delta_{jr}\\ \delta_{kp}& \delta_{kq}&\delta_{kr}\end{vmatrix}

となる。二つ目は転置、三つ目は  |AB|=|A||B| で行列式の値が変わらない性質を使った。

 r = k として余因子展開すると、

 \epsilon_{ijk}\epsilon_{pqk}\\
= \delta_{ip}\delta_{jq} - \delta_{iq}\delta_{jp}

さらに、いろいろな外積がまじった関係式を証明してみる。まず、

 \langle a, b \times c \rangle = \epsilon_{ijk}a_i b_j c_k

最後の式は、行列式  det (a, b, c) に等しいことがわかる。

次は、vector 解析では有名な公式で、電磁気学などでは頻出する。

 [a \times (b \times c)]_i  \\
= \epsilon_{ijk} a_j (b \times c)_k\\                    = \epsilon_{ijk} \epsilon_{klm} a_j b_l c_m
 = \epsilon_{ijk}\epsilon_{lmk}a_j b_l c_m\\
= (\delta_{il}\delta_{jm} - \delta_{im}\delta_{jl}) a_j b_l c_m
 = a_j b_i c_j - a_j b_j c_i \\                     = b_i \langle a, c \rangle - c_i \langle a, b \rangle

したがって、

 a \times (b \times c) = b\langle a, c\rangle - c\langle a, b \rangle

結合法則は成立しなかったので、 (a \times b) \times c も求めてみると、

 [(a \times b) \times c]_i \\
= \epsilon_{ijk}(a \times b)_j c_k\\                   = \epsilon_{ijk}\epsilon_{jlm}a_l b_m c_k
 = - \epsilon_{ikj}\epsilon_{lmj}a_l b_m c_k\\
= (\delta_{im}\delta_{kl} - \delta_{il}\delta_{km}) a_l b_m c_k
= a_k b_i c_k - a_i b_k c_k\\                     = b_i \langle a_k, c_k \rangle - a_i \langle b_k, c_k \rangle

 (a \times b) \times c = b\langle a, c\rangle - a\langle b, c \rangle

つぎに、

 \langle (a \times b), (c \times d) \rangle\\
= (a \times b)_i (c \times d)_i
 =  \epsilon_{ijk} a_j b_k \epsilon_{imn} c_m d_n\\
= \epsilon_{ijk} \epsilon_{imn} a_j b_k c_m d_n
 = \epsilon_{jki}\epsilon_{mni}a_j b_k c_m d_n\\
= (\delta_{jm}\delta_{kn} - \delta_{jn}\delta_{km})a_j b_k c_m d_n
 = a_j b_k c_j d_k - a_j b_k c_k d_j\\
= \langle a, c \rangle \langle b, d \rangle - \langle a, d \rangle \langle b, c \rangle

となる。

さらに、

 \langle c, (d \times (a \times b))\rangle\\
= c_i(d \times (a \times b))_i\\
= c_i \epsilon_{ijk} d_j (a \times b)_k
 = c_i \epsilon_{ijk} d_j \epsilon_{kmn}a_m b_n
 = \epsilon_{kmn} a_m b_n \epsilon_{kij} c_i d_j
 = \langle (a  \times b), (c \times d)\rangle\\
= \langle a, c \rangle \langle b, d \rangle - \langle a, d \rangle \langle b, c \rangle

次に、

 [(a \times b) \times (c \times d)]_i \\= \epsilon_{ijk}(a \times b)_j (c \times d)_k
 = \epsilon_{ijk}\epsilon_{jmn} a_m b_n \epsilon_{kpq} c_p d_q\\                            = \epsilon_{ijk} \epsilon_{pqk }\epsilon_{jmn} a_m b_n c_p d_q
 = (\delta_{ip} \delta_{jq} - \delta_{iq} \delta_{jp}) \epsilon_{jmn} a_m b_n c_p d_q
 =  \epsilon_{jmn} a_m b_n c_i d_j - \epsilon_{jmn} a_m b_n c_j d_i \\                           = c_i a_m \epsilon_{mnj}b_n d_j  - d_i a_m \epsilon_{mnj} b_n c_j  = c_i a_m (b \times d)_m - d_i a_m (b \times c)_m\\
= c_i  \langle a, (b \times d) \rangle - d_i \langle a, (b \times c)\rangle

つまり、
 (a \times b) \times (c \times d) \\
= c  \langle a, (b \times d) \rangle - d \langle a, (b \times c)\rangle

これだけの関係が、ほとんど機械的に導けるのだから、Levi - Civita の記号はお洒落なだけではなかった。