유한차원 벡터공간 \(V\) 위에서 자기준동형사상 \(T\)가 정의되어 있을 때 \(T\)의 표현행렬은 \(V\)에 어떠한 기저가 주어졌는지에 따라 달라진다. \(V\)와 \( T\)가 적절한 조건을 만족시키면 \(V\)의 기저를 적절히 택하여 \(T\)의 표현행렬이 ‘대단히 좋은 형태’가 되도록 할 수 있다.
이 포스트에서는 벡터공간을 특성부분공간의 직합으로 나타내는 방법과 자기준동형사상을 조르당 표준형으로 나타내는 방법을 살펴본다. 이 포스트에서 다루는 벡터공간은 유한차원 벡터공간인 것으로 약속한다.
특성부분공간을 이용한 분해
이 절에서는 벡터공간 \(V\)에 자기준동형사상 \(T\)가 주어졌을 때, \(T\)에 대한 특성부분공간의 직합으로 \(V\)를 나타내는 방법을 살펴본다.
이 주제를 마칠 때까지 \(V\)는 체 \(K\) 위에서 정의되어 있고 차원이 \(n\)인 유한차원 벡터공간이며 \(T\)는 \(V\) 위에서 정의된 자기준동형사상이고 \(p(t)\)는 \(T\)의 특성다항식을 나타내는 것으로 약속한다. 또한 \(p(t)\)가 \(K\)에서 일차식의 곱으로 인수분해된다고 가정한다.
논의를 위하여 추상대수학에서 사용하는 몇 가지 용어와 정리를 도입하자. 상수가 아닌 다항식 \(p(t) \in K[t]\)가 ‘\(K\)에서 기약(irreducible)이다’라는 것은 \(g(t)\)가 \[g(t) = h_1 (t) h_2 (t) \quad (h_1 (t) ,\, h(t) \in K[t])\] 의 꼴로 나타날 때는 \(h_1(t)\) 또는 \(h_2(t)\)가 상수일 때뿐임을 의미한다. 즉 \(g(t)\)가 기약다항식이면 \(g(t)\)는 차수가 더 낮고 문자를 가진 두 개의 다항식의 곱으로 인수분해될 수 없다. 동일한 다항식이라도 체 \(K\)가 무엇인지에 따라 기약다항식일 수도 있고 기약이 아닐 수도 있다.
이제 다음 정리를 증명 없이 받아들이기로 한다.
- 유일분해성질. \(K[t]\)에 속하는, 상수가 아닌 다항식은 \(K[t]\)에서 기약인 다항식의 곱으로 인수분해된다. 더욱이, 이러한 인수분해 표현은 인수의 순서와 상수배를 제외하면 유일한 꼴이다.
- Bézout 항등식. \(g_1,\) \(\cdots,\) \(g_m\)이 \(K[t]\)에 속하는 다항식이고, 문자를 포함한 공통인수를 갖지 않는다고 하자. (즉 공통인수가 상수 뿐이라고 하자.) 그러면 \(K[t]\)에 속하는 다항식 \(h_1,\) \(\cdots ,\) \(h_m\)이 존재하여 다음을 만족시킨다. \[g_1 (t) h_1 (t) + \cdots + g_m (t) h_m (t) = 1\] 여기서 우변은 상수다항식을 나타낸다.
이제 특성부분공간에 관한 논의를 이어가자. \(p(t)\)가 \(K\)에서 일차식의 곱으로 인수분해되므로 \(\lambda_1,\) \(\cdots,\) \(\lambda_n \in K\)가 존재하여 \[p(t) = \prod_{j=1}^n (t-\lambda_j )\] 를 만족시킨다. 물론 모든 \(\lambda_j\) 중에는 서로 같은 것이 존재할 수 있다. \(\lambda_j\)가 갖는 값의 개수가 \(r\)이라고 하자. 그러면 위 식은 다음과 같이 나타낼 수 있다. \[p(t) = \prod_{j=1}^r (t-\lambda_j )^{m_j} .\tag{1}\] 여기서 \(m_j\)를 고윳값 \(\lambda_j\)의 중복도(multiplicity)라고 부른다. \(j=1,\, 2,\, \cdots,\, r\)에 대하여 \(V\) 위에서의 자기준동형사상 \(N_j\)를 \[N_j = (T-\lambda_j I_n )^{m_j}\tag{2}\] 으로 정의하고, \(V\)의 부분공간 \(U_j\)를 \[U_j = \Ker (N_j )\tag{3}\] 로 정의한다. 각 \(U_j\)는 \(\lambda_j\)에 대응되는 고유공간을 포함하므로 자명하지 않은(영벡터 외의 벡터를 가지는) 공간이다. 이로써 다음 정의를 도입할 수 있다.
정의 1. \(V\)의 부분공간 \(U_1,\) \(\cdots,\) \(U_r\)를 자기준동형사상 \(T\)에 대한 특성부분공간(characteristic subspace)이라고 부른다.
이 개념을 바탕으로 스펙트럼 분해 정리를 일반화할 수 있다. 즉 \(T\)가 에르미트 변환이거나 유니타리 변환이 아니고, \(K\)가 실수체이거나 복소수체라는 가정 없이 논의를 진행할 수 있다. 단지 \(T\)의 특성다항식이 \(K\)에서 일차식의 곱으로 인수분해된다는 가정을 바탕으로 하고 있다는 점을 염두에 두자.
정리 2. \(U_1,\) \(\cdots,\) \(U_r\)가 \(T\)에 대한 \(V\)의 특성부분공간이라고 하자. 그러면 다음이 성립한다.
- 각 부분공간 \(U_j\)는 \(T\)-불변이다.
- \(V = U_1 \oplus \cdots \oplus U_r .\)
- 각 \(j\)에 대하여, \(T\)의 정의역을 \(U_j\)로 제한한 함수 \(T\vert_{U_j}\)는 단 하나의 고윳값 \(\lambda_j\)를 가진다.
- 각 \(j\)에 대하여, \(U_j\)의 차원은 \(\lambda_j\)의 중복도와 같다. 즉 \(\dim(U_j) = m_j\)이다.
증명.
(i) 정의 (2)에 의하여 각 \(N_j\)는 \(T\)와 교환할 수 있다. 또한 \(N_j (U_j) = \left\{ \mathbf{0} \right\}\)이다. 따라서 \[N_j T(U_j) = TN_j (U_j ) = T(\left\{ \mathbf{0} \right\}) = \left\{ \mathbf{0} \right\}\] 이므로, \(T(U_j)\)는 \(\Ker(N_j) = U_j\)에 포함된다.
(ii) 먼저 \(V = U_1 + \cdots + U_r\)을 보이자. 다음과 같은 다항식을 생각하자. \[q_j (t) = \frac{p(t)}{(t-\lambda_j)^{m_k}} . \quad (j=1,\,2,\,\cdots,\,r)\] 즉 \(p(t)\)의 인수 중에서 \(\lambda_j\)를 근으로 갖는 인수를 제거한 것이다. Cayley-Hamilton 정리에 의하여 \[[N_j q_j (T) ](v) = p(T) (v) = \mathbf{0}\] 이므로, 임의의 \(v\in V\)에 대하여 \(q_j (T) (v) \in U_j\)이다. 더욱이, \(q_j\)들은 상수 외의 공통인수를 갖지 않으므로, 다항식 \(h_1 (t) ,\) \(\cdots,\) \(h_r(t)\)가 존재하여 \[h_1 (t) q_1 (t) + \cdots + h_r (t) q_r (t) = 1\] 즉 \[h_1 (T) q_1 (T) + \cdots h_r (T) q_r (T) = 1_V \tag{4}\] 를 만족시킨다. 그러므로 임의의 \(v\in V\)에 대하여 \[v = \sum_{j=1}^r [ h_j (T) q_j (T)](v)\] 이다. 그런데 \(q_j (T)(v)\in U_j\)이고 \(U_j\)가 \(T\)-불변이므로, 위 등식의 우변의 합에서 \(j\)째 항은 \(U_j\)에 속한다. 그러므로 \(V = U_1 + \cdots + U_r\)이다.
다음으로 \(U_1 \cap \cdots \cap U_r = \left\{ \mathbf{0} \right\}\)을 증명하자. 각 \(u_k \in U_k\) \((k=1,\,2,\,\cdots,\,r)\)와 \(j=1,\,2,\,\cdots,\,r\)에 대하여 \[[h_j (T) q_j (T) ](u_k) = \begin{cases} u_k &\quad \text{ if } j=k \\[5pt] \mathbf{0} &\quad \text{ otherwise} \end{cases}\tag{5}\] 가 성립한다. 이것을 보이기 위하여 \(j\ne k\)일 때 \(q_j\)가 인수 \(N_k\)를 가지며 각 \(U_k = \Ker (N_k)\)에서 \(q_j\)의 함숫값은 \(\mathbf{0}\)이다. 그러므로 (5)가 성립한다. 이 사실과 (4)를 이용하면 다음을 얻는다. \[u_k = \sum_{j=1}^r [ h_j (T) q_j (T) ](u_k) = [ h_k (T) q_k (T)] (u_k).\] 이제 \(u_j \in U_j\)이고 \[u_1 + \cdots + u_r = \mathbf{0}\tag{6}\] 이라고 가정하자. 그러면 각 \(j\)에 대하여 (6)의 양변에 \(h_j (T) q_j (T)\)를 취하면 (5)에 의하여 \(u_j = \mathbf{0}\)을 얻는다.
(iii) \(T\)의 정의역을 \(U_j\)로 제한한 함수를 \(T_j = T\vert_{U_j}\)로 나타내자. 그리고 \(T_j\)의 고윳값을 \(\mu_j\)라고 하자. 그러면 \((\mu_j - \lambda_j )^{m_j}\)는 자기준동형사상 \((T_j - \lambda_j 1_{U_j} )^{m_j}\)의 고윳값이다. 그런데 \((T_j - \lambda_j 1_{U_j} )^{m_j}\)은 \(U_j\)에서 함숫값 \(\mathbf{0}\)을 취하므로, 이 준동형사상의 고윳값은 \(0\) 뿐이다. 그러므로 \(\mu_j = \lambda_j\)이다. [스칼라 \(\lambda_j\)는 그 자체로 제한사상의 고윳값이다. 왜냐하면 \(U_j\)는 \(\lambda_j\)에 대응하는 고유공간 전체를 포함하기 때문이다.]
(iv) 각 \(j=1,\,2,\,\cdots,\,r\)에 대하여 \(n_j = \dim(U_j)\)라고 하자. 그리고 \(B_j\)가 \(U_j\)의 기저라고 하자. 그러면 \(B_1 ,\) \(\cdots ,\) \(B_r\)를 이 순서대로 합집합하여 \(V\)의 기저 \(B\)를 얻으며, 이 기저에 대한 \(T\)의 표현행렬은 다음과 같은 꼴이 된다. \[A = \left(\begin{array}{cccc} A_1 & 0 & \cdots & 0 \\ 0 & A_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & A_r \end{array}\right).\] 여기서 각 \(A_j\)는 기저 \(B_j\)에 대한 \(T_j\)의 표현행렬이며, \(n_j \times n_j\) 행렬이다. 따라서 \(V\)에서 \(T\)의 특성다항식은 \(T_j\)의 특성다항식들의 곱과 같다. (iii)에 의하여 각 \(T_j\)는 \(\lambda_j\)만을 고윳값으로 가지므로 \(T_j\)의 특성다항식은 \((t-\lambda_j)^{n_j}\)이다. 그러므로 (1)에 의하여 \(V\)에서 \(T\)의 특성다항식은 \[\prod_{j=1}^r (t-\lambda_j )^{m_j} = \prod_{j=1}^r (t-\lambda_j )^{n_j}\] 이다. 다항식의 유일분해성질에 의하여 각 \(j=1,\,\cdots,\,r\)에 대하여 \(m_j = n_j\)이다.
조르당 표준형
이 절에서는 자기준동형사상의 삼각행렬 축약 정리를 일반화한 내용을 살펴보자.
이 주제를 마칠 때까지 삼각행렬은 위 삼각행렬을 이르는 것으로 약속한다. 만약 삼각행렬의 대각성분이 모두 \(0\)이면, 그 삼각행렬을 순삼각행렬이라고 부른다. 순삼각행렬은 다음과 같은 성질을 가진다.
정리 3. \(A\in M_n (K)\)가 순삼각행렬이면 \(A^n = O\)이다.
증명.
\(n\)에 대한 수학적 귀납법으로 쉽게 증명된다.
\(A\)가 정사각행렬이고 \(A^m = O\)인 자연수 \(m\)이 존재할 때, \(A\)를 멱영원(nilpotent)라고 부른다. \(A^m = O\)이 되는 자연수 \(m\) 중에서 가장 작은 값을 \(A\)의 멱영지수(index of nilpotency)라고 부른다. 이러한 용어는 벡터공간 이에서 정의된 자기준동형사상에도 똑같이 사용할 수 있다.
자기준동형사상의 정의역을 특성부분공간으로 제한한 함수의 성질을 더 깊이 살펴보자. \(V\)가 체 \(K\) 위에서의 벡터공간이고 \(n\)차원이라고 하자. 그리고 \(T\)가 \(V\) 위에서 정의된 자기준동형사상이고 \(T\)의 특성다항식이 \(K\)에서 일차식의 곱으로 인수분해된다고 하자. 그 특성다항식의 근을 \(\lambda_1,\) \(\cdots,\) \(\lambda_r\)라고 하고, 이 근들의 중복도를 \(m_1,\) \(\cdots,\) \(m_r\)라고 하며, 이 근들에 대응되는 특성공간을 \(U_1 ,\) \(\cdots ,\) \(U_r\)라고 하자. 또한 \(T\)의 정의역을 \(U_j\)로 제한한 함수를 \(T_j : U_j \rightarrow U_j\)로 나타내자.
자기준동형사상의 삼각행렬 축약 정리에 의하여 각 \(U_j\)의 기저 \(B_j\)가 존재하며, 이 기저에 대한 \(T_j\)의 표현행렬 \(A_j\)가 삼각행렬이 된다. 삼각행령의 고윳값은 대각성분과 같은데, 정리 2의 (iii)에 의하여 \(T_j\)는 \(\lambda_j\)만을 고윳값으로 가지므로 행렬 \(A_j\)는 다음과 같은 꼴이 된다. \[A = \left(\begin{array}{ccccc} \lambda_j & \ast & \cdots & \ast & \ast \\ 0 & \lambda_j & \cdots & \ast & \ast \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & \cdots & \lambda_j & \ast \\ 0 & 0 & \cdots & 0 & \lambda_j \end{array}\right).\] 명백히 \(A_j\)는 스칼라항등행렬 \(\lambda_j I_{m_j}\)와 순삼각행렬의 합으로 표현될 수 있다. 그러므로 다음과 같은 결론을 얻는다.
정리 4. 자기준동형사상 \(T\)의 정의역을 \(U_j\)로 제한한 함수 \(T_j\)는 대각행렬 \(D_j = \lambda_j I_{m_j}\)와 멱영행렬 \(N_j\)의 합 \[T_j = D_j + N_j\tag{7}\] 의 꼴로 나타낼 수 있다.
(7)에서 \(D_j\)를 \(T_j\)의 대각부분(diagonal part)이라고 부르고, \(N_j\)를 \(T_j\)의 멱영부분(nilpotent part)이라고 부른다. 각 \(T_j\)에 대하여 \(D_j\)와 \(N_j\)는 유일하게 정해진다.
\(V\)가 체 \(K\) 위에서의 벡터공간이고 \(n\)차원이라고 하자. 그리고 \(N\)이 \(V\) 위에서 정의된 멱영변환이며 \(N^m\)이 영변환(모든 값을 영벡터에 대응시키는 변환)이라고 하자. 이제 \(V\)에서의 적당한 기저를 구성하여, 그 기저에 대하여 \(N\)이 간단한 행렬로 표현될 수 있도록 해보자.
먼저 몇 개의 보조정리가 필요하다.
보조정리 5. \(w_0\in V,\) \(w_0 \ne \mathbf{0}\)이고 \(m\)이 \(N^m (w_0 ) = \mathbf{0}\)을 만족시키는 가장 작은 양의 정수라고 하자. 그러면 벡터 \[N^{m-1} (w_0) ,\,\, N^{m-2} (w_0) ,\,\, \cdots,\,\, N(w_0) ,\,\, w_0\tag{8}\] 은 일차독립이다.
증명.
주어진 벡터들이 일차독립임을 보이기 위하여 \[\sum_{j=1}^m \mu_j N^{m-j} (w_0) = \mathbf{0}\] 이라고 가정하자. 등식의 양변에 \(N^{m-1}\)을 취하면, 좌변의 합 중에서 마지막 항을 제외한 모든 항은 \(\mathbf{0}\)이 된다. 그러므로 \(\mu_m = 0\)이다. 마찬가지로 등식의 양변에 \(N^{m-2}\)을 취하면, 좌변의 합 중에서 마지막에서 두 번째 항을 제외한 모든 항은 \(\mathbf{0}\)이 되므로 \(\mu_{m-1}=0\)이다. 이 과정을 반복하여, 등식의 좌변의 모든 계수가 \(0\)임을 알 수 있다.
(8)의 벡터들에 의하여 생성되는 부분공간 \(W\)를 \(N\)에 대한 \(V\)의 순환부분공간(cyclic subspace)이라고 부른다. 이때 (8)을 \(W\)의 순환기저(cyclic basis)라고 부르며, \(w_0\)를 이 기저의 근(root)이라고 부른다. 명백히 이와 같은 부분공간은 \(N\)-불변이며, 기저 (8)에 대한 \(N\)의 표현행렬은 다음과 같은 \(m\times m\) 행렬이다. \[\left(\begin{array}{ccccc} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ 0 & 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 0 \end{array}\right)\] 공간 \(V\) 자체는 순환공간이 아닐 수도 있다. 즉 \(N^j (v_0),\) \(j=0,\,1,\,\cdots,\,n-1\)이 \(V\)의 기저가 되도록 하는 벡터 \(v_0\)가 존재하지 않을 수도 있다. 그러나 우리는 \(V\)의 적당한 기저 \(B\)를 구성하여, \(B\)에 대한 \(N\)의 표현행렬이 같은 성질을 갖도록 할 것이다. 핵심은 공간 \(V\)를 순환부분공간의 직합으로 표현하는 것이다.
보조정리 6. \(W\)의 벡터공간 \(V\)의 순환부분공간이고 차원이 \(n\)이며 순환기저 \[N^{m-1}(w_0) ,\,\, N^{m-2}(w_0) ,\,\, \cdots ,\,\, N(w_0) ,\,\, w_0\] 을 가진다고 하자. 그러면 \(W\)의 모든 원소 \(w\)에 대하여 적당한 \(q(t)\in K[t]\)가 존재하여 \(w= q(N) (w_0)\)을 만족시킨다.
증명.
\(w\in W\)라고 하자. 그러면 \(w\)는 \[w = \sum_{j=1}^m \mu_j N^{m-j} (w_0)\] 의 꼴로 표현된다. \[q(t) = \sum_{j=1}^m \mu_j t^{m-j}\] 이라고 하면 \(w=q(N)(w_0)\)이다.
보조정리 7. \(W\)가 보조정리 6에서와 같은 공간이고, 적당한 \(q(t)\in K[t]\)에 대하여 \(q(N)\)이 \(W\) 위에서 영변환이 된다고 하자. 그러면 \(q(t)\)는 \(t^m\)을 인수로 가진다.
증명.
나눗셈 정리에 의하여 적당한 \(q_1 (t) ,\, r(t) \in K[t]\)가 존재하여 \[q(t) = q_1 (t) t^m + r(t)\] 를 만족시킨다. 여기서 \(r(t)\)의 차수는 \(m\) 미만이다 \(N^m\)은 \(W\) 위에서 영변환이므로, \(W\)에 주어진 순환기저의 근 \(w_0\)에 대하여 다음이 성립한다. \[q(N) (w_0) = [q_1 (N) N^m ] (w_0) + r(N) (w_0) =r(N) (w_0) \] 그러므로, 만약 \(q(N)\)이 \(W\) 위에서 영변환이면 \(r(N) (w_0) = \mathbf{0}\)이다. 그러나 \(r\)가 영다항식이 아니면 순환기저의 일차독립성에 의하여 이 등식은 성립할 수 없다. 그러므로 \(q(t) = q_1 (t) t^m\)이며, \(t^m\)은 \(q(t)\)의 인수이다.
보조정리 8. \(N\)이 \(V\) 위에서 정의된 자기준동형사상이고 멱영변환이며, 다음 조건을 만족시키는 \(V\)의 부분공간 \(W\)가 존재한다고 하자.
- \(N(W) = N(V).\) 즉 \(N\)에 의한 \(W\)의 상과 \(V\)의 상이 동일하다.
- \(W\)가 \(N\)에 대한 순환부분공간의 직합으로 표현된다.
그러면 \(V\)는 순환부분공간의 직합으로 표현된다.
증명.
\(v\in V\)라고 하자. 조건 (i)에 의하여 \(w\in W\)가 존재하여 \(N(v) = N(w)\)를 만족시킨다. 이때 \(v-w \in \Ker (N)\)이므로 \(V = W + \Ker (N)\)이다. \(W\)와 \(\Ker(N)\)의 기저를 각각 \(B_W,\) \(B_K\)라고 하자. 그러면 \(B_K\)의 부분공간 \(B_K ' \)이 존재하여 \(B_W \cup B_K ' \)이 \(V\)의 기저가 된다. \(B_K ' \)에 의하여 생성되는 공간을 \(W ' \)이라고 하자. 그러면 \(V = W \oplus W ' \)이다.
가정 (ii)에 의하여 \(W\)는 순환부분공간의 직합이다. \(W ' \)은 자명한 공간이거나 순환부분공간의 직합이다. 왜냐하면 \(\Ker (N)\)에 속하는 벡터 중 영벡터가 아닌 것, 특히 \(B_K ' \)의 임의의 벡터는 일차원 순환부분공간을 생성하며 자기 자신이 그 공간의 순환기저가 되기 때문이다. 그러므로 \(V = W \oplus W ' \)은 순환부분공간의 직합이다.
이제 다음 정리를 증명할 수 있다.
정리 9. \(V\)가 자명하지 않은 벡터공간이고 \(N\)이 \(V\) 위에서 정의된 자기준동형사상이며 멱영변환이라고 하자. 그러면 \(N\)에 대한 \(V\)의 순환부분공간 \(V_1 ,\) \(\cdots,\) \(V_s\)가 존재하여 \[V = V_1 \oplus V_2 \oplus \cdots \oplus V_s\] 를 만족시킨다. 즉 \(V\)는 순환부분공간의 직합으로 표현된다.
증명.
\(V\)의 차원 \(n\)에 대한 수학적 귀납법을 사용하여 증명하자.
\(n=1\)인 경우 \(1\)차원 공간 위에서 정의된 멱영변환은 영변환 뿐이므로, 영벡터가 아닌 임의의 벡터는 그 공간의 순환기저가 된다. 그러므로 \(n=1\)일 때 정리의 결론을 얻는다.
\(n > 1\)이라고 하자. 지금부터 보조정리의 조건을 만족시키는 부분공간을 구성할 것이다.
먼저 \(N(V) \ne V\)이다. 왜냐하면, 만약 \(N(V) = V\)라면 임의의 \(m\)에 대하여 \(N^m (V)=V\)이므로 \(N\)이 멱영변환이라는 가정에 모순이 되기 때문이다. 따라서 귀납적 가정에 의하여 \(N(V)\)는 적당한 순환부분공간 \(W_1,\) \(\cdots,\) \(W_r\)의 직합으로 표현된다. 각 \(j=1,\, \cdots ,\, r\)에 대하여, \(W_j\)의 순환기저의 근을 \(w_j\in W_j\)라고 하자. 그리고 \(N\)에 의한 \(w_1 ,\) \(\cdots,\) \(w_r\)의 역상을 순서대로 \(v_1,\) \(\cdots,\) \(v_r\)라고 하자. 즉 \(N(v_j) = w_j\)라고 하자.
\(W_j \cup \left\{ v_j \right\}\)가 생성하는 공간을 \(W_j ' \)이라고 하고, \(W ' = W_1 ' + \cdots + W_r ' \)이라고 정의하자. 명백히 각 \(W_j ' \)은 순환부분공간이며, \(v_j\)는 순환기저의 근이다. 또한 \(N(W ' ) = N(V)\)이다. 왜냐하면 함수 \(N\)에 의하여 \(v_j\)를 근으로 하는 \(W_j ' \)의 순환기저는 \(w_j\)를 근으로 하는 \(W_j\)의 순환기저에 대응되기 때문이다. 그러므로 보조정리 8을 이용하기 위해서는 \(W ' = W_1 ' \oplus + \cdots + \oplus W_r ' \)임을 보여야 하는데, 이것을 위해서는 다음을 보이면 된다. \[\sum_{j=1}^r w_j ' = \mathbf{0} \quad \Rightarrow \quad w_j ' = \mathbf{0} .\tag{9}\] 여기서 \(j= 1,\,2,\,\cdots,\,r\)이고 \(w_j ' \in W_j '\)이다. 보조정리 6에 의하여 \(K[t]\)의 다항식 \(q_1 (t) ,\) \(\cdots,\) \(q_r (t)\)가 존재하여 \(w_j ' = q_j (N) (v_j)\)를 만족시킨다. 그러므로 (8)의 합은 다음과 같은 꼴이 된다. \[\sum_{j=1}^r q_j (N) (v_j ) = \mathbf{0}.\] 이 등식의 양변에 \(N\)을 취하고 \(N(v_j ) = w_j\)를 이용하면 다음을 얻는다. \[\sum_{j=1}^r q_j (N) (W_j) = \mathbf{0} .\] 이로써 \(N(V)\)는 순환부분공간 \(W_1,\) \(\cdots,\) \(W_r\)의 직합이며, 임의의 \(j\)에 대하여 \(q_j (N)(w_j) = \mathbf{0}\)이다. \(w_j\)가 \(W_j\)의 순환기저의 근이므로 \(q_j(N)\)은 \(W_j\) 위에서 영변환이다. 보조정리 7에 의하여 모든 \(q_j (t)\)가 \(t\)를 인수로 가지므로, \(q_j (t) = q_j ' (t) t\) 꼴로 표현된다. 그러므로 \[\begin{align} \sum_{j=1}^r q_j (N) (v_j) &= \sum_{j=1}^r [q_j ' (N)](v_j) \\[5pt] &= \sum_{j=1}^r q_j ' (N)(w_j) = \mathbf{0} \end{align}\] 이다. 다시 보조정리 7에 의하여, 각 \(j\)에 대하여 \(m_j = \dim(W_j)\)일 때 \(q_j ' (t)\)는 단항식 \(t^{m_j}\)을 인수로 가진다. 그러므로 \(q_j (t)\)는 \(t^{m_j +1}\)을 인수로 가진다. 그러면 \(q_j (N)\)이 \(N^{m_j+1}\)의 인수를 포함해야 하는데, \(N^{m_j+1}\)은 \(V_j\) 위에서 영변환이다. 그러므로 임의의 \(j\)에 대하여 \(w_j ' = q_j (N)(v_j) = \mathbf{0}\)이다. 이로써 보조정리 8의 결론을 얻기 위한 조건이 모두 성립하므로, \(V\)는 순환부분공간의 직합으로 표현된다.
정리 9는 순환부분공간 위에서의 멱영변환의 표현을 벡터공간 전체로 확장할 수 있게 해준다.
정리 10. \(N\)이 벡터공간 \(V\) 위에서의 자기준동형사상이고 멱영변환이라고 하자. 그러면 \(B\)에 대한 \(N\)의 표현행렬이 \[\left(\begin{array}{ccccc} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ 0 & 0 & 0 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 0 \end{array}\right)\] 이 되도록 하는 \(V\)의 기저 \(B\)가 존재한다.
증명.
정리 9에 의하여 \(V\)를 \(N\)-불변인 순환부분공간의 직합으로 나타낼 수 있다. 직합을 이루는 각 순환부분공간은 기저를 갖는데, 특히 그 기저에 대한 자기준동형사상의 표현행렬이 정리에서 주어진 행렬의 일부와 같도록 하는 기저가 존재한다. 그러므로 그러한 표현행렬들을 더하여 만든 행렬은 정리에서 주어진 것과 같은 꼴이 된다.
정리 4와 정리 10을 결합하면 다음과 같은 멋진 정리를 얻는다.
정리 11. (조르당 표준형)
\(V\)가 체 \(K\) 위에서의 벡터공간이고 차원이 \(n\)이며 \(T\)가 \(V\) 위에서 정의된 자기준동형사상이고 \(T\)의 특성다항식이 \(K\)에서 일차식의 곱으로 인수분해된다고 하자. 또한 \(T\)의 특성다항식의 근이 \(\lambda_1,\) \(\cdots,\) \(\lambda_r\)이고 이들이 모두 다른 값이며 이들의 중복도가 순서대로 \(m_1,\) \(\cdots,\) \(m_r\)라고 하자. 그러면 \(V\)의 기저 \(B\)가 존재하여 \(B\)에 대한 \(T\)의 표현행렬이 \[A = \left(\begin{array}{cccc} A_1 & 0 & \cdots & 0 \\ 0 & A_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & A_r \end{array}\right)\] 의 꼴이 된다. 여기서 \(A_j\)는 \[A_j = \left(\begin{array}{ccccc} \lambda_j & 1 & 0 & \cdots & 0 \\ 0 & \lambda_j & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ 0 & 0 & 0 & \cdots & \lambda_j \end{array}\right)\] 꼴인 \(m_j \times m_j\) 정사각행렬이다.
위 정리에서 \(A\)와 같은 꼴을 조르당 표준형(Jordan normal form)이라고 부르며, \(A_j\)를 고윳값 \(\lambda_j\)에 대응하는 조르당 블록(Jordan block)이라고 부른다.
정리 11의 증명. \(V\)를 \(T\)에 대한 특성부분공간 \(U_1,\) \(\cdots,\) \(U_r\)로 분해하자. 정리 4에 의하여 각 부분공간 위에서 \(T\)의 표현행렬은 대각부분과 멱영부분의 합으로 표현된다. 정리 10에 의하여 각 특성부부공간 \(U_j\)의 기저가 존재하여 그 기저에 대한 행렬표현의 멱영부분은 대각성분과 인접한 윗쪽 성분은 \(1\)이고 다른 성분은 \(0\)인 행렬이 된다. 또한 \(U_j\)의 대각부분은 \(\lambda_j I_{m_j}\) 꼴이다. 그러므로 멱영부분과 대각부분을 더하면 \(A_j\)는 정리에서 제시한 행렬과 같은 꼴이 된다.