정사각행렬의 특성다항식을 이용한 흥미로운 등식을 살펴보자. \(A\)가 이차장사각행렬이고 \[A = \left(\begin{array}{cc} a & b \\ c & d \end{array}\right)\] 일 때 다음이 성립한다. \[A^2 - (a+d)A + (ad-bc)I_2 = O.\] \(A\)의 특성다항식을 \(p(t)\)라고 하고 \(t=A\)를 대입함으로써 위 식은 다음과 같이 간단하게 나타낼 수 있다. \[p(A) = O.\] 이 등식이 성립하는 것은 우연이 아니며, Cayley-Hamilton 정리의 결과이다.
이 포스트에서는 특성다항식의 성질과 \(T\)-불변 공간의 개념을 살펴보고, 이어서 Cayley-Hamilton 정리와 그 증명을 살펴본다. 또한 Cayley-Hamilton 정리와 같은 방법으로 증명할 수 있는 자기준동형사상의 삼각행렬 축약 정리도 살펴본다.
Cayley-Hamilton 정리
\(V\)가 체 \(K\) 위에서의 벡터공간이라고 하자. 그러면 \(V\) 위에서의 자기준동형사상들의 모임 \(\Hom (V,\,V)\)는 \(k\)-대수가 된다. 즉 \(\Hom (V,\,V)\)에는 스칼라곱, 함수합, 함수합성이라는 세 개의 연산이 주어져 있으며, 다음이 성립한다.
- 스칼라곱과 함수합에 대하여 \(\Hom (V,\,V)\)는 \(K\) 위에서의 벡터공간이다.
- 함수합과 함수합성에 대하여 \(\Hom (V,\,V)\)는 단위원을 갖는 환이다.
- 스칼라 곱과 함수 합성은 서로 교환 가능하다. 즉 \(\lambda\in K\)와 \(T_1,\,T_2 \in \Hom(V,\,V)\)에 대하여 \[(\lambda T_1 )T_2 = T_1 (\lambda T_2 ) = \lambda (T_1 T_2)\] 가 성립한다. 여기서 \(T_1 T_2\)는 합성 \(T_1 \circ T_2\)를 의미한다.
상수와 계수가 \(K\)에 속하고 \(t\)를 변수로 갖는 모든 다항식들의 모임을 \(K[t]\)라고 하자. 그러면 \(K[t]\)는 \(K\)-대수이다.
\(p(t)\in K[t]\)이고 \[p(t) = \sum_{j=1}^r \alpha_j t^j \quad (\alpha_0 ,\, \alpha_1 ,\, \cdots ,\, \alpha_r \in K )\] 라고 하자. 그러면 변환 \(T\in\Hom(V,\,V)\)에 대하여 \(p(T)\)는 다음과 같이 정의된 행렬이다. \[p(T) = \sum_{j=0}^r \alpha_j T^j = \alpha_r T^r + \alpha_{r-1}T^{r-1} + \cdots + \alpha_1 T + \alpha_0 1_V .\] 여기서 \(T^j\)는 \(j\)개의 \(T\)를 합성한 것이며, \(T^0\)은 항등변환을 나타낸다. \(T\)를 고정시켰을 때 대응 \[K[t] \,\mapsto\, \Hom(V,\,V) ,\quad p\,\mapsto\,p(T)\] 는 명백히 선형변환이다. 이러한 대응은 선형이라는 특징 외에도 더 많은 성질을 가진다. \(T\)의 거듭제곱의 곱에서 지수법칙이 성립하기 때문에, \(K[t]\)의 원소 \(p,\) \(q\)에 대하여 다음이 성립한다. \[p(T) q(T) = pq(T)\] 여기서 우변은 두 다항식 \(p\)와 \(q\)를 곱한 뒤 변수에 \(T\)를 대입하여 계산한 것이다. 그러므로 \(T\)에서 다항식을 계산하는 연산은 \(K\)-대수의 준동형사상이다.
유한차원 벡터공간 사이의 선형변환은 행렬로 나타낼 수 있으므로, 지금까지 논의한 내용은 행렬공간 \(M_n (K)\)의 원소 \(A\)에도 그대로 적용할 수 있다. 즉 \(p(t)\in K[t]\)이고 \(A\in M_n(K)\)일 때 \[p(A) = \sum_{j=0}^r \alpha_j A^j = \alpha_r A^r + \alpha_{r-1} A^{r-1} + \cdots + \alpha_1 A + \alpha_0 I_n\] 이다.
정리 1. (Cayley-Hamilton 정리)
\(V\)가 \(K\) 위에서의 \(n\)차원 공간이고 \(n\ge 1\)이라고 하자. 만약 \(T\in \Hom(V,\,V)\)의 특성다항식이 \(p(t)\)이면 \(p(T)=0\)이다. 마찬가지로, \(A\in M_n(K)\)의 특성다항식이 \(p(t)\)이면 \(p(A) = O\)이다.
정리 1을 증명하기 위해서는 몇 개의 보조정리가 필요하다. 그 보조정리를 도입하기 전에 예를 살펴보자.
보기 1. \(\mathbb{R}^2\)에서 원점을 중심으로 시계바늘 반대방향으로 \(\pi/2\)만큼 회전시키는 변환의 행렬은 다음과 같다. \[A = \left(\begin{array}{cr} 0 & -1 \\ 1 & 0 \end{array}\right).\] 이 행렬의 특성다항식은 \(p(t) = t^2 + 1\)이다. Cayley-Hamilton 정리에 의하여 \(A^2 + I_2\)는 영행렬이다. 실제로 계산해 보면 \[A^2 = \left(\begin{array}{rr} -1 & 0 \\ 0 & -1 \end{array}\right)\] 이므로 \(A^2 + I_2 = O\)가 성립한다는 사실이 확인된다.
몇 가지 보조정리
\(T : V \rightarrow V\)가 선형변환이라고 하고 \(W\)가 \(V\)의 부분공간이라고 하자. 만약 임의의 \(w\in W\)에 대하여 \(T(w) \in W\)이면, \(W\)는 \(T\)에 대해 불변이다, 또는 \(W\)는 ‘\(T\)-불변(T-invariant)이다’라고 말한다.
즉 \(W\)가 \(T\)-불변이라는 것은 \(T\)의 정의역을 \(W\)로 축소하였을 때 \(T\vert_W\)가 \(W\) 위에서의 자기준동형사상이 되는 것을 뜻한다. \(V\) 자신과 자명한 공간 \(\left\{ \mathbf{0} \right\}\)는 \(V\)의 부분공간이므로, 이 두 공간은 임의의 선형변환 \(T:V \rightarrow V\)에 대하여 \(T\)-불변이다. \(T\)의 고윳값 \(\lambda\)에 대응되는 고유공간 \(W\) 역시 \(T\)-불변이다. 왜냐하면 임의의 \(w\in W\)에 대하여 \(T(w) = \lambda w \in W\)이기 때문이다.
보조정리 2. \(V\)가 체 \(K\) 위에서의 벡터공간이고 \(T : V \rightarrow V\)가 선형변환이며 \(n > 1\)이라고 하자. 그리고 \(V\)의 부분공간 중에서 자명한 공간과 \(V\) 자신을 제외한 어느것도 \(T\)-불변이 되지 못한다고 가정하자. 그러면 \(V\)의 기저 \(B\)가 존재하여, 적당한 스칼라 \(\alpha_0 ,\) \(\cdots,\) \(\alpha_{n-1}\)에 대하여 \(B\)에 대한 \(T\)의 표현행렬이 다음과 같이 나타난다. \[A = \left(\begin{array}{ccccccc} 0 & 0 & 0 & \cdots & 0 & 0 & \alpha_0 \\ 1 & 0 & 0 & \cdots & 0 & 0 & \alpha_1 \\ 0 & 1 & 0 & \cdots & 0 & 0 & \alpha_2 \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ 0 & 0 & 0 & \cdots & 1 & 0 & \alpha_{n-2} \\ 0 & 0 & 0 & \cdots & 0 & 1 & \alpha_{n-1} \end{array}\right).\] 더욱이 \(T\)의 특성다항식은 다음과 같다. \[p(t) = t^n - \alpha_{n-1} t^{n-1} - \alpha_{n-2} t^{n-2} - \cdots - \alpha_1 t - \alpha_0 .\]
증명.
\(v_0 \in V\)가 영벡터가 아닌 벡터라고 하자. 그리고 \(j=0 ,\, 1 ,\, \cdots ,\, n-2\)에 대하여 \[v_{j+1} = T(v_j)\] 라고 정의하자. 이제 \(v_0,\) \(v_1 ,\) \(\cdots ,\) \(v_{n-1}\)이 일차독립이며, \(V\)의 기저 \(B\)를 형성함을 보일 것이다. 결론에 반하여 \(v_0,\) \(v_1 ,\) \(\cdots ,\) \(v_{n-1}\)가 일차독립이 아니라고 가정하자. 그러면 \(v_0 ,\) \(\cdots ,\) \(v_j\)가 일차종속인 가장 작은 \(j\)를 택할 수 있다. \(0 < j \le n-1\)이고 \(v_j\)가 일차종속 관계식에서 반드시 사용되어야 하므로 \(v_j\)는 \(W = \operatorname{Span}(v_0 ,\, \cdots ,\, v_{j-1})\)에 속한다. 그러면 \(T(v_0 ),\) \(\cdots,\) \(T(v_{j-1})\)이 모두 \(W\)에 속하며, \(W\)는 \(T\)-불변인 \(V\)의 부분공간이 된다. 더욱이 \(v_0 \in W\)이므로 \(W\)는 자명한 공간이 아니며 \(W\)는 \(n\)개 미만의 벡터에 의하여 생성되므로 \(V\)의 진부분공간이다. 이것은 그러한 부분공간이 존재하지 않는다는 정리의 가정에 모순이다.
이제 \(v_0,\) \(v_1 ,\) \(\cdots ,\) \(v_{n-1}\)로 이루어진 집합 \(B\)는 \(V\)의 기저이다. 이제 적당한 스칼라들 \(\alpha_j \in K\)에 대하여 \[T(v_j) = v_{j+1} \,(0\le j \le n-1) \,\text{ and }\, T(v_{n-1}) = \sum_{j=0}^{n-1} \alpha_j v_j\] 이므로, \(B\)에 대한 \(T\)의 표현행렬 \(A\)는 정리에서 주어진 것과 일치한다.
이제 \(T\)의 특성다항식의 형태를 밝히기 위하여 다음을 계산해야 한다. \[p(t) = \det\left(\begin{array}{rrccrrc} t & 0 & 0 & \cdots & 0 & 0 & -\alpha_0 \\ -1 & t & 0 & \cdots & 0 & 0 & -\alpha_1 \\ 0 & -1 & t & \cdots & 0 & 0 & -\alpha_2 \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ 0 & 0 & 0 & \cdots & -1 & t & -\alpha_{n-2} \\ 0 & 0 & 0 & \cdots & 0 & -1 & t-\alpha_{n-1} \end{array}\right).\] 수학적 귀납법을 사용하자. \(n=2\)일 때는 \[\det\left(\begin{array}{rc} t & -\alpha_0 \\ -1 & t-\alpha_1 \end{array}\right) = t^2 - \alpha t - \alpha_0 \] 이므로 정리의 등식이 성립한다.
\(n > 2\)일 때는 첫째 열을 기준으로 행렬식을 전개하자. 첫째 열에서 \(0\)이 아닌 성분은 두 개 뿐이므로, 전개한 결과 두 개의 항이 나타난다. 그 중 첫째 항은 \[t\cdot \det\left(\begin{array}{rrccrrc} t & 0 & 0 & \cdots & 0 & 0 & -\alpha_1 \\ -1 & t & 0 & \cdots & 0 & 0 & -\alpha_2 \\ 0 & -1 & t & \cdots & 0 & 0 & -\alpha_3 \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots & \vdots \\ 0 & 0 & 0 & \cdots & -1 & t & -\alpha_{n-2} \\ 0 & 0 & 0 & \cdots & 0 & -1 & t-\alpha_{n-1} \end{array}\right)\] 이며, 이 식을 전개한 결과는 귀납적 가정에 의하여 다음과 같다. \[t(t^{n-1} - \alpha_{n-1} t^{n-2} - \cdots - \alpha_1 ) = t^n - \alpha_{n-1} t^{n-1} - \cdots - \alpha_1 t.\tag{*}\] 이제 둘째 항을 계산해야 한다. 둘째 항은 다음과 같은 식으로 나타난다. \[ - \alpha_0 (-1)^{n+1} \det \left(\begin{array}{rcrccr} -1 & t & 0 & \cdots & 0 & 0 \\ 0 & -1 & t & \cdots & 0 & 0 \\ 0 & 0 & -1 & \cdots & 0 & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & 0 & \cdots & -1 & t \\ 0 & 0 & 0 & \cdots & 0 & -1 \end{array}\right) = -\alpha_0.\tag{**}\] 이로써 (*)과 (**)를 더하면 정리의 식을 얻는다.
보조정리 2의 두 번째 등식은 \(1\)차원에서도 성립한다. 즉 \(T\)가 스칼라 \(\alpha_0\)를 곱하는 선형변환일 때, 이 변환의 특성다항식은 \(T - \alpha_0\)이다.
보조정리 3. \(V\)가 체 \(K\) 위에서의 \(n\)차원 벡터공간이고 \(n\ge 2\)이며 \(T:V \rightarrow V\)가 선형변환이라고 하자. 또한 \(V\)의 부분공간 중 \(T\)-불변인 것은 \(V\) 자신과 자명한 부분공간 외에는 존재하지 않는다고 가정하자. \(p(t)\)가 \(T\)의 특성다항식이면 \(p(T) =O\)이다.
증명.
\(v_j\)와 \(\alpha_j\)가 보조정리 2의 증명에서와 같은 것이라고 하자. (단, \(j =0,\) \(1,\) \(\cdots,\) \(n-1.\)) 그러면 \(0\le j\le n-1\)일 때 \[v_j = T^j (v_0 ) \,\text{ and }\, T(v_{n-1}) = \sum_{j=0}^{n-1}\alpha_j v_j\] 이다. 보조정리 2를 이용하여 기저 \(v_0\)에서 \(p(T)\)를 계산하면 다음과 같다. \[\begin{align} p(T)(v_0) &= T^n (v_0 ) - \alpha_{n-1} T^{n-1} (v_0) - \cdots - \alpha_1 T(v_0) - \alpha_0 v_0 \\[5pt] &= T(v_{n-1}) - \alpha_{n-1} v_{n-1} - \cdots - \alpha_1 v_1 - \alpha_0 v_0 \\[5pt] &= \mathbf{0}. \end{align}\] 다음으로 다른 기저원소 \(v_j,\) \(j > 0\)에서 \(p(T)\)를 계산하면 다음과 같다. \[\begin{align} p(T)(v_j) &= p(T)(T^j (v_0 )) \\[5pt] &= [ p(T) T^j ] (v_0 ) \\[5pt] &= [ T^j p(T) ] (v_0) \\[5pt] &= T^j ( p(T)(v_0)) \\[5pt] &= T^j (0) = \mathbf{0}. \end{align}\] 계산 과정에서 변환 \(p(T)\)와 \(T^j\)가 서로 교환될 수 있는 이유는 \(\Hom(V,\,V)\)가 \(K\)-대수이기 때문이다. 이로써 \(p(T)\)가 \(v_0\)를 \(\mathbf{0}\)에 대응시키므로 \(p(T)\)는 모든 기저원소 \(v_0,\) \(v_1,\) \(\cdots,\) \(v_{n-1}\)를 \(\mathbf{0}\)에 대응시킨다. 그러므로 \(p(T)\)는 항상 함숫값이 \(\mathbf{0}\)인 변환이다.
Cayley-Hamilton 정리의 증명
지금까지 살펴본 보조정리를 바탕으로 Cayley-Hamilton 정리(정리 1)를 증명하자.
\(n\)에 대한 수학적 귀납법을 사용하여 증명하자.
\(n=1\)인 경우는 지금까지 살펴본 보조정리에 의하여 성립한다. 왜냐하면 차원이 \(1\)인 벡터공간 \(V\)의 부분공간은 \(V\) 자신이거나 자명한 부분공간 뿐이기 때문이다.
이제 \(n > 1\)이라고 가정하자. 만약 \(V\)의 부분공간 중 \(T\)-불변인 것이 \(V\) 자신과 자명한 부분공간 뿐이라면 보조정리에 의하여 원하는 결론을 얻는다. 그러므로 \(V\)의 부분공간 \(W_1\)가 존재하여 \(T\)-불변이면서 \(V\) 자신이 아니고 자명한 부분공간도 아니라고 가정하자.
\(W_1\)의 기저를 \(B_1\)이라고 하자. 그러면 \(B_1\)을 확장하여 \(V\)의 기저 \(B\)를 만들 수 있다. \(B\)의 기저원소 중 \(B_1\)에 속하지 않는 것들의 모임을 \(B_2\)라고 하자. 그리고 \(B_2\)에 의하여 생성되는 공간을 \(W_2\)라고 하자. 그러면 \(V = W_1 \oplus W_2\)이다.
기저 \(B\)에 대한 \(T\)의 표현행렬을 \(A\)라고 하자. \(T\)가 \(W_1\)의 원소를 \(W_1\)의 원소에 대응시키므로 \(A\)는 다음과 같은 꼴의 행렬로 나타낼 수 있다. \[A= \left( \begin{array}{c|c} P&Q \\ \hline O&R \end{array} \right).\] 여기서 \(P\)와 \(R\)는 그 크기가 각각 \(\dim(W_1),\) \(\dim(W_2)\)인 정사각행렬이다. \(W_2\)는 \(T\)-불변이 아닐 수도 있으므로 부분행렬 \(Q\)의 성분 중에는 \(0\)이 아닌 것이 존재할 수 있다.
\(T_R\)가 기저 \(B_2\)에 대한 표현행렬 \(B\)를 왼쪽에 곱하는 선형변환이라고 하자. 그러면 \(T_R\)는 \(W_2\) 위에서의 자기준동형사상이다. 이제 \(T\)와 \(T_R\) 사이의 관계를 밝혀야 한다. 특성다항식 \(p(t)\)는 다음과 같은 꼴로 인수분해된다. \[p(t) = p_1 (t) p_2 (t) \] 여기서 \(p_1(t)\)는 \(T\)의 정의역을 \(W_1\)으로 축소한 \(T \vert _{W_1}\)의 특성다항식이며, \(p_2 (t)\)는 \(T_R\)의 특성다항식이다. \(A\)의 구조적 특성에 의하여 임의의 \(w\in W_2\)에 대하여 \(T_R(w)\)는 \(W_1\)의 원소 만큼 차이난다. 즉 임의의 \(w\in W_2\)에 대하여 \[T(w) - T_R (w) \in W_1\] 이다. [여기서 주목할 점은 \(T_R\)가 \(B_2\)의 원소에 작용하면 \(B_2\)의 원소의 일차결합은 행렬 \(R\)에 의해 정해진다는 점이다. 그러면 그 일차결합에 \(Q\)에 의해 정해지는 \(B_1\)의 원소의 일차결합을 더한다.]
양변에 \(T\)를 한 번 더 취하고 \(T\)가 \(W_1\)-불변이라는 사실을 이용하면 임의의 \(w\in W_2\)에 대하여 다음이 성립한다. \[T^2 (w) - TT_R (w) \in W_1.\] 좌변의 두 번째 항에서 \(T\)를 \(T_R\)로 바꾸어도 동일하므로 임의의 \(w\in W_2\)에 대하여 다음이 성립한다. \[T^2 (w) - T_R ^2 (w) \in W_1 .\] 이 과정을 계속 반복하면 음이 아닌 임의의 정수 \(j\)와 임의의 \(w\in W_2\)에 대하여 \[T^j (w) - T_R^j (w) \in W_1\] 이 성립한다는 사실을 알 수 있다. 그러므로 임의의 다항식 \(q(t) \in K[t]\)와 \(w\in W_2\)에 대하여 다음이 성립한다. \[q(T) (w) - q(T_R ) (w) \in W_1 .\] 이제 자기준동형사상 \(p(T) = p_1 (T) p_2 (T) = p_2 (T) p_1 (T)\)를 생각하자. 이 준동형사상이 \(W_1\)의 원소에 작용하는 결과를 살펴보기 위해 수학적 귀납법을 사용하자. \(p_1 (T)\)는 \(W_1\)에서 모든 값을 \(\mathbf{0}\)에 대응시키는 함수이며, 더욱이 임의의 \(w\in W_1\)에 대하여 다음이 성립한다. \[p(T) (w) = [p_2 (T) p_1 (T)] (w) = p_2 (T)(\mathbf{0}) = \mathbf{0}.\] 다음으로 \(p(T)\)가 \(W_2\)의 원소에 작용하는 결과를 살펴보자. 앞서 살펴본 결과에 의하여 임의의 \(w\in W_2\)에 대하여 \[p_2 (T) (w) - p_2 (T_R ) (w) \in W_1\] 이 성립한다. 그런데 귀납적 가정에 의하여 \(p_2 (T_R)\)는 \(W_2\)의 모든 값을 \(\mathbf{0}\)에 대응시키는 함수이므로, \(w\in W_2\)에 대하여 \(p_2 (T)(w) \in W_1\)이 성립한다. 그러므로 임의의 \(w\in W_2\)에 대하여 \(w_1 \in W\)가 존재하여 \(p_2 (T) (w) = w_1\)을 만족시키며, \[p(T) (w) = [p_1 (T) p_2 (T) ] (w) = p_1 (T)(w_1) = \mathbf{0}\] 이 성립한다. 따라서 \(p(T)\)는 \(W_1\)의 모든 원소와 \(W_2\)의 모든 원소를 \(\mathbf{0}\)에 대응시킨다. 그러므로 \(p(T)\)는 \(V\)의 모든 원소를 \(\mathbf{0}\)에 대응시킨다.
이로써 정리 1이 증명되었다.
자기준동형사상의 삼각행렬 표현
\(T\)가 벡터공간 \(V\) 위에서 정의된 자기준동형사상이라고 하자. 만약 \(V\)의 적당한 기저 \(B\)가 존재하여 \(B\)에 대한 \(T\)의 표현행렬이 위삼각행렬이 되면 ‘\(T\)는 삼각행렬로 축약될 수 있다’라고 말한다. \(T\)를 삼각행렬로 표현하면 \(T\)의 고윳값을 쉽게 찾을 수 있으므로 유용하다. 더욱이 만약 \(T\)가 가역이고 \(T\)의 표현행렬이 삼각행렬이면 \(T\)의 역사상을 쉽게 찾을 수 있다. 편의상 지금부터 삼각행렬은 위삼각행렬을 이르는 것으로 약속한다.
정리 4. \(V\)가 체 \(K\) 위에서의 \(n\)차원 벡터공간이고 \(T\)가 \(V\) 위에서 정의된 자기준동형사상이라고 하자. 만약 \(T\)의 특성다항식이 \(K\)에서 일차식의 곱으로 인수분해되면 \(T\)는 삼각행렬로 축약될 수 있다.
증명.
\(n\)에 대한 수학적 귀납법을 사용하자. 증명 과정은 Cayley-Hamilton 정리의 증명과 유사하다.
\(n=1\)인 경우는 자명하게 성립한다. 그러므로 \(n > 1\)이라고 가정하자.
\(T\)의 특성다항식을 \(p(t)\)라고 하고 \(p(t)=0\)의 한 근을 \(\lambda_1\)이라고 하자. 정리의 가저엥 의하여 \(\lambda_1 \in K\)이며, \(\lambda_1\)은 \(T\)의 고윳값이다. \(\lambda_1\)에 대응되는 고유벡터를 \(v_1\)이라고 하자. 그러면 \(v_1\)은 \(V\)의 \(1\)차원 부분공간 \(W_1\)을 생성하며, \(W_1\)은 \(T\)-불변인 공간이 된다. \(v_1\)을 확장하여 \(V\)의 기저 \(v_1,\) \(v_2,\) \(\cdots,\) \(v_n\)을 만들자. 그리고 \(v_2 ,\) \(\cdots,\) \(v_n\)에 의하여 생성되는 공간을 \(W_2\)라고 하자. 그러면 \(V = W_1 \oplus W_2\)이다. [물론 \(W_2\)는 \(T\)-불변이 아닐 수 있다.]
\(B\)에 대한 \(T\)의 표현행렬은 다음과 같은 꼴이다. \[A= \left( \begin{array}{c|c} \lambda_1 & \ast \\ \hline 0 & R \end{array} \right).\] 여기서 \(R\)는 \((n-1)\times (n-1)\) 행렬이며 별표는 모든 성분이 스칼라인 열벡터이다. 기저 \(v_2 ,\) \(\cdots ,\) \(v_n\)에 대하여 \(R\)로 표현되는 선형변환을 \(T_R\)라고 하자. 즉 \(T_R\)는 \(W_2\) 위에서의 자기준동형사상이다. 그러면 \(T\)와 \(T_R\)는 모두 \(W_2\)에서 동일한 작용을 하는 변환이며, \(W_1\)의 원소에 대해서만 차이가 난다.
다음으로 \(T_R\)의 특성다항식 \(q(t)\)를 생각하자. 행렬 \(tI_n - A\)의 첫째 행을 기준으로 행렬식을 전개하면 \[p(t) = (t-\lambda_1 )q(t)\] 를 얻는다. 여기서 \(q(t)=0\)의 모든 근은 \(p(t)=0\)의 근이다. 즉 \(q(t)=0\)의 모든 근은 \(K\)에 속한다. 따라서 귀납적 가정에 의하여 \(W_2\)의 기저 \(v_2 ',\) \(\cdots ,\) \(v_n '\)이 존재하여 이 기저에 대한 \(T_R\)의 표현행렬이 삼각행렬이 된다. 이 새로운 표현행렬을 \(R ' \)이라고 하자.
\(v_1,\) \(v_2 ' ,\) \(\cdots ,\) \(v_n '\)로 이루어진 기저 \(B ' \)은 \(V\)의 기저이다. 그런데 \(T\)와 \(T_R\)는 \(W_1\)의 원소에 대해서만 함숫값이 다르므로 \(B ' \)에 대한 \(T\)의 표현행렬은 다음과 같은 꼴이 된다. \[A ' = \left( \begin{array}{c|c} \lambda_1 & \ast \\ \hline 0 & R ' \end{array} \right).\] 여기서 \(R ' \)이 삼각행렬이므로 \(A ' \) 또한 삼각행렬이다.
정리 4와 기저의 변환을 이용하면 다음과 같은 따름정리를 얻는다.
따름정리 5. \(A\in M_n (K)\)이고 \(A\)가 \(K\)에서 일차식의 곱으로 인수분해된다고 하자. 그러면 행렬 \(P\in \operatorname{GL}_n (K)\)가 존재하여 \(B = P^{-1} AP\)가 삼각행렬이 된다.
복소수 집합은 대수적으로 닫혀 있으므로 정리 4로부터 다음 결과를 얻는다.
따름정리 6. 복소벡터공간 위에서 정의된 모든 자기준동형사상은 삼각행렬로 축약될 수 있다.
내적공간에 정리 4를 적용하면 다음과 같은 결과를 얻는다.
정리 7. \(V\)가 실내적공간 또는 복소내적공간이고 \(T\)가 \(V\) 위에서 정의된 자기준동형사상이라고 하자. 그리고 \(T\)의 특성다항식이 \(V\)가 정의된 체에서 일차식의 곱으로 인수분해된다고 하자. 그러면 \(V\)에서의 정규직교기저 \(B\)가 존재하여 \(B\)에 대한 \(T\)의 표현행렬이 삼각행렬이 된다.
증명.
증명 과정은 정리 4의 증명과 거의 같다. 단, 중간에 \(W_2 = W_1 ^\bot\)을 택하는 부분만 다르다.
지금까지 논의한 내용을 실행렬과 복소행렬에 적용하면 다음과 같은 결과를 얻는다.
따름정리 8. \(A\)가 정사각행렬이고 그 성분이 모두 실수이거나, 모두 복소수라고 하자. 만약 \(A\)가 실행렬이면 \(A\)의 특성다항식이 \(\mathbb{R}\)에서 일차식의 곱으로 인수분해된다고 가정하자. 그러면 유니타리 행렬 \(P\)가 존재하여 \(B = P^{-1} AP\)가 삼각행렬이 된다.
증명.
\(\mathbb{R}^n\)과 \(\mathbb{C}^n\)에서, 정규직교벡터를 보통기저에 대응시키는 기저변환행렬 \(P\)는 유니타리 행렬이다.