이 포스트에서는 고윳값과 고유벡터의 개념을 살펴보고 특성다항식을 이용하여 고윳값을 구하는 방법을 살펴봅니다. 또한 에르미트 변환과 유니타리 변환의 개념을 바탕으로 스펙트럼 분해 정리를 살펴봅니다.
고윳값과 고유벡터의 뜻
\(V\)가 체 \(K\) 위에서 정의된 벡터공간이고 \(T : V \rightarrow V\)가 선형변환이라고 하자. 그리고 스칼라 \(\lambda \in K\)와 영벡터가 아닌 벡터 \(v\in V\)가 존재하여 \[T(v) = \lambda v\tag{1}\] 을 만족시킨다고 하자. 이때 \(\lambda\)를 \(T\)의 고윳값(eigenvalue)이라고 부른다. 또한 이와 같은 \(\lambda\)에 대하여 등식 (1)을 만족시키는, 영벡터가 아닌 벡터 \(v\)를 \(\lambda\)에 따르는 고유벡터(eigenvector)라고 부른다.
‘eigen’은 독일어이며 ‘아이겐’이라고 읽는다. 고윳값과 고유벡터를 각각 특성값(characteristic value), 특성벡터(characteristic vector)라고 부르기도 한다.
기하학적으로 보면 \(T\)의 고유벡터는 \(T(v) \parallelsym v\)를 만족시키는 벡터 \(v\)이다.
보기 1. \(V = \mathbb{R}^2\)라고 하고 \[A = \left( \begin{matrix} 0 & 1 \\ 1 & 0 \end{matrix} \right)\] 라고 하자. 그리고 선형변환 \(T_A : V \rightarrow V\)를 행렬 \(A\)를 왼쪽에 곱하는 것으로 정의하자. 그러면 \[\begin{align} T \left(\matrix{ +1 \\ +1}\right) &= +1 \cdot \left(\matrix{+1\\+1}\right), \\[5pt] T \left(\matrix{ +1 \\ -1}\right) &= -1 \cdot \left(\matrix{+1\\-1}\right) \end{align}\] 이므로 \(+1\)과 \(-1\)은 모두 \(T_A\)의 고윳값이며, 각 고윳값에 따르는 고유벡터는 위 식과 같다.
위 보기와 같이 행렬 \(A\)를 왼쪽에 곱하는 선형변환 \(T_A\)가 주어졌을 때, ‘\(T_A\)의 고윳값과 고유벡터’를 간단하게 ‘\(A\)의 고윳값과 고유벡터’라고 표현한다.
보기 2. 실벡터공간 \(V=C^\infty (\mathbb{R})\) 위에서 정의된 미분연산자 \(D\)를 생각하자. \(D\)는 \(V\) 위에서의 선형변환이다. 임의의 \(\lambda\in\mathbb{R}\)는 미분연산자의 고윳값이며, 그에 따르는 고유벡터는 \(x\mapsto Ce^{\lambda x}\) (\(C\)는 임의의 상수)이다.
일반적으로 고정된 고윳값 \(\lambda\)에 따르는 고유벡터들의 모임에 영벡터를 추가한 집합은 \(V\)의 부분공간이 된다. 이 공간을 \(\lambda\)에 따르는 고유공간(eigenspace)이라고 부른다. 만약 \(T\)의 핵(kernel)의 차원이 \(1\) 이상이면 \(\lambda = 0\)은 \(T\)의 고윳값이 되는데, 이때 \(0\)에 따르는 고유공간은 \(T\)의 핵과 같다. 이러한 의미에서 핵은 고유공간의 특수한 경우로서 다루어질 수 있다.
만약 \(T\)의 고유벡터들을 이용하여 \(V\)의 기저를 구성할 수 있으면, 그렇게 구성된 기저를 \(T\)에 대한 \(V\)의 고유기저(eigenbasis)라고 부른다. (고유기저가 항상 존재하지는 않는다.) 선형변환의 표현행렬과 고유기저, 고윳값은 다음과 같은 관계가 있다.
정리 1. \(V\)가 유한차원 벡터공간이고 \(T:V\rightarrow V\)가 선형변환이라고 하자. 이때 \(T\)를 대각행렬로 표현할 수 있을 필요충분조건은 \(T\)에 대한 \(V\)의 고유기저가 존재하는 것이다. 이때 \(T\)를 표현하는 대각행렬의 성분들이 \(T\)의 고윳값이다. [이러한 관점에서, 주어진 선형변환에 대한 고유기저가 존재할 때 그 선형변환을 대각화 가능(diagonalizable)한 선형변환이라고 부른다.]
증명.
\(v_1 ,\) \(v_2 ,\) \(\cdots ,\) \(v_n\)이 고유기저 \(B\)의 원소라고 하자. 그리고 이 벡터들에 따라는 고윳값들을 \(\lambda_1 ,\) \(\lambda_2 ,\) \(\cdots ,\) \(\lambda_n\)이라고 하자. 그러면 \[T(v_j) = \lambda_j v_j\tag{2}\] 이며, \(B\)에 대한 \(T\)의 표현행렬은 대각성분이 \(\lambda_1,\) \(\lambda_2 ,\) \(\cdots ,\) \(\lambda_n\)인 대각행렬이다. 역으로, 만약 주어진 기저에 대한 \(T\)의 표현행렬이 대각행렬이면, 주어진 각 기저원소 \(v_i\)에 대하여 적당한 스칼라 \(\lambda_i\)가 존재하여 (2)를 만족시키므로, 주어진 기저는 고유기저이다.
만약 \(B\)와 \(B ' \)이 유한차원 벡터공간 \(V\)의 기저이면, \(V\)의 임의의 자기준동형사상 \(T\)에 대하여 \[M_{B '} (T) = P^{-1} M_B (T) P\tag{3}\] 가 성립한다. 여기서 \(P\)는 \(B ' \)으로부터 \(B\)로의 기저변환행렬(transition matrix)이다. 이 식과 같이 두 행렬 \(M ,\) \(M ' \)에 대하여 \(P\)가 존재하여 \(M = P^{-1} M ' P\)로 나타낼 수 있을 때, 이들 두 행렬을 서로 닮음행렬(similar)이라고 부른다. 즉 행렬 \(M\)을 선형변환으로 보았을 때, 벡터공간의 기저를 바꿈으로써 동일한 선형변환에 대한 다른 행렬 \(M ' \)을 얻을 수 있을 때, 두 행렬 \(M,\) \(M ' \)은 닮음행렬이다.
이러한 관점에서 정리 1은 다음과 같이 나타낼 수 있다.
따름정리 2. \(A\in M_n (K)\)가 대각행렬과 닮음일 필요충분조건은 \(A\)에 대한 \(K^n\)의 고유기저가 존재하는 것이다.
보기 3. 앞의 보기 1에서 구한 두 고유벡터 \((1,\,1),\) \((1,\,-1)\)은 \(\mathbb{R}^2\)의 기저를 이루므로, 이들은 \(\mathbb{R}^2\)의 고유기저이다. 두 벡터는 서로 수직인데, 이것은 우연이 아니다. 이에 대한 자세한 내용은 뒤에서 살펴볼 것이다.
보기 4. 다음과 같이 정의된 선형변환 \(T_\theta : \mathbb{R}^2 \rightarrow \mathbb{R}^2\)를 살펴보자. \[T_\theta = \left( \begin{array}{cr} \cos\theta & -\sin \theta \\ \sin \theta & \cos \theta \end{array} \right).\tag{4}\] 이 변환은 평면의 점을 원점을 중심으로 \(\theta\)만큼 회전시키는 회전시키는 변환이다. \(\theta\)가 \(\pi\)의 정수배가 아닌 경우를 생각해 보자. 이 경우 영벡터가 아닌 벡터를 회전시켰을 때 자기 자신과 평행하지 않으므로 \(T_\theta\)는 고윳값을 갖지 않는다. 그러므로 이 경우에는 고유기저가 존재하지 않으며, \(T_\theta\)는 대각화 가능하지 않다.
특성다항식
고윳값과 고유벡터를 구하는 방법을 살펴보자.
정의. \(A\in M_n (K)\)라고 하자. 이때 \(n\)차 다항식 \[p(t) = \det (tI_n - A)\] 를 \(A\)의 특성다항식(characteristic polynomial)이라고 부른다.
\(A\in M_n (K)\)이고 \(p(t)\)가 \(A\)의 특성다항식이라고 하자. 이때 \(A\)의 고윳값을 구하기 위해서는 방정식 \[p(t)=0\tag{5}\] 의 근을 구하면 된다. 왜냐하면 \(\lambda \in K\)일 때, \(\lambda\)가 \(p(t)=0\)의 근인 것과 \(\lambda\)가 \(A\)의 고윳값인 것 사이에 다음과 같은 관계가 있기 때문이다. \[\begin{align} p(\lambda) = 0 & \,\, \Leftrightarrow \,\, \det(\lambda I_n - A) = 0 \\[5pt] & \,\, \Leftrightarrow \,\, (\lambda I_n - A) \text{ is singular (non-invertible)} \\[5pt] & \,\, \Leftrightarrow \,\, \exists \mathbf{x} \in K^n : \, (\mathbf{x} \ne \mathbf{0} \text{ and } (\lambda I_n -A) = \mathbf{0}) \\[5pt] & \,\, \Leftrightarrow \,\, \exists \mathbf{x} \in K^n : \, (\mathbf{x} \ne \mathbf{0} \text{ and } A\mathbf{x} = \lambda\mathbf{x}) .\tag{6} \end{align}\] 더욱이 이 등식으로부터 고윳값 \(\lambda\)에 따르는 고유공간을 구하는 방법을 얻는다. 즉, 고윳값 \(\lambda\)에 따르는 고유공간은 동차방정식 \[(\lambda I_n - A)\mathbf{x} = \mathbf{0}\tag{7}\] 의 해공간을 구하는 것과 같다.
이러한 결과는 체가 무엇인지에 따라 달라진다. 왜냐하면, 예컨대 방정식 \(t^2 + 1 = 0\)은 실수체 \(\mathbb{R}\)에서는 해를 갖지 않지만 복소수체 \(\mathbb{C}\)에서는 해를 갖는다. 그러므로 행렬의 특성다항식이 \(t^2 + 1\)이면 체가 무엇인지에 따라 고윳값이 존재할 수도 있고 그렇지 않을 수도 있다.
보기 5. 보기 1에서 본 행렬을 다시 살펴보자. \[A = \left( \begin{matrix} 0 & 1 \\ 1 & 0 \end{matrix} \right)\] \(A\)의 특성다항식은 다음과 같다. \[p(t) = \det(tI_2 - A) = \det \left(\begin{array}{rr} t & -1 \\ -1 & t \end{array}\right) =t^2 -1.\] 방정식 \(p(t)=0\)의 근은 \(+1,\) \(-1\)이며 이 두 값이 곧 \(A\)의 고윳값이다.
보기 6. 다음 행렬을 살펴보자. \[B = \left(\begin{array}{cr} 0 & -1 \\ 1 & 0 \end{array}\right).\] 이 행렬은 \(\pi/2\)만큼 회전하는 변환이다. 이 행렬의 특성다항식은 \[p(t) = t^2 + 1\] 인데, 방정식 \(p(t)=0\)은 실수 범위에서 근을 갖지 않는다. 그러므로 \(B\)는 실수체 위에서 고윳값을 갖지 않는다.
보기 7. 다음 같은 행렬을 살펴보자. \[C = \left(\begin{array}{ccc} 5 & 1 & 2 \\ 1 & 6 & 1 \\ 2 & 3 & 7 \end{array}\right).\] \(C\)의 특성다항식을 구하면 \[p(t) = (-4+t)(43 - 14t + t^2 )\] 이므로, \(4\)는 \(A\)의 고윳값이다. \(4\)에 대응되는 고유공간을 구하려면 동차방정식 \[(4I_3 - A)\mathbf{x} = \mathbf{0}\] 의 해를 구해야 한다. 이 방정식과 동치인 다음 방정식을 풀자. \[(A-4I_3 )\mathbf{x} = \mathbf{0}\] 이 방정식을 행렬로 표현하면 다음과 같다. \[\left(\begin{array}{} 1 & 1 & 2 \\ 1 & 2 & 1 \\ 2 & 3 & 3 \end{array}\right) \left(\begin{array}{} x_1 \\ x_2 \\ x_3 \end{array}\right) = \left(\begin{array}{} 0 \\ 0 \\ 0 \end{array}\right).\] 이 방정식의 해공간은 다음과 같다. \[\left\{ (-3z,\,z,\,z) \,\vert\, z\in\mathbb{R}\right\}\] 그러므로 \(4\)에 대응되는 고유공간은 하나의 벡터 \((-3,\,1,\,1)\)에 의하여 생성되는 \(1\)차원 공간이다.
\(T\)가 유한차원 벡터공간 \(V\) 위에서 정의된 자기준동형사상이고 \(V\)에 기저가 주어져 있을 때, 그 기저를 기준으로 \(T\)를 행렬 \(A\)로 나타낼 수 있다. \(A\)는 \(V\)의 기저에 따라 달라지지만 특성다항식은 기저와는 독립적이다.
정리 2. 두 행렬이 서로 닮은 행렬이면, 두 행렬의 특성다항식은 일치한다.
증명.
\(A\)와 \(B\)가 서로 닮은 행렬이고 \(B = P^{-1} AP\)라고 하자. 그러면 행렬 계산의 성질에 의하여 다음이 성립한다. \[\begin{align} tI_n - B &= tI_n - P^{-1}AP \\[5pt] &= P^{-1} (tI_n) P - P^{-1} AP \\[5pt] &= P^{-1} (tI_n -A)P. \end{align}\] 행렬식은 곱을 보존하므로 다음을 얻는다. \[\begin{align} \det(tI_n - B) &= \det(P^{-1})\det(tI_n - A)\det(P) \\[5pt] &= \det(P)^{-1} \det(tI_n - A)\det(P) \\[5pt] &= \det(tI_n -A). \end{align}\] 그러므로 \(A\)의 특성다항식과 \(B\)의 특성다항식이 일치한다.
그러므로 유한차원 벡터공간 위에서 정의된 자기준동형사상 \(T:V \rightarrow V\)가 주어졌을 때, \(T\)의 특성다항식이라 함은 \(T\)를 나타내는 행렬의 특성다항식을 이르는 것으로 정의한다.
정리 3. \(\lambda_1,\) \(\lambda_2,\) \(\cdots,\) \(\lambda_r\)가 \(T : V \rightarrow V\)의 고윳값이고 모두 서로 다른 값이며, 이들 고윳값에 따르는 고유벡터들을 순서대로 \(v_1 ,\) \(v_2 ,\) \(\cdots ,\) \(v_r\)라고 하자. 그러면 \(v_1 ,\) \(v_2,\) \(\cdots,\) \(v_r\)는 일차독립이다.
증명.
결론과 반대로 \(v_1 ,\) \(v_2 ,\) \(\cdots ,\) \(v_r\)가 일차종속이라고 가정하자. 그리고 이들 벡터들의 종속 관계 표현 중 가장 짧은 표현을 다음과 같이 나타내자. \[v_1 = \mu_2 v_2 + \cdots + \mu_s v_s .\tag{8}\] 단, 이 식에서 모든 \(\mu_j \in K\)는 \(0\)이 아닌 스칼라이다. 식의 양변을 \(T\)에 대입하여 값을 구하면 다음을 얻는다. \[\lambda_1 v_1 = \mu_2 \lambda_2 v_2 + \cdots + \mu_s \lambda_s v_s .\tag{9}\] (9)로부터 (8)에 \(\lambda_1\)을 곱한 식을 변마다 빼면 다음을 얻는다. \[\mathbf{0} = \mu_2 (\lambda_2 - \lambda_1) v_2 + \cdots + \mu_s (\lambda_s - \lambda_1 )v_s .\tag{10}\] 그런데 \(\lambda_j\)들이 모두 서로 다르고 \(\mu_j\)가 \(0\)이 아니므로 (10)은 \(v_j\)들의 종속 관계 표현 중 (8)보다 더 짧은 표현이다. 이것은 모순이므로 \(v_1 ,\) \(v_2 ,\) \(\cdots ,\) \(v_r\)는 일차독립이다.
정리 4. \(A\in M_n(K)\)이고 \(p(t)\)가 \(A\)의 특성다항식이라고 하자. 만약 방정식 \(p(t)=0\)이 체 \(K\)에서 \(n\)개의 서로 다른 근을 가지면 \(A\)는 대각화 가능하다.
증명.
정리의 가정에 의하여 \(A\)는 \(n\)개의 서로 다른 고윳값을 가지며, 그 고윳값에 따르는 고유벡터는 \(n\)개의 일차독립인 벡터이다. 이들 벡터가 생성하는 공간은 \(n\)차원이므로, 이 고유벡터들은 \(K^n\)의 기저가 된다. 그러므로 \(A\)는 대각화 가능하다.
에르미트 변환과 유니타리 변환
지금부터 내적공간이라 함은 실내적이나 복소내적이 주어진 벡터공간을 나타내는 것으로 약속하자.
\(V\)가 내적공간이고 \(T : V \rightarrow V\)가 자기준동형사상이라고 하자. 만약 \(V\)에서 정의된 자기준동형사상 \(T^*\)가 조건 \[\langle T(u) \,\vert\, v \rangle = \langle u \,\vert\, T^* (v) \rangle \quad\text{for all } u,\,v\in V\] 를 만족시키면 \(T^*\)를 \(T\)의 수반변환(adjoint)이라고 부른다.
유한차원 내적공간 위에서 정의된 임의의 자기준동형사상 \(T\)에 대하여, \(T\)의 수반변환 \(T^*\)이 유일하게 존재한다. 또한 수반변환의 수반변환은 다음과 같은 성질을 가진다.
정리 5. \(T^{**} = T.\)
증명.
\(u,\) \(v\)가 임의로 주어진 벡터라고 하자. 그러면 \[\langle T(u) \,\vert\,v \rangle = \langle u\,\vert\, T^* (v) \rangle = \overline{\langle T^*(v) \,\vert\, u \rangle} = \overline{\langle v\,\vert\,T^{**}(u)\rangle} = \langle T^{**} (u) \,\vert\, v\rangle.\] 즉 임의의 벡터 \(v\)에 대하여 \(T(u)\)와 \(T^{**}(u)\)가 같은 내적값을 가지므로 \(T(u) - T^{**}(u)\)는 \(V\)의 모든 벡터와 수직이다. 그러므로 \(T(u) - T^{**}(u) = \mathbf{0}\)이다.
\(A = (a_{ij})\)가 복소행렬일 때 그 켤레행렬(conjugate)를 \[\overline{A} = \left( \overline{a_{ij}} \right)\] 로 정의한다.
켤레행렬의 정의에 의하여, 합과 곱이 정의될 때, 다음이 성립한다. \[\overline{A+B} = \overline{A} + \overline{B} ,\,\, \overline{AB} = \overline{A} \cdot \overline{B}.\] \(A = (a_{ij})\)가 복소행렬일 때 그 켤레전치행렬(conjugate transpose)를 \[A^* = \,^t (\overline{A})\] 로 정의한다. \(A\)가 실행렬인 경우 켤레전치행렬은 단순히 전치행렬 \(A^* = \,^t\! A\)이다.
켤레전치행렬의 정의에 의하여, 곱이 정의될 때, 다음이 성립한다. \[(AB)^* = B^* A^* .\]
정리 6. 임의의 \(\mathbf{w},\,\mathbf{z} \in \mathbb{C}^n\)에 대하여 \(\langle A\mathbf{w} \,\vert\, \mathbf{z} \rangle = \langle \mathbf{w} \,\vert\, A^* \mathbf{z} \rangle\)이다. 즉 \(A^*\)는 \(A\)의 수반변환이다. 특히 실행렬의 수반변환은 전치행렬이다.
증명.
등식 \(\langle \mathbf{w} \,\vert\, \mathbf{z}\rangle = \,^t \mathbf{w}\,\overline{\mathbf{z}}\)을 이용하면 다음을 얻는다. \[\begin{align} \langle A\mathbf{w} \,\vert\, \mathbf{z} \rangle &= \,^t (A\mathbf{w}) \overline{\mathbf{z}} = \,^t \mathbf{w} \,^t \! A \overline{\mathbf{z}} \\[5pt] &= \,^t \mathbf{w} \overline{A^* \mathbf{z}} = \langle \mathbf{w} \,\vert\, A^* \mathbf{z} \rangle . \tag*{\(\blacksquare\)} \end{align}\]
유한차원 내적공간에서 정의된 자기준동형사상 \(T\)가 조건 \(T = T^*\)를 만족시키면 \(T\)를 에르미트 변환(Hermitian transformation)이라고 부른다. 마찬가지로 행렬 \(A\)가 조건 \(A = A^*\)를 만족시키면 \(A\)를 에르미트 행렬(Hermitian matrix)이라고 부른다. 실행렬의 경우 주어진 정사각행렬이 에르미트 행렬일 필요충분조건은 대칭행렬인 것이다.
\(T\)가 에르미트 변환인 경우 다음이 성립한다. \[\langle T(u) \,\vert\,v \rangle = \langle u \,\vert\, T(v) \rangle.\] 정규직교기저가 주어진 내적공간에서는 주어진 변환이 에르미트 변환인지 여부를 판별할 때 행렬을 이용할 수 있다.
정리 7. \(V\)가 유한차원 내적공간이고 \(B = \left\{ u_1 ,\, u_2 ,\, \cdots ,\, u_n \right\}\)이 \(V\)의 정규직교기저이며 \(T\)가 \(V\) 위에서 정의된 자기준동형사상이라고 하자. 이때 \(T\)가 에르미트 변환일 필요충분조건은 기저 \(B\)에 대한 \(T\)의 표현행렬 \(A = (a_{ij})\)가 에르미트 행렬인 것이다.
증명.
다음 두 등식을 살펴보자. \[\begin{gather} \langle T(u_j) \,\vert\,u_i \rangle = \left\langle\sum_{k=1}^n a_{kj} u_k \,\bigg\vert\, u_i \right\rangle = \langle a_{ij} u_i \,\vert\, u_i \rangle = a_{ij},\\[5pt] \langle u_j \,\vert\, T(u_j)\rangle = \left\langle u_j \,\bigg\vert\, \sum_{k=1}^n a_{ki} u_k \right\rangle = \langle u_j \,\vert\, a_{ji} u_j \rangle = \overline{a_{ji}}. \end{gather}\] 명백히, 두 값이 같아지기 위한 필요충분조건은 \(A = A^*\)인 것이다.
정리 8. 에르미트 변환의 특성다항식의 근은 항상 실수이다. 즉 에르미트 변환의 고윳값은 항상 실수이다. 더욱이 그 고윳값들에 대응되는 고유벡터들은 정규직교족을 이룬다.
증명.
\(T : V \rightarrow V\)가 에르미트 변환이라고 하자. 그리고 \(V\)에 정규직교기저가 주어져 있다고 하자. 그러면 그 기저에 대한 \(T\)의 표현행렬은 에르미트 행렬이다. 그러므로 \(T\)의 표현행렬 \(A\)가 에르미트 행렬일 때 그 고윳값이 실수임을 보이면 된다.
\(V\)에 주어진 내적이 실내적이든 복소내적이든 상관 없이 행렬 \(A\)를 왼쪽에 곱하는 연산은 복소벡터공간 \(\mathbb{C}^n\) 위에서의 변환이다. 그러므로 \(A\)를 \(\mathbb{C}^n\) 위에서의 변환으로 간주하고 논의를 이어가자. 이와 같은 관점이 필요한 이유는 \(A\)의 고윳값과 고유벡터가 존재한다는 것을 보장하려면 복소수 범위에서 생각해야 하기 때문이다.
\(\lambda\)가 \(A\)의 고윳값이고, 이 고윳값에 따르는 고유벡터가 영벡터가 아닌 벡터 \(w\in\mathbb{C}^n\)이라고 하자. 그러면 다음 등식이 성립한다. \[\begin{align} \lambda\langle \mathbf{w}\,\vert\,\mathbf{w} \rangle &= \langle \lambda\mathbf{w} \,\vert\, \mathbf{w} = \langle A\mathbf{w} \,\vert\, \mathbf{w} \rangle \\[5pt] &= \langle \mathbf{w} \,\vert\, A\mathbf{w} \rangle = \langle \mathbf{w} \,\vert\, \lambda\mathbf{w} \rangle = \overline{\lambda} \langle \mathbf{w} \,\vert\, \mathbf{w} \rangle. \end{align}\] 여기서 \(\mathbf{w}\)가 영벡터가 아니므로 \(\langle \mathbf{w} \,\vert\,\mathbf{w}\rangle \ne 0\)이다. 그러므로 위 등식으로부터 \[\lambda = \overline{\lambda}\] 를 얻는다. 즉 \(\lambda\)는 실수이다.
다음으로 \(\lambda_1\)과 \(\lambda_2\)가 \(A\)의 서로 다른 고윳값이라고 하자. 그리고 이들 고윳값에 따르는 고유벡터를 \(\mathbf{w}_1,\) \(\mathbf{w}_2\)라고 하자. 그러면 다음이 성립한다. \[\begin{align} \lambda_1 \langle \mathbf{w}_1 \,\vert\, \mathbf{w}_2 \rangle &= \langle \lambda_1 \mathbf{w}_1 \,\vert\, \mathbf{w}_2\rangle = \langle A\mathbf{w}_1 \,\vert\, \mathbf{w}_2\rangle \\[5pt] &= \langle \mathbf{w}_1 \,\vert\, A\mathbf{w}_2 \rangle = \langle \mathbf{w}_1 \,\vert\, \lambda_2 \mathbf{w}_2 \rangle = \lambda_2 \langle \mathbf{w}_1 \,\vert\, \mathbf{w}_2 \rangle \end{align}\] 여기서 \(\lambda_1 \ne \lambda_2\)이므로 \(\langle \mathbf{w}_1 \,\vert\, \mathbf{w}_2 \rangle = 0\)이다.
유한차원 내적공간에서 정의된 가역인 자기준동형사상 \(T\)가 \(T^{-1} = T^*\)를 만족시키면 \(T\)를 유니타리 변환(unitary transformation)이라고 부른다. 또한 유니타리 실행렬을 직교행렬(orthogonal matrix)이라고 부른다.
수반변환의 정의에 의하여 \(T\)가 유니타리 변환일 때 다음이 성립한다. \[\langle T(u) \,\vert\, T(v) \rangle = \langle u \,\vert\, T^* T(v) \rangle = \langle u\,\vert\, v\rangle.\] 그러므로 유니타리 변환은 길이와 각을 보존한다. 또한 이러한 명제의 역이 성립한다.
정리 9. \(T\)가 자기준동형사상이고 임의의 \(u\in V\)에 대하여 \[\langle T(u) \,\vert\, T(u) \rangle = \langle u\,\vert\, u\rangle\tag{11}\] 을 만족시키면(즉 \(T\)가 길이를 보존하면) \(T\)는 유니타리 변환이다.
증명.
등식 \[\langle T(u+v) \,\vert\, T(u+v) \rangle = \langle u \,\vert\, u \rangle\] 의 양변을 전개하면 다음과 같다. \[\begin{align} \langle T(u) \,\vert\, T(u) \rangle + \langle T(u) \,\vert\, T(v) \rangle &+ \langle T(v) \,\vert\, T(u) \rangle + \langle T(v) \,\vert\, T(v) \rangle \\[5pt] &= \langle u\,\vert\,u\rangle + \langle u\,\vert\,v\rangle + \langle v\,\vert\,u\rangle + \langle v\,\vert\,v\rangle . \end{align}\tag{12}\] (11)을 이용하여 (12)의 양변에서 같은 값을 빼면 다음을 얻는다. \[\langle T(u) \,\vert\, T(v) \rangle + \langle T(v) \,\vert\, T(u) \rangle = \langle u\,\vert\,v\rangle + \langle v\,\vert\,u \rangle.\tag{13}\] 실내적공간의 경우 이 등식으로부터 \[\langle u\,\vert\, T^* T(v)\rangle = \langle T(u) \,\vert\,T(v)\rangle = \langle u\,\vert\,v\rangle\] 를 얻는다. 여기서 \(u\)와 \(v\)는 임의의 벡터이므로 \(T^* T = I\) 즉 \(T^* = T^{-1}\)이다.
복소내적공간의 경우 (13)의 양변은 복소수와 그 켤레복소수의 합을 나타낸다. 그러므로 (13)의 양변을 \(2\)로 나누면 다음을 얻는다. \[\operatorname{Re}(\langle T(u) \,\vert\, T(u) \rangle) = \operatorname{Re}(\langle u\,\vert\,v \rangle).\] 이 등식에서 \(u\)를 \(\mathbf{i}u\)로 바꾸고 \(\operatorname{Re}(\mathbf{i}z) = - \operatorname{Im}(z)\)와 \(T\)의 선형성을 이용하여 변형하면 다음을 얻는다. \[\operatorname{Im}(\langle T(u) \,\vert\, T(u) \rangle) = \operatorname{Im}(\langle u\,\vert\,v \rangle).\] 따라서 \(\langle u\,\vert\,v\rangle\)와 \(\langle T(u) \,\vert\,T(v) \rangle\)은 실수부와 허수부가 모두 일치한다. 그러므로 실내적 공간의 경우와 같은 방법으로 \(T^* = T^{-1}\)를 얻는다.
행렬 \(A \,\overline{^t \! A}\)의 \((i,\,j)\)-성분은 \(A\)의 \(i\)째 행벡터와 \(^t \! A\)의 \(j\)째 열벡터의 내적이다. 그런데 이 값은 \(A\)의 \(i\)째 열벡터와 \(A\)의 \(j\)째 열벡터의 내적과 같다. 그러므로 \(A \,\overline{^t \! A}\)가 \(I_n = (\delta_{ij})\)와 같을 필요충분조건은 \(A\)의 행벡터들이 정규직교족을 이루는 것이다.
유니타리 행렬의 전치행렬 또한 유니타리 행렬이므로, 이와 같은 결과는 \(A\)의 열벡터에 대해서도 성립한다.
정리 10. 유니타리 변환의 고윳값의 크기(절댓값)는 항상 \(1\)이다. 더욱이 서로 다른 고윳값들에 따르는 고유벡터들은 직교벡터족을 이룬다.
증명.
\(T: V \rightarrow V\)가 유니타리 변환이고 \(\lambda\)가 이 변환의 고윳값이며 \(\lambda\)에 따르는 고유벡터 \(u\)가 영벡터가 아니라고 하자. 그러면 \[\langle u \,\vert\, u \rangle = \langle T(u) \,\vert\, T(u) \rangle = \langle \lambda u \,\vert\, \lambda u \rangle = \lambda \overline{\lambda} \langle u\,\vert\, u \rangle\] 이므로 \(\lambda\overline{\lambda} = 1\)이다. 그러므로 \(\lambda\)의 절댓값은 \(1\)이다.
다음으로 \(\lambda_1\)과 \(\lambda_2\)가 \(T\)의 서로 다른 고윳값이고 \(u_1\)과 \(u_2\)가 이들에 따르는 고유벡터라고 하자. 그러면 다음이 성립한다. \[\begin{align} \langle u_1\,\vert\, u_2 \rangle &= \langle T(u_1 ) \,\vert\, T(u_2) \rangle = \langle \lambda_1 u_1 \,\vert\, \lambda_2 u_2 \rangle \\[5pt] &= \lambda_1 \overline{\lambda_2} \langle u_1 \,\vert\, u_2 \rangle = \frac{\lambda_1}{\lambda_2} \langle u_1 \,\vert\, u_2 \rangle . \end{align}\] 그런데 \(\lambda_1 \ne \lambda_2\)이므로 \(\langle u_1\,\vert\, u_2 \rangle = 0\)이다.
스펙트럼 분해
보조정리 11. \(T\)가 에르미트 변환이거나 유니타리 변환이라고 하자. 만약 \(u\)가 \(T\)의 고유벡터이고 \(v\)가 \(u\)와 수직인 벡터이면, \(T(v)\)도 \(u\)와 수직이다.
증명.
\(T\)가 에르미트 변환이고 \(\lambda\)가 \(T\)의 고윳값이며 \(u\)가 \(\lambda\)에 따르는 고유벡터라고 하자. 그러면 다음이 성립한다. \[\lambda\langle u\,\vert\,v\rangle = \langle \lambda u \,\vert\,v \rangle = \langle T(u) \,\vert\, v \rangle = \langle u \,\vert\, T(v) \rangle.\] 그러므로 \(\langle u \,\vert\,v \rangle = 0\)일 때 \(\langle u \,\vert\, T(v) \rangle = 0\)이다.
다음으로 \(T\)가 유니타리 변환이고 \(\lambda\)가 \(T\)의 고윳값이며 \(u\)가 \(\lambda\)에 따르는 고유벡터라고 하자. 유니타리 변환의 고윳값의 크기는 항상 \(1\)이므로 \(\lambda\)는 \(0\)이 아니다. 따라서 다음이 성립한다. \[\langle u \,\vert\, v \rangle = \langle T(u) \,\vert\, T(v) \rangle = \langle \lambda u \,\vert\, T(v) \rangle = \lambda \langle u \,\vert\, T(v) \rangle.\] 그러므로 \(\langle u \,\vert\,v \rangle = 0\)일 때 \(\langle u \,\vert\, T(v) \rangle = 0\)이다.
\(T : V \rightarrow V\)가 자기준동형사상이고 \(W\)가 \(V\)의 부분공간이라고 하자. 만약 임의의 \(w\in W\)에 대하여 \(T(w) \in W\)이면 ‘\(W\)는 \(T\)에 대해 불변이다’ 또는 ‘\(W\)는 \(T\)-불변이다(T-invariant)’라고 말한다. 이 경우 \(T\)의 정의역을 \(W\)로 축소한 제한함수 \(T \vert_W\)는 \(W\) 위에서의 자기준동형사상이다.
\(W\)가 \(T\)-불변일 때 다음이 성립한다.
- \(T\vert_W\)의 고윳값과 고유벡터는 \(T\)의 고윳값과 고유벡터와 동일하다.
- \(T\)가 에르미트 변환이면 \(T\vert_W\)도 에르미트 변환이다. 왜냐하면 \(V\)에서 \[\langle T(u) \,\vert\, v \rangle = \langle u \,\vert\, T(v)\rangle\]가 성립하면, 이 등식은 \(W\)에서도 성립하기 때문이다.
- \(T\)가 유니타리 변환이면 \(T\vert_W\)도 유니타리 변환이다. 왜냐하면 \(V\)에서 \[\langle T(u) \,\vert\, T(v) \rangle = \langle u \,\vert\, v\rangle\]가 성립하면, 이 등식은 \(W\)에서도 성립하기 때문이다.
정리 12. (스펙트럼 분해)
\(V\)가 유한차원 내적공간이고 \(T\)가 \(V\) 위에서의 자기준동형사상이라고 하자. 그리고 \(T\)가 다음 두 조건 중 하나를 만족시킨다고 하자.
- \(T\)가 에르미트 변환이고 \(V\)가 \(\mathbb{R}\) 또는 \(\mathbb{C}\) 위에서 정의되어 있다.
- \(T\)가 유니타리 변환이고 \(V\)가 \(\mathbb{C}\) 위에서 정의되어 있다.
그러면 \(T\)에 대한 \(V\)의 정규직교고유기저가 존재한다. 특히 \(T\)는 대각화 가능하다.
증명.
\(T\)의 모든 고윳값은 \(V\)가 정의된 체에 속한다. (i)의 경우 \(T\)가 에르미트 변환이므로 \(T\)의 모든 고윳값은 실수이다. (ii)의 경우 \(T\)의 특성다항식의 모든 근이 체 \(\mathbb{C}\)에 속한다. \(\dim(V)= n\)이라고 하자.
\(\lambda_1\)이 \(T\)의 고윳값이고 \(u_1\)이 \(\lambda_1\)에 따르는 고유벡터라고 하자. \(u_1\)에 의하여 생성되는 부분공간 \(W\)는 \(1\)차원이며, \(W\)의 직교여공간 \(W^\bot\)은 \(n-1\)차원이다. 명백히 \(T\)가 \(W\)의 모든 벡터를 \(W\)의 벡터에 대응시키므로, \(T\)는 \(W^\bot\)의 모든 벡터를 \(W^\bot\)의 벡터에 대응시킨다. 그러므로 \(W^\bot\)는 \(T\)에 대해 불변인 부분공간이다.
\(T\)의 정의역을 \(W^\bot\)으로 제한하여도 \(T\)는 (i)에 의하여 에르미트 변환이거나, (ii)에 의하여 유니타리 변환이다. 그리고 \(T\)의 고윳값과 고유벡터는 \(T\vert_{W^\bot}\)의 고윳값과 고유벡터이다. \(T\)의 고윳값 \(\lambda_2\)와 고유벡터 \(u_2\)를 택하고, 다시 앞의 과정을 반복하여 \(u_2\)와 수직인 벡터들로 이루어진 \(W\)의 부분공간을 얻을 수 있다.
이 과정을 반복하여 \(T\)의 고윳값 \(\lambda_3 ,\) \(\cdots,\) \(\lambda_n\)과 고유벡터 \(u_3,\) \(\cdots,\) \(u_n\)을 얻는다. 이 고유벡터들을 각각의 크기로 나누어 주면 \(T\)의 고유벡터로 이루어진 정규직교 고유기저를 얻는다.