지난 포스트에서 벡터공간 \(K^n,\) \(K^m\) 사이에서 정의된 선형변환과 \(m\times n\) 행렬의 관계를 살펴보았다(지난 포스팅 보기). 이번에는 일반적인 유한차원 벡터공간 \(V,\) \(V'\) 사이에서 정의된 선형변환과 행렬의 관계를 살펴보자.
\(K\)가 체이고 \(n\)과 \(m\)이 양의 정수라고 하자. 그리고 \(V\)와 \(V'\)이 \(K\) 위에서 정의된 \(n\)차원 벡터공간, \(m\)차원 벡터공간이라고 하자. 또한 \[\begin{align} B: &\,\, v_1 ,\, v_2 ,\, \cdots ,\, v_n, \\[6pt] B' : & \,\, v_1 ' ,\, v_2 ' ,\, \cdots ,\, v_m ' \end{align}\] 이 각각 \(V\)와 \(V'\)의 기저라고 하자. 임의의 \(v\in V\)는 \(B\)의 벡터들의 일차결합 \[v = k_1 v_1 + k_2 v_2 + \cdots + k_n v_n\] 으로 유일하게 표현된다. 이때 \(v\)를 순서쌍 \((k_1 ,\, k_2 ,\, \cdots ,\, k_n)\)에 대응시키는 함수 \[\begin{gather} \gamma_B :\, V \rightarrow K^n ,\\[6pt] \gamma_B (v) = (k_1 ,\, k_2 ,\, \cdots ,\, k_n ) \end{gather}\] 을 생각할 수 있다. 이와 같은 함수 \(\gamma_B\)를 기저 \(B\)에 대한 \(V\)의 좌표함수라고 부르고, 함숫값 \(\gamma_B(v)\)를 기저 \(B\)에 대한 \(v\)의 좌표라고 부른다. \(\gamma_B\)는 \(V\)로부터 \(K^n\)으로의 동형사상이 된다.
똑같은 방법으로 기저 \(B'\)에 대한 \(V\)의 좌표함수 \(\gamma_{B'}\)을 생각할 수 있으며, \(\gamma_{B'}\)은 \(V'\)으로부터 \(K^m\)으로의 동형사상이 된다.
함수 \(T\)가 \(V\)로부터 \(V'\)으로의 선형변환이라고 하자. 그러면 \(V\)의 벡터 \(v\)는 \(T\)에 의하여 \(V'\)의 벡터 \(T(v)\)에 대응된다. \(v\in V\)와 \(T(v)\in V'\)이 각각 하나씩 주어질 때마다 \(\gamma_B (v)\)와 \(\gamma_{B'} (T(v))\)도 각각 하나씩 주어지며, 이들은 각각 \(K^n,\) \(K^m\)의 원소이다. 여기서 \[(\gamma_{B'} \circ T \circ \gamma_{B}^{-1} )(v) = \gamma_{B'} (T(v))\] 이므로, 합성함수 \(\gamma_{B'} \circ T \circ \gamma_B ^{-1}\)는 \(K^n\)의 원소 \(\gamma_B (v)\)를 \(K^m\)의 원소 \(\gamma_{B'} (T(v))\)에 대응시키는 함수이다. 더욱이 \(\gamma_{B'} \circ T \circ \gamma_B ^{-1}\)는 선형변환들의 합성함수이므로 그 자체로서 선형변환이다.
\(V\)로부터 \(V'\)으로의 선형변환들의 모임을 \(\operatorname{Hom}(V,\,V')\)이라고 하자. 이 집합에 통상적인 스칼라곱과 함수의 합을 각각 스칼라곱과 함수의 합으로 정의하면, 이 집합은 \(K\) 위에서 정의된 벡터공간이 된다.
각 \(T\in\operatorname{Hom}(V,\,V')\)에 대하여 \(\gamma_{B'} \circ T \circ \gamma_B ^{-1}\)는 \(K^n\)으로부터 \(K^m\)으로의 선형변환이므로, 이 선형변환의 표현행렬 \(M(\gamma_{B'} \circ T \circ \gamma_B ^{-1})\)를 생각할 수 있다. 이 행렬을 간단히 \(M_{B,B'}(T)\)로 나타낸다. 즉 \[M_{B,B'}(T) = M(\gamma_{B'} \circ T \circ \gamma_B ^{-1})\] 이다. 이 행렬을 기저 \(B\)와 \(B'\)에 대한 \(T\)의 표현행렬이라고 부른다.
이제 두 공간 \(\operatorname{Hom}(V,\,V')\)과 \(\operatorname{Mat}_{m\times n}(K)\)가 동형임을 보이자.
정리 1. 두 벡터공간 \(\operatorname{Hom}(V,\,V')\)과 \(\operatorname{Mat}_{m\times n}(K)\)는 동형이다.
두 벡터공간이 동형임을 보이기 위하여 두 벡터공간 사이에 적절한 함수 \(\phi\)를 정의하고, 이 함수가 동형사상임을 보일 것이다.
1단계. 두 공간 사이의 함수 \(\phi\)를 정의하자.
선형변환 \(T: V \rightarrow V'\)을 \(M_{B,B'}(T)\)에 대응시키는 함수 \[\begin{gather} \phi : \, \operatorname{Hom}(V,\,V') \rightarrow \operatorname{Mat}_{m\times n}(K) ,\\[6pt] \phi : \, T \mapsto M_{B,B'} (T) \end{gather}\] 를 생각하자. 이 함수가 바로 우리가 바라는 동형사상임을 보이자.
2단계. \(\phi\)는 잘 정의된 함수이다.
각 선형변환 \(T: V \rightarrow V'\)에 대하여 \(\gamma_{B'} \circ T \circ \gamma_B ^{-1}\)는 \(K^n\)으로부터 \(K^m\)으로의 선형변환이므로, 이 선형변환의 표현행렬 \[M_{B,B'}(T) = M(\gamma_{B'} \circ T \circ \gamma_B ^{-1})\] \(m\times n\) 행렬로서 유일하게 결정된다. 즉 \(\phi\)는 \(\operatorname{Hom}(V,\,V')\)의 원소를 \(\operatorname{Mat}_{m\times n}(K)\)의 원소에 대응시킨다. 그러므로 \(\phi\)는 잘 정의된 함수이다.
3단계. \(\phi\)는 선형변환이다.
스칼라 \(k\in K\)와 선형변환 \(T:V\rightarrow V'\)이 주어졌다고 하자. 그러면 \(kT\) 또한 \(V\)로부터 \(V'\)으로의 선형변환이므로 \(M_{B,B'}(kT)\)는 \(m\times n\) 행렬이다. 또한 임의의 \(\mathbf{x}\in K^n\)에 대하여 \[\begin{align} (M_{B,B'}(kT))\mathbf{x} &= (\gamma_{B'}\circ (kT) \circ \gamma_B ^{-1})(\mathbf{x}) \\[6pt] &= k(\gamma_{B'} \circ T \circ \gamma_B^{-1})(\mathbf{x})) \\[6pt] &= k((M_{B,B'} (T))\mathbf{x}) \\[6pt] &= (k(M_{B,B'} (T)))\mathbf{x} \end{align}\] 이다. 즉 \(K^n\)의 모든 원소 \(\mathbf{x}\)에 대하여 \((M_{B,B'}(kT))\mathbf{x}\)와 \((k(M_{B,B'} (T)))\mathbf{x}\)가 일치하므로, 두 행렬 \(M_{B,B'}(kT)\)와 \(k(M_{B,B'} (T))\)는 같은 행렬이다. 즉 \[\phi(kT) = M_{B,B'}(kT) = k(M_{B,B'} (T)) = k\phi(T)\] 이다.
다음으로 두 선형변환 \(T_1 : V \rightarrow V',\) \(T_2 : V \rightarrow V'\)이 주어졌다고 하자. 그러면 \(T_1 +T_2\) 또한 \(V\)로부터 \(V'\)으로의 선형변환이므로 \(M_{B,B'}(T_1 + T_2 )\)는 \(m\times n\) 행렬이다. 또한 임의의 \(\mathbf{x}\in K^n\)에 대하여 \[\begin{align} (M_{B,B'}(T_1 +T_2))\mathbf{x} &= (\gamma_{B'} \circ (T_1 + T_2 ) \circ \gamma_B ^{-1})(\mathbf{x}) \\[6pt] &= \gamma_{B'} ((T_1 +T_2 )(\gamma_B ^{-1} (\mathbf{x})) \\[6pt] &= \gamma_{B'} (T_1 (\gamma_B^{-1} (\mathbf{x})) + T_2 ( \gamma_B ^{-1} (\mathbf{x})) \\[6pt] &= \gamma_{B'} (T_1 (\gamma_B^{-1}(\mathbf{x}))) + \gamma_{B'} (T_2 (\gamma_B ^{-1} (\mathbf{x}))) \\[6pt] &= (M_{B,B'} (T_1))\mathbf{x} + (M_{B,B'}(T_2))\mathbf{x} \\[6pt] &= (M_{B,B'} (T_1) + M_{B,B'}(T_2))\mathbf{x} \end{align}\] 이다. 즉 \(K^n\)의 모든 원소 \(\mathbf{x}\)에 대하여 \((M_{B,B'}(T_1 +T_2))\mathbf{x}\)와 \((M_{B,B'} (T_1) + M_{B,B'}(T_2))\mathbf{x}\)가 일치하므로, 두 행렬 \(M_{B,B'}(T_1 +T_2)\)와 \(M_{B,B'} (T_1) + M_{B,B'}(T_2)\)는 같은 행렬이다. 즉 \[\phi(T_1 + T_2 ) = M_{B,B'}(T_1 + T_2 ) = M_{B,B'}(T_1 ) + M_{B,B'}(T_2) = \phi(T_1) +\phi(T_2)\] 이다. 이로써 \(\phi\)가 선형임이 증명되었다.
4단계. \(\phi\)는 일대일 함수이다.
서로 다른 두 선형변환 \(T_1 : V \rightarrow V' ,\) \(T_2 : V \rightarrow V'\)이 주어졌다고 하자. \(T_1\)과 \(T_2\)가 서로 다른 선형변환이므로 \(V\)의 기저원소 중에 두 함수의 함숫값이 달라지는 것이 존재한다. \(v_j\)가 \(V\)의 기저원소 중 하나이고 \(T_1(v_j) \ne T_2 (v_j)\)라고 하자. \(\gamma_B (v_j) = \mathbf{e}_j\)는 \(K^n\)의 표준기저원소 중 \(j\)째 벡터이다. 이때 \[\begin{align} (M_{B,B'}(T_1))^j &= (M_{B,B'}(T_1))\mathbf{e}_j \\[6pt] &= (M_{B,B'}(T_1))(\gamma_B(v_j)) \\[6pt] &= (\gamma_{B'} \circ T_1 \circ \gamma_B ^{-1})(\gamma_B(v_j)) \\[6pt] &= \gamma_{B'} (T_1 (v_j)) \\[6pt] &\ne \gamma_{B'} (T_2 (v_j)) \\[6pt] &= (\gamma_{B'} \circ T_2 \circ \gamma_B ^{-1})(\gamma_B(v_j)) \\[6pt] &= (M_{B,B'}(T_2))(\gamma_B(v_j)) \\[6pt] &= (M_{B,B'}(T_2))\mathbf{e}_j \\[6pt] &= (M_{B,B'}(T_2))^j \end{align}\] 이므로 \(M_{B,B'}(T_1)\)의 \(j\)째 열과 \(M_{B,B'}(T_2)\)의 \(j\)째 열은 서로 다르다. 그러므로 \[\phi(T_1) = M_{B,B'}(T_1) \ne M_{B,B'}(T_2) = \phi(T_2)\] 이다. 즉 \(\phi\)는 일대일 함수이다.
5단계. \(\phi\)는 위로의 함수이다.
\(m\times n\) 행렬 \(A\)가 주어졌다고 하자. 선형변환 \(T:V\rightarrow V'\)을 \[\forall v\in V : \, T(v) = \gamma_{B'}^{-1} ( T_A ( \gamma_B (v)))\] 로 정의하자. \(T\)는 선형변환들의 합성함수이므로 선형변환이다. 또한 \(\gamma_B\)의 정의역이 \(V\)이고 \(\gamma_{B'}^{-1}\)의 공역이 \(V'\)이므로 \(T\)는 \(V\)로부터 \(V'\)으로의 선형변환이다. 이때 \[\begin{align} \phi(T) &= M_{B,B'}(T) \\[6pt] &= M(\gamma_{B'} \circ (\gamma_{B'}^{-1} \circ T_A \circ \gamma_B ) \circ \gamma_B ^{-1}) \\[6pt] &= M(T_A) \\[6pt] &= A \end{align}\] 이므로 \(\phi\)는 위로의 함수이다.
이로써 유한차원 벡터공간 \(V,\) \(V'\)에 기저 \(B,\) \(B'\)이 고정되어 있을 때, 선형변환 \(T:V\rightarrow V'\)은 행렬과 같은 것으로 간주할 수 있다. 그렇다면 \(T\)의 표현행렬 \(M_{B,B'}(T)\)를 어떻게 구할 것인가? 그 답은 위 정리의 증명 과정 4단계에 있다. \(v_j\)가 \(V\)의 기저의 \(j\)째 벡터일 때, \(M_{B,B'}(T)\)의 \(j\)째 열은 \(\gamma_{B'}(T(v_j))\)와 같다. 즉
이다. 여기서 각 \(\gamma_{B'}(T(v_j))\)는 \(m\times 1\) 행렬로 나타나는 열벡터이다. 그러므로 위 등식의 우변은 \(m\times n\) 행렬을 나타낸다. 만약 \(V=K^n,\) \(V' = K^m\)이면 \(\gamma_B\)와 \(\gamma_{B'}\)은 항등함수이므로, 위 등식은 \(T\)의 표현행렬 \(M(T)\)의 정의와 일치한다.
끝으로 선형변환의 합성을 행렬로 표현하는 방법을 살펴보자.
정리 2. \(V,\) \(V',\) \(V''\)이 각각 \(p\)차원, \(n\)차원, \(m\)차원 벡터공간이고, \(B,\) \(B',\) \(B''\)이 각각 \(V,\) \(V',\) \(V''\)의 기저라고 하자. 또한 \(T:V \rightarrow V',\) \(T' : V' \rightarrow V''\)이 선형변환이라고 하자. 그러면 다음이 성립한다. \[M_{B,B''}(T'\circ T) = M_{B',B''}(T') \cdot M_{B,B'}(T).\] 즉 선형변환의 합성함수의 표현행렬은 각 선형변환의 표현행렬의 곱과 같다.
증명.
\(M_{B',B''}(T')\)은 \(m\times n\) 행렬이고 \(M_{B,B'}(T)\)는 \(n\times p\) 행렬이므로 두 행렬의 곱은 \(m\times p\) 행렬이다. 그러므로 정리의 등식에서 양변의 행렬의 크기는 일치한다.
다음으로, 각 \(\mathbf{x}\in K^p\)에 대하여 \[\begin{align} (M_{B,B''}(T'\circ T))\mathbf{x} &= (\gamma_{B''} \circ (T' \circ T)\circ \gamma_B^{-1} )(\mathbf{x}) \\[6pt] &= (\gamma_{B''} \circ T' \circ \gamma_{B'}^{-1} \circ \gamma_B \circ T \circ \gamma_B^{-1})(\mathbf{x}) \\[6pt] &= (\gamma_{B''} \circ T' \circ \gamma_{B'}^{-1})((\gamma_B \circ T \circ \gamma_B^{-1})(\mathbf{x})) \\[6pt] &= (M_{B',B''}(T'))((M_{B,B'}(T))\mathbf{x}) \\[6pt] &= ((M_{B',B''} (T'))(M_{B,B'}(T)))\mathbf{x} \end{align}\] 이다. 즉 임의의 \(\mathbf{x}\in K^p\)에 대하여 \[(M_{B,B''}(T'\circ T))\mathbf{x} = ((M_{B',B''} (T'))(M_{B,B'}(T)))\mathbf{x}\] 이므로 두 행렬 \(M_{B,B''}(T'\circ T)\)와 \((M_{B',B''} (T'))(M_{B,B'}(T))\)는 일치한다.
지금까지 살펴본 내용을 요약하면 다음과 같다.
기저가 주어진 유한차원 벡터공간 사이에서 정의된 선형변환은 행렬과 같은 것으로 생각할 수 있다. 이때 선형변환의 합성은 행렬의 곱과 같다.