벡터공간 \(K^n,\) \(K^m\) 사이에서 정의된 선형변환과 \(m\times n\) 행렬의 관계를 살펴보자.
\(K\)가 체(field)이고 \(n\)과 \(m\)이 양의 정수라고 하자. 모든 성분이 \(K\)에 속하는 \(m\times n\) 행렬들의 모임을\(\newcommand{\MatK}{\operatorname{Mat}_{m \times n}(K)}\) \[\MatK\] 로 나타낸다. 또한 정의역이 \(K^n\)이고 공역이 \(K^m\)인 선형변환들의 모임을\(\newcommand{\HomK}{\operatorname{Hom}(K^n ,\, K^m )}\) \[\HomK\] 으로 나타낸다. [여기서 \(K^n\)과 \(K^m\)은 통상적인 벡터 합과 스칼라 곱이 주어진 벡터공간이다.]
스칼라 \(k\in K\)와 \(m\times n\) 행렬 \(A = (a_{ij})_{m\times n}\), \(B=(b_{ij})_{m\times n}\)에 대하여 스칼라곱 \(kA\)와 합 \(A+B\)를 각각 \[\begin{gather} kA = (ka_{ij})_{m\times n} ,\\[6pt] A+B = (a_{ij} + b_{ij})_{m\times n} \end{gather}\] 로 정의하면 \(\MatK\)는 \(K\) 위에서 정의된 벡터공간이다. 마찬가지로 스칼라 \(k\in K\)와 \(K^n\)으로부터 \(K^m\)으로의 선형변환 \(T_1 ,\) \(T_2\)에 대하여 스칼라곱 \(kT_1\)과 합 \(T_1 + T_2\)를 각각 \[\begin{gather} \forall \mathbf{x}\in K^n : \, (kT_1) (\mathbf{x}) = k(T_1 (\mathbf{x})),\\[6pt] \forall \mathbf{x}\in K^n : \, (T_1 + T_2 )(\mathbf{x}) = T_1 (\mathbf{x}) + T_2 (\mathbf{x}) \end{gather} \] 를 만족시키는 함수로 정의하면 \(\HomK\)는 \(K\) 위에서 정의된 벡터공간이다.
이제 이 두 공간 \(\MatK\)와 \(\HomK\)가 동형인 벡터공간임을 보이자.
정리 1. 두 벡터공간 \(\MatK\)와 \(\HomK\)은 동형이다.
두 벡터공간이 동형임을 보이려면 두 공간 사이에 정의된 동형사싱이 존재함을 보여야 한다. 벡터공간의 동형사상이란 일대일대응(one-to-one이면서 onto)인 선형변환(linear transformation)이어야 한다.
1단계. 두 공간 사이의 함수 \(\phi\)를 정의하자.
\(m\times n\) 행렬 \(A\)에 대하여 선형변환 \(T_A : K^n \rightarrow K^m\)을 다음과 같이 정의한다. \[\forall \mathbf{x} \in K^n :\, T_A(\mathbf{x}) = A\mathbf{x}.\] 즉 \(T_A\)는 \(K^n\)의 벡터 \(\mathbf{x}\)의 왼쪽에 행렬 \(A\)를 곱한 결과를 함숫값으로 취하는 함수이다. 여기서 \(\mathbf{x}\)는 \(K^n\)의 원소(벡터)를 \(n\times 1\) 행렬로 나타낸 열벡터이다. 이제 함수 \[\phi : \MatK \rightarrow \HomK\] 를 다음과 같이 정의하자. \[\forall A \in \MatK : \, \phi (A) = T_A .\] 이 함수가 바로 우리가 바라는 동형사상임을 보이자.
2단계. \(\phi\)는 잘 정의된 함수이다.
각 행렬 \(A\in\MatK\)와 \(n\times 1\) 행렬 \(\mathbf{x}\)의 곱 \(A\mathbf{x}\)는 행렬의 곱의 정의에 의하여 잘 정의되며, 곱한 결과는 \(m\times 1\) 행렬이 된다. 또한 스칼라 \(k\in K\)와 두 벡터 \(\mathbf{x}_1 \in K^n ,\) \(\mathbf{x}_2 \in K^n\)에 대하여 \[\begin{gather} T_A (k\mathbf{x}_1 ) = A(k\mathbf{x}_1) = k(A\mathbf{x}_1) = k T_A (\mathbf{x}_1 ), \\[6pt] T_A (\mathbf{x}_1 + \mathbf{x}_2) = A(\mathbf{x}_1 + \mathbf{x}_2 ) = A\mathbf{x}_1 + A\mathbf{x}_2 = T_A (\mathbf{x}_1) + T_A(\mathbf{x}_2 ) \end{gather}\] 이므로 \(T_A\)는 선형변환이다. 즉 \(\phi\)는 \(\MatK\)의 원소를 \(\HomK\)의 원소에 대응시킨다. 그러므로 \(\phi\)는 잘 정의된 함수이다.
3단계. \(\phi\)는 선형변환이다.
스칼라 \(k\in K\)와 행렬 \(A\in\MatK\)가 주어졌다고 하자. 그러면 \(T_{kA}\)와 \(kT_A\)는 모두 \(K^n\)으로부터 \(K^m\)으로의 선형변환이다. 또한 임의의 \(\mathbf{x}\in K^n\)에 대하여 \[T_{kA} (\mathbf{x}) = (kA)\mathbf{x} = k(A\mathbf{x}) = k(T_A(\mathbf{X})) = (kT_A)(\mathbf{x})\] 이다. 즉 정의역 \(K^n\)의 모든 원소에 대하여 \(T_{kA}\)와 \(kT_A\)의 함숫값이 일치하므로, 이 두 함수는 같은 함수이다. 그러므로 \[\phi(kA) = T_{kA} = kT_A = k\phi(A)\] 이다.
다음으로 두 행렬 \(A,\,B\in\MatK\)가 주어졌다고 하자. 그러면 \(T_{A+B}\)와 \(T_A +T_B\)는 모두 \(K^n\)으로부터 \(K^m\)으로의 선형변환이다. 또한 임의의 \(\mathbf{x}\in K^n\)에 대하여 \[T_{A+B}(\mathbf{x}) = (A+B)\mathbf{x} = A\mathbf{x}+B\mathbf{x} = T_A (\mathbf{x}) + T_B (\mathbf{x}) = (T_A + T_B)(\mathbf{x})\] 이다. 즉 정의역 \(K^n\)의 모든 원소에 대하여 \(T_{A+B}\)와 \(T_A +T_B\)의 함숫값이 일치하므로, 이 두 함수는 같은 함수이다. 그러므로 \[\phi(A+B) = T_{A+B} = T_A + T_B = \phi(A) + \phi(B)\] 이다. 이로써 \(\phi\)가 선형임이 증명되었다.
4단계. \(\phi\)는 일대일 함수(one-to-one function)이다.
서로 다른 두 행렬 \(A,\,B\in\MatK\)가 주어졌다고 하자. \(A\)와 \(B\)가 다른 행렬이므로, 두 행렬의 열(column) 중에서 서로 다른 것이 존재한다. \(A\)와 \(B\)의 \(j\)째 열이 서로 다르다고 하자. 즉 \(A^j \ne B^j\)라고 하자. [여기서 위첨자 \(j\)는 제곱을 나타내는 것이 아니라 \(j\)째 열을 나타낸다.] \(K^n\)의 \(j\)째 표준기저원소를 \(\mathbf{e}_j\)로 나타내자. 그러면 \[T_A (\mathbf{e}_j) = A\mathbf{e}_j = A^j \ne B^j = B\mathbf{e}_j = T_B(\mathbf{e}_j)\] 이다. 즉 정의역 \(K^n\)의 원소 \(\mathbf{e}_j\)에 대하여 \(T_A\)와 \(T_B\)의 함숫값이 다르므로 두 함수는 다른 함수이다. 이로써 \(A\ne B\)일 때 \[\phi(A) = T_A \ne T_B = \phi(B)\] 이므로 \(\phi\)는 일대일 함수이다.
5단계. \(\phi\)는 위로의 함수(onto)이다.
선형변환 \(T\in\HomK\)가 주어졌다고 하자. \(T\)의 표현행렬 \(M(T)\)를 다음과 같이 정의한다. \[M(T) = [ T(\mathbf{e}_1) \,\,\, T(\mathbf{e}_2) \,\,\, \cdots \,\,\, T(\mathbf{e}_n)]\] 즉 \(M(T)\)는 \(j\)째 열이 \(T(\mathbf{e}_j)\)와 일치하는 행렬이다. 각 \(j\)에 대하여 \(T(\mathbf{e}_j)\)는 \(m\times 1\) 행렬이므로 \(M(T)\)는 \(m\times n\) 행렬이다. 즉 \(M(T)\in\MatK\)이다. 이때 \(M(T)\)를 왼쪽에 곱하는 연산으로 정의된 함수 \(T_{M(T)}\)는 \(K^n\)으로부터 \(K^m\)으로의 선형변환이다.
이제 \(\phi(M(T)) = T\)임을 보이자. 각 \(j = 1,\,2,\,\cdots,\,n\)에 대하여 \[T_{M(T)}(\mathbf{e}_j) = (M(T))\mathbf{e}_j = (M(T))^j\] 이다. 그런데 \((M(T))^j\)는 행렬 \(M(T)\)의 \(j\)째 열을 나타내며, 이것은 \(T(\mathbf{e}_j)\)와 같다. 즉 \[T_{M(T)}(\mathbf{e}_j) = (M(T))\mathbf{e}_j = (M(T))^j = T(\mathbf{e}_j)\] 이다. 그런데 \(\mathbf{e}_1 ,\) \(\mathbf{e}_2 ,\) \(\cdots,\) \(\mathbf{e}_n \)은 \(K^n\)의 기저이므로, 이 벡터들의 함숫값이 일치하는 두 선형변환은 완전히 일치한다. 즉 \(T_{M(T)}\)와 \(T\)는 같은 함수이다.
이로써 임의의 \(T\in\HomK\)에 대하여 \(M(T)\in\MatK\)가 존재하여 \[\phi(M(T)) = T_{M(T)} = T\] 이므로 \(\phi\)는 \(\HomK\) 위로의 함수이다.
위 증명 과정의 5단계에서, 임의의 \(T\in\HomK\)에 대하여 \(T\)를 표현하는 행렬 \(M(T)\)를 찾았으며, 이 행렬에 의하여 만들어지는 선형사상은 \(T\)와 일치함을 보였다. 즉 임의의 \(T\in\HomK\)에 대하여 \[T_{M(T)} = T\] 이다.
이 과정을 반대로 생각할 수 있다. 즉 임의의 행렬 \(A\in\MatK\)에 대하여 \(A\)에 의하여 만들어지는 선형사상 \(T_A\)를 찾고, 다시 \(T_A\)의 표현행렬 \(M(T_A)\)를 찾을 수 있다. 이 두 행렬이 일치함을 보이자. 먼저 \(A\)가 \(m\times n\) 행렬이므로 \(T_A\)는 \(K^n\)으로부터 \(K^m\)으로의 선형변환이다. 그러므로 \(M(T_A)\)는 \(m\times n\) 행렬이다. 그러므로 두 행렬의 크기는 일치한다. 다음으로 두 행렬의 \(j\)째 열을 비교하면 \[(M(T_A))^j = T_A (\mathbf{e}_j) = A\mathbf{e}_j = A^j\] 이므로, 두 행렬의 \(j\)째 열이 일치한다. 그러므로 임의의 \(A\in\MatK\)에 대하여 \[M(T_A) = A\] 이다. 이로써 \(\MatK\)의 행렬 \(A\)와 \(\HomK\)의 행렬 \(T_A\)는 하나씩 대응되며, 이 대응은 두 벡터공간 사이의 동형사상이다.
지금까지 살펴본 내용을 요약하면 다음과 같다.
유한차원 벡터공간 \(K^n,\) \(K^m\) 사이에서 정의된 선형변환은 \(m\times n\) 행렬과 같은 것으로 생각할 수 있다.
정리 1을 증명할 때 사용한 동형사상은 다음과 같은 유용한 성질을 가지고 있다.
정리 2. \(m,\) \(n,\) \(p\)가 양의 정수이고 \(\newcommand{\MatKp}{\operatorname{Mat}_{n \times p}(K)}\) \(\newcommand{\HomKp}{\operatorname{Hom}(K^p ,\, K^n)}\) \[A \in \MatK ,\,\, B \in \MatKp\] 라고 하자. 그러면 \[T_{AB} = T_A \circ T_B\] 이다. 즉 두 행렬을 곱한 행렬로부터 얻어진 선형변환은 각 행렬로부터 얻어진 선형변환의 합성과 같다.
증명
\(AB\)가 \(m\times p\) 행렬이므로 \(T_{AB}\)는 \(K^p\)로부터 \(K^m\)으로의 선형변환이다. 또한 \(A\)와 \(B\)가 각각 \(m\times n \) 행렬, \(n\times p\) 행렬이므로 \(T_A\)와 \(T_B\)는 각각 \(K^n\)으로부터 \(K^m\)으로의 선형변환, \(K^p\)로부터 \(K^n\)으로의 선형변환이다. 따라서 \(T_A \circ T_B\)는 \(K^p\)로부터 \(K^m\)으로의 선형변환이다. 즉 \(T_{AB}\)의 정의역과 공역은 \(T_A \circ T_B\)의 정의역, 공역과 같다.
이제 두 함수가 일치함을 보이자. 각 \(j=1,\,2,\,\cdots,\,p\)에 대하여 \[\begin{align} T_{AB}(\mathbf{e}_j) &= (AB)\mathbf{e}_j \\[6pt] &= (AB)^j \\[6pt] &= A\cdot B^j \\[6pt] &= T_A(B^j) \\[6pt] &= T_A(B\mathbf{e}_j) \\[6pt] &= T_A(T_B(\mathbf{e}_j)) \\[6pt] &= (T_A\circ T_B)(\mathbf{e}_j) \end{align}\] 이다. 여기서 위첨자 \(j\)는 행렬의 \(j\)째 열을 나타내며 \(\mathbf{e}_j\)는 \(K^p\)의 표준기저원소 중 \(j\)째 벡터를 나타낸다. 정의역의 임의의 기저원소에 대하여 두 함수 \(T_{AB}\)와 \(T_A \circ T_B\)의 값이 일치하므로, 두 함수는 같은 함수이다.
정리 2를 사용하면 행렬의 곱셈에 대하여 결합법칙이 성립한다는 사실을 증명할 수 있다.
정리 3. \(m,\) \(n,\) \(p,\) \(q\)가 양의 정수이고 \[ A\in\operatorname{Mat}_{m\times n}(K),\,\, B\in\operatorname{Mat}_{n\times p}(K),\,\, C\in\operatorname{Mat}_{p\times q}(K) \] 라고 하자. 그러면 \[(AB)C = A(BC)\] 이다.
증명
먼저 \((AB)C\)와 \(A(BC)\)는 모두 \(m\times q\) 행렬이다. 다음으로 \(A,\) \(B,\) \(C\)에 의하여 얻어지는 선형변환을 \(T_A,\) \(T_B,\) \(T_C\)라고 하면 정리 2의결과와 함수의 합성의 결합법칙에 의하여 \[\begin{align} T_{(AB)C} &= T_{AB}\circ T_C \\[6pt] &= (T_A \circ T_B)\circ T_C \\[6pt] &= T_A \circ (T_B \circ T_C) \\[6pt] &= T_A \circ T_{BC} \\[6pt] &= T_{A(BC)} \end{align}\] 이다. 그러므로 \[(AB)C = M(T_{(AB)C}) = M(T_{A(BC)})=A(BC)\] 이다.
정리 2를 반대 방향으로 생각할 수 있다.
정리 4. \(m,\) \(n,\) \(p\)가 양의 정수이고 \(\newcommand{\MatKp}{\operatorname{Mat}_{n \times p}(K)}\) \(\newcommand{\HomKp}{\operatorname{Hom}(K^p ,\, K^n)}\) \[T_1 \in \HomKp ,\,\, T_2 \in \HomK\] 라고 하자. 그러면 \[M(T_2 \circ T_1) = M(T_2 ) M(T_1)\] 이다. 즉 두 선형변환의 합성변환의 표현행렬은 각 표현행렬을 곱한 것과 같다.
증명
선형변환의 합성은 선형변환이므로 \(T_2 \circ T_1\)은 \(K^p\)로부터 \(K^m\)으로의 선형변환이다. 따라서 \(M(T_2 \circ T_1)\)은 \(m\times p\) 행렬이다. 또한 \(M(T_2)\)와 \(M(T_1)\)은 각각 \(m\times n\) 행렬, \(n\times p\) 행렬이므로, 두 행렬의 곱 \(M(T_2)M(T_1)\)은 \(m\times p\) 행렬이다. 즉 \(M(T_2 \circ T_1)\)과 \(M(T_2)M(T_1)\)은 크기가 같은 행렬이다.
이제 이 두 행렬의 열이 모두 일치함을 보이자. 각 \(j=1,\,2,\,\cdots,\,p\)에 대하여 \[\begin{align} (M(T_2 \circ T_1))^j &= (T_2 \circ T_1)(\mathbf{e}_j) \\[6pt] &= T_2(T_1(\mathbf{e}_j)) \\[6pt] &= T_2 (M(T_1)^j) \\[6pt] &= T_2 ((M(T_1))\mathbf{e}_j) \\[6pt] &= (M(T_2))((M(T_1))\mathbf{e}_j) \\[6pt] &= (M(T_2)M(T_1))(\mathbf{e}_j) \\[6pt] &= (M(T_2)M(T_1))^j \end{align}\] 이다. 여기서 위첨자 \(j\)는 행렬의 \(j\)째 열을 나타내며 \(\mathbf{e}_j\)는 \(K^p\)의 표준기저원소 중 \(j\)째 벡터를 나타낸다. 두 행렬 \(M(T_2 \circ T_1)\)과 \(M(T_2)M(T_1)\)의 모든 열이 일치하므로, 두 행렬은 같은 행렬이다.
정리 2, 3, 4의 내용을 요약하면 다음과 같다.
행렬의 곱은 함수의 합성과 같은 것으로 생각할 수 있다.