사칙계산과 관련된 미분 법칙을 이용하면 유리함수의 미분은 할 수 있지만, 그 외의 복잡한 함수를 미분하기에는 어려움이 있다. 합성함수, 음함수, 역함수의 미분법을 이용하면 더 다양한 종류의 함수를 미분할 수 있다.
합성함수의 미분
다음과 같은 함수를 생각하자. \[h(x) = (2x+4)^3 \tag{1}\] 이 함수를 미분하고 미분계수 \(h ' (1)\)을 구해 보자. 우변을 전개하면 \[h(x) = 8x^3 + 48x^2 + 96x + 64 \] 이므로 \[h ' (x) = 24x^2 + 96x + 96\] 이고 \[h ' (1) = 24 + 96 + 96 = 216\] 이다. 하지만 (1)의 우변을 전개하지 않고 다른 방법으로 \(h(x)\)의 도함수를 구할 수 있다. \[u = f(x) = 2x+4 ,\quad y = g(u) = u^3\] 이라고 하면 \[\frac{du}{dx} = f ' (x) = 2 ,\quad \frac{dy}{du} = g ' (u) = 3u^2\] 이다. \(x=1\)의 근처에서 \(u=f(x)\)의 변화량은 \(x\)의 변화량의 \(2\)배이고, \(u = 6 = f(1)\)의 근처에서 \(y=g(u)\)의 변화량은 \(u\)의 변화량의 \(3 \times 6^2 = 108\)배이다. 그러므로 \(x=1\) 근처에서 \(y=g(f(x))\)의 변화량은 \(x\)의 변화량의 \(2 \times 108 = 216\)배이다. 이것을 식으로 나타내면 \[ \left. \frac{dy}{dx} \right\vert _{x=1} = \left. \frac{du}{dx}\right\vert_{x=1} \cdot \left. \frac{dy}{du} \right\vert_{u=f(1)}\] 즉 \[h ' (1) = f ' (1) \cdot g ' (f(1))\] 이다. 이와 같이 \(h\)가 미분 가능한 두 함수 \(f\)와 \(g\)의 합성 \(h(x) = g(f(x))\)로 정의되어 있을 때, \(h\)의 도함수는 \[h ' (x) = g ' (f(x)) f ' (x)\] 가 되는데, 이러한 미분 법칙을 연쇄 법칙(chain rule)이라고 부른다.
정리 1. (연쇄 법칙)
함수 \(u=f(x)\)가 점 \(x_0\)에서 미분 가능하고 함수 \(y = g(u)\)가 점 \(f(x_0 )\)에서 미분 가능하다고 하자. 그러면 \[y = h(x) = g(f(x))\] 로 정의된 함수 \(h\)는 점 \(x_0 \)에서 미분 가능하고 \[ (g \circ f) ' (x_0 ) = g ' (f(x_0 )) f ' (x_0 )\tag{2}\] 이 성립한다. 라이프니츠의 표기법을 이용하면 (2)는 \[\left.\frac{dy}{dx}\right\vert_{x=x_0} = \left.\frac{dy}{du}\right\vert_{u=f(x_0 )} \cdot \left.\frac{du}{dx}\right\vert_{x=x_0}\] 으로 나타낼 수 있다.
증명
\(u_0 = f(x_0 )\)이라고 하자. \(x\)의 증분을 \(\Delta x\)라고 하고, 이 증분에 따른 \(u\)와 \(y\)의 증분을 각각 \(\Delta u ,\) \(\Delta y\)라고 하자. \(f\)는 \(x_0\)에서 연속이고 \(g\)는 \(u_0 = f(x_0 )\)에서 연속이므로 \(\Delta x \to 0\)일 때 \(\Delta u \to 0 ,\) \(\Delta y \to 0\)이다.
미분소와 관련된 함숫값의 증분 공식을 이용하면 \(u\)의 증분 \(\Delta u\)에 대하여 \[\lim_{\Delta x\to 0} \epsilon_1 = 0\] 인 함수 \(\epsilon_1\)이 존재하여 \[\Delta u = f ' (x_0 ) \Delta x + \epsilon_1 \Delta x = (f ' (x_0) + \epsilon_1 )\Delta x\tag{3}\] 로 쓸 수 있다. 마찬가지로 \(y\)의 증분 \(\Delta y\)에 대하여 \[\lim_{\Delta u\to 0} \epsilon_2 =0\] 인 함수 \(\epsilon_2\)가 존재하여 \[\Delta y = g ' (u_0 ) \Delta u + \epsilon_2 \Delta u = (g ' (u_0) + \epsilon_2 )\Delta u\tag{4}\] 로 쓸 수 있다. 두 식 (3)과 (4)를 결합하면 \[\Delta y = (g ' (u_0 ) + \epsilon_2 )(f ' (x_0 ) + \epsilon_1 ) \Delta x\] 이므로 \[\begin{align} \left.\frac{dy}{dx}\right\vert_{x=x_0} &= \lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x} \\[6pt] &= \lim_{\Delta x \to 0} \frac{(g ' (u_0 ) + \epsilon_2 )(f ' (x_0 ) + \epsilon_1 ) \Delta x}{\Delta x} \\[6pt] &= \lim_{\Delta x \to 0} (g ' (u_0 ) + \epsilon_2 ) \cdot \lim_{\Delta x \to 0} (f ' (x_0 ) + \epsilon_1 ) \\[8pt] &= \lim_{\Delta u \to 0} (g ' (u_0 ) + \epsilon_2 ) \cdot \lim_{\Delta x \to 0} (f ' (x_0 ) + \epsilon_1 ) \\[8pt] &= g ' (u_0 ) \cdot f ' (x_0 ) \\[8pt] &= g ' (f(x_0 )) \cdot f ' (x_0 ) \end{align}\] 을 얻는다.
다른 방법의 증명. \(u_0 = f(x_0 )\)이라고 하자. 함수 \(g\)가 \(u_0\)에서 미분 가능하므로 함수 \(\eta\)를 다음과 같이 정의할 수 있다. \[\eta (u) = \begin{cases} \frac{g(u)-g(u_0 )}{u-u_0} - g '(u_0 ) &\quad \text{if}\,\, u \ne u_0 \\[6pt] 0 &\quad \text{if}\,\, u = u_0 \end{cases}\] \(u=f(x)\)라고 하면 다음이 성립한다. \[\begin{align} (g\circ f)(x) - (g \circ f)(x_0 ) &= g(f(x)) - g(f(x_0 )) \\[8pt] &= g(u) - g(u_0 ) \\[8pt] &= g ' (u_0 )(u-u_0 ) + (u-u_0 )\eta(u) \end{align}\] 그런데 \(\eta\)는 \(u_0\)에서 연속이므로 다음을 얻는다. \[\begin{align} (g\circ f) ' (x_0 ) &= \lim_{x\to x_0} \frac{g(f(x)) - g(f(x_0 ))}{x-x_0} \\[6pt] &= \lim_{x\to x_0}\left[g ' (f(x_0 )) \frac{f(x) - f(x_0 )}{x-x_0 } + \eta (f(x))\frac{f(x)-f(x_0 )}{x-x_0 }\right]\\[6pt] &= g ' (f(x_0 )) \lim_{x\to x_0} \frac{f(x)-f(x_0 )}{x-x_0} + \eta(u_0 ) \lim_{x\to x_0} \frac{f(x)-f(x_0 )}{x-x_0}\\[6pt] &= g ' (f(x_0 )) f ' (x_0 ). \tag*{\(\blacksquare\)} \end{align}\]
보기 1. 다음 함수의 도함수를 구해 보자. \[h(x) = \sin (2x^3 +4 ).\] \(f(x) = 2x^3 +4,\) \(g(u) = \sin u\)라고 하면 \(h(x) = g(f(x))\)이므로 \[\begin{align} h ' (x) &= g ' (f(x)) \cdot f ' (x) \\[8pt] &= \cos (f(x)) \cdot (6x^2 ) \\[8pt] &= \cos(2x^3 +4) \cdot (6x^2 ). \tag*{\(\square\)} \end{align}\]
공식 (2)는 (바깥 미분)×(속 미분)이라고 기억하면 편리하다. 특히 세 개 이상의 함수를 합성하여 만든 함수를 미분할 때에도 이 공식을 그대로 사용할 수 있다. 예컨대 \[h(x) = k(g(f(x)))\] 일 때 \[h ' (x) = k ' (g(f(x))) \cdot g ' (f(x)) \cdot f ' (x)\tag{5}\] 이다.
보기 2. 다음 함수의 도함수를 구해 보자. \[f(x) = \cos^3 ( 4x^2 -x+7).\] 이 함수는 다음과 같은 세 개의 함수 \[\begin{align} y &= u^3 ,\\[8pt] u &= \cos t ,\\[8pt] t &= 4x^2 -x+7 \end{align}\] 이 합성된 것으로 볼 수 있다. 그러므로 연쇄 법칙에 의하여 \[\begin{align} f ' (x) &= \frac{dy}{dx} \\[6pt] &= \frac{dy}{du} \cdot \frac{du}{dt} \cdot \frac{dt}{dx} \\[6pt] &= 3u^2 \cdot (-\sin t) \cdot (8x-1) \\[8pt] &= - 3 \cos^2 (4x^2 -x+7) \cdot \sin(4x^2 -x+7) \cdot (8x-1).\tag*{\(\square\)} \end{align}\]
음함수의 미분
함수 \(y=f(x)\)의 두 변수 \(x\)와 \(y\)가 다음 등식을 만족시킨다고 하자. \[y^2 =x.\tag{6}\] 이때 \(f\)의 도함수를 구해보자. (6)을 만족시키는 함수는 \(f(x) = \sqrt{x}\)일 수도 있고 \(f(x) = -\sqrt{x}\)일 수도 있다. 두 함수를 구분하기 위하여 \[\begin{align} f_1 (x) &= \sqrt{x}, \\[8pt] f_2 (x) &= - \sqrt{x} \end{align}\] 라고 하자. 이 두 함수의 도함수는 \[\begin{align} f_1 ' (x) &= \frac{1}{2\sqrt{x}}, \\[6pt] f_2 ' (x) &= -\frac{1}{2\sqrt{x}} \end{align}\] 이다. 그런데 이 두 도함수를 구한 것만으로는 \(f\)의 도함수를 구했다고 할 수 없다. 왜냐하면 (6)을 만족시키는 함수는 \(f_1\)과 \(f_2\) 외에도 무수히 많기 때문이다. 예컨대 \[f_3 (x) = \begin{cases} \sqrt{x} \quad&\text{if}\,\, x > \pi ,\\[8pt] -\sqrt{x} \quad&\text{if}\,\, 0 \le x \le \pi \end{cases}\] 는 (6)을 만족시키는 또다른 함수이다.
대신 다른 방법을 이용하여 \(f\)의 도함수를 구해 보자. (6)에서 주어진 식 \[y^2 = x\] 의 양변을 \(x\)에 대하여 미분한다. 여기서 좌변은 연쇄 법칙을 이용하여 미분한다. 그러면 \[2y \frac{dy}{dx} = 1\] 이므로 \[\frac{dy}{dx} = \frac{1}{2y} = \frac{1}{2f(x)} \tag{7}\] 을 얻는다. 비록 이 식은 \(x\)에 대한 식이 아니지만, (6)을 만족시키는 함수 \(f\)가 주어질 때마다 (7)에 대입하여 \(f\)에 대응되는 도함수를 얻는다. 그러므로 (7)은 (6)을 만족시키는 모든 \(f\)의 도함수를 구한 것이라 할 수 있다.
이처럼 함수 \(f\)가 \(y=f(x)\)의 꼴로 주어져 있을 때, ‘\(f\)는 양적으로 정의되었다’라고 하고, \(y=f(x)\)의 꼴로 정의된 함수를 양함수(explicit function)라고 부른다. 반면에 (6)처럼 함수 \(f\)가 \(F(x,\,y)=0\) 또는 이와 동치인 꼴로 정의되었을 때 ‘\(f\)는 음적으로 정의되었다’라고 하고, 이와 같이 정의된 함수를 음함수(implicit function)라고 부른다. 양함수를 드러난 함수라고 부르기도 하고, 음함수를 숨은 함수라고 부르기도 한다.
음함수 미분법
함수 \(y=f(x)\)가 \(F(x,\,y)=0\)과 같이 음적으로 정의되었을 때, \(f\)의 도함수는 다음과 같이 구한다.
- \(F(x,\,y)=0\)의 양변을 \(x\)에 대하여 미분한다. 이때 \(y\)를 \(x\)의 함수로 보고 연쇄 법칙을 이용하여 미분한다.
- 미분한 식을 \(dy/dx\)에 대하여 푼다.
도형의 방정식을 공부하며 배웠던 원의 접선의 방정식은 음함수 미분법을 이용하여 구할 수도 있다.
보기 3. \(r > 0\)일 때, 방정식 \[x^2 + y^2 = r^2\tag{8}\] 으로 표현되는 원 위의 점 \((x_1 ,\,y_1)\)에서 접선의 방정식을 구해보자.
음함수 미분법을 이용하여 (8)을 미분하면 \[2x + 2y \frac{dy}{dx} =0\] 이므로 \(y_1 \ne 0\)일 때 \[\left.\frac{dy}{dx}\right\vert_{(x,\,y)=(x_1 ,\, y_1 )} = -\frac{x_1}{y_1}\] 이다. 그러므로 원 위의 점 \((x_1 ,\,y_1)\)에서 이 원에 접하는 직선의 방정식은 \[y=-\frac{x_1}{y_1}(x-x_1 ) + y_1\] 즉 \[xx_1 + yy_1 = x_1 ^2 +y_1 ^2 \] 이다. 여기에 \(x_1^2 + y_1^2 = r^2\)을 대입하면 구하는 접선의 방정식은 \[xx_1 + yy_1 = r^2\tag{9}\] 이다. 한편 \(y=0\)일 때에는 \(x\)를 \(y\)의 함수로 보고 음함수 미분법을 이용하여 (8)을 미분하면 \[2x\frac{dx}{dy} + 2y =0\] 이므로 \[\left.\frac{dx}{dy}\right\vert_{(x,\,y)=(x_1,\,y_1)} = -\frac{y_1}{x_1}\] 을 얻으며, 이 미분계수를 이용하여 접선의 방정식을 구하면 앞에서와 마찬가지로 (9)를 얻는다.
음함수 미분법을 이용하여 이계도함수를 구할 수도 있다.
보기 4. \(x\)와 \(y\)가 다음과 같은 관계를 가지고 있을 때 이계도함수 \(d^2 y / dx^2\)를 구해 보자. \[2x^3 - 3y^2 = 8\] 먼저 도함수는 다음과 같다. \[\begin{align} \frac{d}{dx} (2x^3 - 3y^2 ) &= \frac{d}{dx}(8), \\[6pt] 6x^2 - 6yy ' &= 0, \\[6pt] y ' &= \frac{x^2}{y} . \quad(\text{when}\,\, y \ne 0) \end{align}\] 양변을 \(x\)에 대하여 한 번 더 미분하여 이계도함수를 구하면 \[y ' ' = \frac{d}{dx} \left( \frac{x^2}{y} \right) = \frac{2xy - x^2 y ' }{y^2} = \frac{2x}{y} - \frac{x^2}{y^2} y \] 이다. 그런데 \(y ' = x^2 / y\)이므로 위 식은 다음과 같이 쓸 수 있다. \[y ' ' = \frac{2x}{y} - \frac{x^2}{y^2} \left( \frac{x^2}{y}\right) = \frac{2x}{y} - \frac{x^4}{y^3}. \quad (\text{when}\,\,y\ne 0)\]
(Thomas' Calculus International Edition 13판 3.7절에서 발췌함.)
주의. 음함수 미분법은 음적으로 정의된 함수가 미분 가능하다는 가정 하에 도함수를 계산하는 방법을 제공한다. 음함수 미분법을 이용하여 \(f\)의 도함수를 구했다 하더라도 \(f\)의 미분 가능성은 보장할 수 없다. 예컨대 \[f(x) = \begin{cases} \sqrt{x} &\quad\text{if} \,\, x\in [0,\,\infty )\cap \mathbb{Q} \\[8pt] -\sqrt{x} &\quad\text{if} \,\, x\in [0,\,\infty )\setminus \mathbb{Q} \end{cases}\] 라고 하면 \(y=f(x)\)의 변수 \(x,\) \(y\)는 \[y^2 = x\] 를 만족시키므로 음함수 미분법을 이용하여 도함수를 구할 수 있을 것처럼 보이지만 \(f\)는 어느 곳에서도 미분 가능하지 않다.
역함수의 미분
함수 \(y=\sqrt{x}\)의 도함수는 \[y ' = \frac{1}{2\sqrt{x}}\] 이다. 그런데 \(y=\sqrt{x}\)는 \(y=f(x)=x^2\,\, (x\ge 0)\)의 역함수이다. \((a ,\,b)\)가 함수 \(y=f(x)\)의 그래프 위의 점이면 \((b ,\,a)\)는 함수 \(y=f^{-1}(x)=\sqrt{x}\)의 그래프 위의 점이다. \(f ' (x) = 2x\)이므로 \(x=a\)일 때 \(y=x^2\)의 미분계수는 \(f ' (a ) = 2a\)이며, 함수의 그래프와 역함수의 그래프는 직선 \(y=x\)에 대하여 대칭이므로, \(x=b\)에서 \(y= f^{-1} (x) = \sqrt{x}\)의 미분계수는 \[\frac{1}{f ' (a )} = \frac{1}{2a} = \frac{1}{2\sqrt{b}}\] 이 된다. 이로써 \[(f^{-1}) ' (b) = \frac{1}{f ' (a ) } = \frac{1}{f ' (f^{-1}(b ))}\] 을 얻는다.
이러한 역함수의 미분 공식은 다음과 같이 일반화될 수 있다.
정리 2. (역함수 미분법)
함수 \(f\)가 점 \(a\)를 원소로 갖는 한 열린 구간 \(I\)에서 연속이고 일대일이며 \(a\)에서 미분 가능하고 \(f ' (a) \ne 0\)이라고 하자. 또한 \(I\)에서 \(f\)의 치역을 \(J\)라고 하고 \(b = f(a)\)라고 하자. 그러면 \(f^{-1} : J \to I\)는 \(b\)에서 미분 가능하고 \[ (f^{-1})' (b) = \frac{1}{f ' (f^{-1} (b))}\tag{10}\] 이 성립한다. 라이프니츠 표기법을 이용하여 이 식을 표현하면 \[\left.\frac{df^{-1}}{dx}\right\vert_{x=b} = \frac{1}{\left.\frac{df}{dx}\right\vert_{x=f^{-1}(b)}}\] 이다.
증명
\(f^{-1}\)가 \(J\)에서 일대일이므로 \(x \ne b\)일 때 \(f^{-1}(x) \ne f^{-1}(b)\)이다. 더욱이 \(x \ne b\)인 임의의 \(x\in J\)에 대하여 \(f(y)=x\)인 \(y\in I\)가 유일하게 존재하며, \(f(y) \ne f(a)\)를 만족시킨다. 그러므로 다음을 얻는다. \[\begin{align} (f^{-1})' (b) &= \lim_{x\to b}\frac{f^{-1} (x) -f^{-1}(b)}{x-b} \\[6pt] &= \lim_{y\to a}\frac{y-a}{f(y)-f(a)} \\[6pt] &= \lim_{y\to a}\frac{1}{\frac{f(y)-f(a)}{y-a}} \\[6pt] &= \frac{1}{f ' (a)} \\[6pt] &= \frac{1}{f ' ( f^{-1} (b))}. \tag*{\(\blacksquare\)} \end{align}\]
보기 5. 지수함수 \(f(x)=e^x\)의 도함수가 \(f ' (x)=e^x\)이라는 사실을 이용하여 로그함수 \(f^{-1} (x) = \ln x\)의 도함수를 구하면 다음과 같다. \[ \frac{d}{dx} \ln x = (f^{-1}) ' (x) = \frac{1}{f ' (f^{-1} (x))} = \frac{1}{e^{\ln x}} = \frac{1}{x}.\tag*{\(\square\)}\]
보기 5의 로그함수는 음함수 미분법을 이용하여 다음과 같이 미분할 수도 있다. \[\begin{align} y &= \ln x, \\[6pt] e^y &= x, \\[6pt] \frac{d}{dx}(e^y) &= \frac{d}{dx}x,\\[6pt] e^y \frac{dy}{dx} &= 1, \\[6pt] \frac{dy}{dx} &= \frac{1}{e^y} = \frac{1}{x}. \end{align}\] 하지만 이 방법에는 한 가지 문제점이 있다. 음함수 미분법을 이용하여 역함수의 도함수를 구하는 경우 역함수의 도함수의 식을 구할 수 있을 뿐 역함수의 미분 가능성은 보장하지 않는다는 점이다. 그러므로 음함수 미분법을 이용하여 역함수를 미분할 때에는 역함수가 미분 가능한지 여부도 따져야 한다.
보기 6. 정의역이 \([-\pi/2 ,\, \pi/2]\)일 때 \(f(x) = \sin x\)는 일대일 함수이다. \(f ' (x) = \cos x\)라는 사실을 이용하여 \(f\)의 역함수 \[f^{-1} (x)= \sin^{-1} x \quad (-1\le x \le 1)\] 의 도함수를 구해 보자. \(x=-\pi/2\) 또는 \(x = \pi/2\)일 때 \(f ' (x) = 0\)이므로, \(x=-1\) 또는 \(x=1\)일 때 \(f^{-1}\)의 미분계수는 존재하지 않는다. \(-1 < x < 1\)일 때에는 \(f^{-1}\)는 미분 가능하며 \[\begin{align} (f^{-1})'(x) &= \frac{1}{f ' (f^{-1} (x))} \\[6pt] &= \frac{1}{\cos(\sin^{-1} x)} \\[6pt] &= \frac{1}{\sqrt{1-\sin^2 (\sin^{-1} x)}} \\[6pt] &= \frac{1}{\sqrt{1-x^2}} \end{align}\] 즉 \[\frac{d}{dx}\sin^{-1} x = \frac{1}{\sqrt{1-x^2}} \quad (\lvert x \rvert < 1)\] 이다.