함수 \(y=f(x)\)의 그래프가 뾰족한 부분이 없고 매끄럽게 이어져 있을 때 그래프 위의 한 점에서 접선을 생각할 수 있다. 이 접선의 기울기는 접점 근처에서 \(x\)의 변화량과 \(y\)의 변화량의 비의 극한값으로 구할 수 있다. 이러한 개념을 일반화하여 미분을 정의할 수 있다.
이 포스트에서는 실숫값 함수의 미분을 정의하고 그 성질을 살펴본다.
미분의 정의
함수 \(f\)가 서로 다른 두 점 \(a,\) \(b\)를 원소로 갖는 구간에서 정의되어 있다고 하자. 이 때 \[\frac{f(b)-f(a)}{b-a}\tag{1}\] 를 \(x\)가 \(a\)에서 \(b\)까지 변하는 동안 \(f\)의 평균변화율이라고 부른다. 이 평균변화율은 함수 \(f\)의 그래프 위의 두 점 \((a,\,f(a)),\) \((b,\,f(b))\)를 지나는 할선의 기울기와 같다.
함수 \(f\)가 점 \(x_0\)을 원소로 갖는 한 열린 구간 \(I\)에서 정의되어 있고 \(h \ne 0\)이며 \(x_0 +h\in I\)라고 하자. 이 때 \[\frac{f(x_0 +h)-f(x_0 )}{h}\tag{2}\] 을 점 \(x_0\)에서 증분 \(h\)에 대한 \(f\)의 차분몫이라고 부른다. \(h\)의 값이 \(0\)에 가까우면 이 차분몫은 \(x_0\) 근처에서 \(f\)의 값이 얼마나 빠르게 변화하는지를 나타낸다.
차분몫 식 (2)에서 \(x_0\)을 \(a\)로 바꾸고 \(h\)를 \(b-a\)로 바꾸면 평균변화율 식 (1)이 된다. 이처럼 평균변화율과 차분몫은 비슷한 식이지만, 평균변화율은 두 점 \(a,\) \(b\) 모두에 관심을 갖는 반면 차분몫은 한 점 \(x_0\)에 관심을 가진다는 점에서 쓰임새가 다르다.
정의 1. (미분계수)
함수 \(f\)가 \(x_0\)을 원소로 갖는 한 열린 구간에서 정의되었다고 하자. 만약 극한 \[\lim_{h\to 0}\frac{f(x_0 +h) - f(x_0 )}{h}\tag{3}\] 이 존재하면(수렴하면), 이 극한값을 \(x_0\)에서 \(f\)의 미분계수(derivative)라고 부르고 \(f ' (x_0 )\)으로 나타낸다. 또한 점 \(x_0\)에서 위 극한이 존재할 때 ‘\(f\)는 \(x_0\)에서 미분 가능하다’라고 표현한다.
미분계수의 정의에서 식 (3)은 다음과 같이 써도 된다. \[\lim_{t\to x_0}\frac{f(x_0 ) - f(t)}{x_0 - t}\] 즉 미분계수는 차분몫의 극한으로 표현할 수도 있고 평균변화율의 극한으로 표현할 수도 있다.
다항함수와 같이 간단한 함수는 정의를 이용하여 미분계수를 직접 구할 수 있다.
보기 1. 함수 \(f(x) = x^2\)에 대하여 미분계수 \(f ' (0) ,\) \(f ' (1),\) \(f ' (2)\)를 구해 보자.
식 (3)에 \(f(x) =x^2 ,\) \(x_0 =0\)을 대입하면 \[\lim_{h\to 0} \frac{f(0+h)-f(0)}{h} = \lim_{h\to 0} \frac{(0+h)^2 - 0^2}{h} = \lim_{h\to 0} \frac{h^2}{h} = 0\] 으로서 극한값이 존재하므로 \(f\)는 \(0\)에서 미분 가능하고 \(f ' (0) =0 \)이다.
같은 방법으로 \[\begin{align} f ' (1) &= \lim_{h\to 0}\frac{f(1+h)-f(1)}{h} = \lim_{h\to 0}\frac{(1+h)^2 -1^2}{h} = \lim_{h\to 0}\frac{2h + h^2}{h} =2 ,\\[6pt] f ' (2) &= \lim_{h\to 0}\frac{f(2+h)-f(2)}{h} = \lim_{h\to 0}\frac{(2+h)^2 -2^2}{h} = \lim_{h\to 0}\frac{4h + h^2}{h} =4 \end{align}\] 이므로 \(f\)는 \(1,\) \(2\)에서 각각 미분 가능하고, 이 두 점에서 미분계수는 \(f ' (1) = 2,\) \(f ' (2) = 4\)이다.
보기 1에서 세 미분계수 \(f ' (0),\) \(f ' (1),\) \(f ' (2)\)의 값을 구하였다. 만약 \(f\)가 미분 가능한 점 \(x\)에 대하여 \(f ' (x)\)를 생각한다면, 이 식은 \(x\)를 미분계수 \(f ' (x)\)에 대응시키는 함수가 된다. 이러한 함수를 \(f\)의 도함수라고 부른다.
정의 2. (도함수)
함수 \(f\)가 미분 가능한 점들의 집합을 \(D\)라고 하자. 이 때 각 점 \(x \in D\)를 미분계수 \(f ' (x)\)에 대응시키는 함수 \[f ' : D \,\to\, \mathbb{R}\] 를 \(f\)의 도함수라고 부른다.
\(f\)의 도함수를 구하는 것을 ‘\(f\)를 미분한다’라고 말한다. 즉 다음 두 표현은 같은 의미이다.
- \(f\)의 도함수를 구한다.
- \(f\)를 미분한다.
함수 \(y=f(x)\)의 도함수를 나타내는 기호는 무척 다양한데, 그 중 자주 사용되는 것 몇 개를 추려보면 다음과 같다. \[ f ' (x) ,\,\,\, \frac{d}{dx}f(x) ,\,\,\, \frac{df(x)}{dx} ,\,\,\, \frac{df}{dx}(x) ,\,\,\, \frac{dy}{dx} ,\,\,\, \frac{d}{dx} y ,\,\,\, Df(x) ,\,\,\, y ' ,\,\,\, \dot{y} ,\,\,\, \cdots \] 만약 도함수 \(\frac{dy}{dx}\)에 \(x=x_0\)을 대입한 식(미분계수)을 나타내고 싶으면 다음과 같은 기호를 사용한다. \[\left. \frac{dy}{dx} \right|_{x=x_0}\]
보기 2. 정의역이 \([0,\, \infty )\)인 함수 \(g(x) = \sqrt{x}\)의 도함수와 미분계수 \(g ' (4)\)를 구해 보자.
\(x > 0\)일 때 \(g\)의 미분계수는 \[\begin{align} g ' (x) &= \lim_{h\to 0}\frac{g(x+h)-g(x)}{h} \\[6pt] &= \lim_{h\to 0}\frac{\sqrt{x+h} - \sqrt{x}}{h} \\[6pt] &= \lim_{h\to 0}\frac{(\sqrt{x+h} - \sqrt{x})(\sqrt{x+h}+\sqrt{x})}{h(\sqrt{x+h}+\sqrt{x})} \\[6pt] &= \lim_{h\to 0}\frac{h}{h(\sqrt{x+h}+\sqrt{x})} \\[6pt] &= \lim_{h\to 0}\frac{1}{\sqrt{x+h}+\sqrt{x}} \\[6pt] &= \frac{1}{2\sqrt{x}} \end{align}\] 이다. 한편 \[\lim_{h\to 0}\frac{g(0+h)-g(0)}{h} =\lim_{h\to 0^+}\frac{\sqrt{h}}{h} =\infty\tag{4}\] 이므로 \(g\)는 \(0\)에서 미분 가능하지 않다.
그러므로 \(g\)의 도함수 \(g ' \)의 정의역은 모든 양수의 집합 \(\mathbb{R}^+\)이며 \[g ' (x) = \frac{1}{2\sqrt{x}}\] 이다. 한편 \(4\)에서 \(g\)의 미분계수는 \[g ' (4) = \left. \frac{1}{2\sqrt{x}} \right|_{x=4} = \frac{1}{2\sqrt{4}} = \frac{1}{4}\] 이다.
위 보기에서 보다시피 도함수의 정의역은 원래 함수의 부분집합이다. 즉 \[\operatorname{dom} (f ' ) \subseteq \operatorname{dom} (f)\] 이다.
좌미분계수와 우미분계수
보기 2에서 \(g\)의 정의역이 \([0,\,\infty )\)이므로 \(0\)에서 \(g\)의 미분계수를 구하기 위하여 식 (4)와 같이 \(0\)에서 우극한을 계산하였다. 즉 정의 1에서는 점 \(x_0\)에서 함수 \(f\)의 미분계수를 정의할 때에는 \(f\)가 \(x_0\)를 원소로 갖는 열린 구간에서 정의된다는 조건을 넣었지만, 이 조건은 다음과 같이 약화될 수 있다.
정의 3. (좌미분계수와 우미분계수)
함수 \(f\)가 점 \(x_0\)을 원소로 갖는 집합에서 정의되었다고 하자.
- 만약 극한 \[\lim_{h\to 0^-}\frac{f(x_0 +h)-f(x_0 )}{h}\] 이 존재하면, 이 극한값을 \(x_0\)에서 \(f\)의 좌미분계수라고 부르고 \(f_l ' (x_0 )\)으로 나타낸다.
- 만약 극한 \[\lim_{h\to 0^+}\frac{f(x_0 +h)-f(x_0 )}{h}\] 이 존재하면, 이 극한값을 \(x_0\)에서 \(f\)의 우미분계수라고 부르고 \(f_r ' (x_0 )\)으로 나타낸다.
- 만약 \(x_0\)이 \(f\)의 정의역의 왼쪽 끝점이면 \(x_0\)에서 \(f\)의 미분계수는 우미분계수로 정의한다. 마찬가지로 만약 \(x_0\)이 \(f\)의 정의역의 오른쪽 끝점이면 \(x_0\)에서 \(f\)의 미분계수는 좌미분계수로 정의한다.
주의. 함수의 좌미분계수와 도함수의 좌극한은 다른 개념이며, 함수의 우미분계수와 도함수의 우극한은 다른 개념이다. 예컨대 함수 \(f : \mathbb{R} \to \mathbb{R}\)를 \[f(x) = \begin{cases} x^2 \sin \frac{1}{x} &\quad \text{if} \,\, x\ne 0 \\[6pt] 0 &\quad \text{if} \,\, x=0 \end{cases}\] 이라고 하면 \(f\)는 \(0\)에서 미분 가능하고 \(0\)에서 \(f\)의 미분계수, 좌미분계수, 우미분계수 모두 \(0\)이다. 즉 \[f ' (0) = f_l ' (0) = f_r ' (0) =0\] 이다. 그러나 \(x \ne 0\)일 때 \[f ' (x) = 2x \sin \frac{1}{x} - \cos \frac{1}{x}\] 이므로 \(x\to 0^+\) 또는 \(x\to 0^-\)일 때 \(f ' (x)\)는 수렴하지 않는다.
참고. 책에 따라서는 ‘닫힌 구간에서의 도함수’를 따로 정의하기도 한다. 즉 함수 \(f : D \to \mathbb{R}\)의 정의역 \(D\)가 길이가 양수인 닫힌 구간 \([a,\,b]\)를 포함할 때 ‘\([a,\,b]\)에서 \(f\)의 도함수’를 \[f ' (x) = \begin{cases} f_r (a) &\quad\text{if}\,\, x=a \\[8pt] f(x) &\quad\text{if}\,\,a < x < b \\[8pt] f_l (b) &\quad\text{if}\,\, x=b \end{cases}\] 로 정의하기도 한다. 이와 같이 정의하면 \(a,\) \(b\)에서 \(f\)가 미분 불가능하지만 \([a,\,b]\)에서 \(f\)의 도함수가 존재하는 경우가 있다. 예컨대 함수 \(f : \mathbb{R} \to \mathbb{R}\)를 \[f(x) = \begin{cases} x &\quad\text{if}\,\, -3\le x^2\le 3 \\[8pt] 0 &\quad\text{otherwise} \end{cases}\] 으로 정의하면 \(f\)는 \(-3,\) \(3\)에서 미분 불가능하지면 \([-3,\,3]\)에서 \(f\)의 도함수는 \(f ' (x) = 2x\)이다.
미분 가능성과 연속성의 관계
직관적으로 함수 \(f\)가 점 \(x_0\)에서 미분 가능하다는 것은 \(x=x_0\)일 때 \(f\)의 그래프의 접선의 기울기를 구할 수 있다는 것을 의미하므로, \(f\)의 그래프는 점 \((x_0 ,\, f(x_0 ))\)에서 끊어지지 않고 매끄럽게 이어져 있어야 한다. 이것을 논리적으로 증명해 보자.
정리 1. (미분 가능성과 연속성의 관계)
함수 \(f\)가 점 \(x_0\)에서 미분 가능하면 \(f\)는 \(x_0\)에서 연속이다.
증명
\(f\)가 \(x_0\)에서 미분 가능하므로 \[\lim_{x\to x_0}\frac{f(x) - f(x_0)}{x-x_0} = f ' (x_0 )\] 이다. 따라서 \[\begin{align} \lim_{x\to x_0} f(x) &= \lim_{x\to x_0} (f(x) - f(x_0 ) + f(x_0 )) \\[6pt] &= \lim_{x\to x_0} (f(x) - f(x_0)) + f(x_0) \\[4pt] &= \lim_{x\to x_0} \frac{f(x) - f(x_0)}{x-x_0} (x-x_0 ) + f(x_0) \\[4pt] &= \lim_{x\to x_0} \frac{f(x) - f(x_0)}{x-x_0} \cdot \lim_{x\to x_0} (x-x_0 ) + f(x_0) \\[6pt] &= f ' (x_0 ) \cdot 0 + f(x_0) = f(x_0) \end{align}\] 이므로 \(x_0\)에서 \(f\)의 극한값과 함숫값이 같다. 즉 \(f\)는 \(x_0\)에서 연속이다.
주의. 정리 1과 관련하여 다음 사실에 주의해야 한다.
- 정리 1의 역은 성립하지 않는다. 즉 \(f\)가 \(x_0\)에서 연속일지라도 \(f\)는 \(x_0\)에서 미분 가능하지 않을 수 있다. 예컨대 \(f(x) = \lvert x \rvert\)이라고 하면 \(f\)는 \(0\)에서 연속이지만 \(0\)에서 미분 불가능하다. [사실 \(\mathbb{R}\)에서 연속이지만 \(\mathbb{R}\)의 임의의 점에서 미분 불가능한 함수가 존재한다. 바이어슈트라스 함수(Weierstrass function)를 찾아보라.]
- \(f\)가 \(x_0\)을 원소로 갖는 열린구간에서 미분 가능할지라도 \(f ' \)은 \(x_0\)에서 연속이 아닐 수 있다. 예컨대 함수 \(f : \mathbb{R} \to \mathbb{R}\)를 \[f(x) = \begin{cases} x^2 \sin \frac{1}{x} &\quad \text{if} \,\, x\ne 0 \\[6pt] 0 &\quad \text{if} \,\, x=0 \end{cases}\] 이라고 정의하면 \(f\)는 \(\mathbb{R}\)에서 미분 가능하지만 \(f ' \)은 \(0\)에서 불연속이다.
고계도함수
함수 \(f\)가 미분 가능하고 그 도함수 \(f ' \)도 미분 가능할 때 도함수의 도함수를 구할 수 있는데 이 함수를 이계도함수라고 부른다. 즉 함수 \(f\)가 두 번 미분 가능한 점들의 집합을 \(D\)라고 할 때, \(f\)의 이계도함수는 임의의 \(x\in D\)에 대하여 \[f ' ' (x) = \frac{d}{dx} f ' (x)\] 로 정의된 함수이다. 함수 \(y=f(x)\)의 이계도함수를 나타내는 기호는 다음과 같은 것들이 있다. \[f ' ' (x) ,\,\,\, \frac{d^2}{dx^2} f(x) ,\,\,\, \frac{d^2 f(x)}{dx^2} ,\,\,\, \frac{d^2 f}{dx^2} (x) ,\,\,\, \frac{d^2 y}{dx^2} ,\,\,\, \frac{d^2}{dx^2} y ,\,\,\, D^2 f(x) ,\,\,\, y ' ' ,\,\,\, \ddot{y} ,\,\,\, \cdots\] 비슷하게, \(n\)이 \(2\) 이상인 자연수이고 \(f\)가 \(n\)번 미분 가능한 점들의 집합을 \(D\)라고 할 때, \(f\)의 \(n\)계도함수는 임의의 \(x\in D\)에 대하여 \[f^{(n)} (x) = \frac{d}{dx} f^{(n-1)}(x)\] 로 정의된 함수이다. 함수 \(y=f(x)\)의 \(n\)계도함수를 나타내는 기호는 다음과 같은 것들이 있다. \[f^{(n)} (x) ,\,\,\, \frac{d^n}{dx^n} f(x) ,\,\,\, \frac{d^n f(x)}{dx^n} ,\,\,\, \frac{d^n f}{dx^n} (x) ,\,\,\, \frac{d^n y}{dx^n} ,\,\,\, \frac{d^n}{dx^n} y ,\,\,\, D^n f(x) ,\,\,\, y^{(n)} ,\,\,\, \cdots\] \(I\)가 \(\mathbb{R}\)의 부분집합이고 \(n\)이 자연수라고 하자. \(I\)의 모든 점에서 \(n\)번 미분 가능한 함수들의 모임을 \(D^n (I)\)로 나타내며, 특히 \(I\)에서 미분 가능한 함수들의 모임 \(D^1 (I)\)를 간단히 \(D(I)\)로 나타낸다. 또한 \(D^n (I)\)에 속하는 함수 중에서 \(n\)계도함수가 연속인 함수들의 모임을 \(C^n (I)\)로 나타낸다. 특히 \(C^0 (I)\)는 \(I\)에서 연속인 함수들의 모임을 나타내며, 간단히 \(C (I)\)로 나타낸다.
\(f\in C^1 (I)\)일 때 ‘\(f\)는 \(I\)에서 연속인 도함수를 가진다’ 또는 ‘\(f\)는 \(I\)에서 매끄러운 함수(smooth function)이다’ 또는 ‘\(f\)는 \(C^1\)급이다’라고 표현한다. 또한 \(f\in C^n (I)\)일 때 ‘\(f\)는 \(I\)에서 연속인 \(n\)계도함수를 가진다’ 또는 ‘\(f\)는 \(C^n\)급이다’라고 표현한다. 책에 따라서는 \(f\in C^1 (I)\)인 것을 ‘\(f\)는 \(I\)에서 연속적으로 미분 가능하다(continuously differentiable)’라고 표현하기도 한다.
정의에 의하면 \[C(I) \subsetneq D(I) \subsetneq C^1 (I) \subsetneq D^2 (I) \subsetneq C^2 (I) \subsetneq D^3 (I) \subsetneq C^3 (I) \subsetneq \cdots \] 이다. 한편 \(I\)에서 임의 횟수로 미분 가능한 함수들의 모임을 \(C^{\infty} (I)\) 또는 \(D^{\infty} (I)\)로 나타낸다. 정의에 의하면 임의의 자연수 \(n\)에 대하여 \[D^n (I) \subsetneq C^n (I) \subsetneq D^{\infty} (I) = C^{\infty} (I)\] 이다. (참고로 \(I\)에서 임의 횟수로 미분 가능한 함수들의 모임을 나타낼 때 \(D^{\infty}(I)\)보다 \(C^{\infty}(I)\)를 더 많이 사용한다.)
예제 3. 돛이 없는 유선형 배에 돛을 다는 수학적인 방법을 구하시오.
정답. “미분한다.”
풀이. 주어진 배를 \(s\)라고 하자. 그러면 \(s\)는 유선형이므로 매끄럽다. 따라서 \(s\)는 미분 가능하다. \(s\)를 미분하면 \(\dot{s}\)로서 \(s\)에 돛(dot)이 달린다. 그러므로 정답은 “미분한다”이다.
예제 4. 구형 휴대전화 ‘옵티머스’를 살아 움직이게 만드는 수학적인 방법을 구하시오.
정답. “미분한다.”
풀이. ‘옵티머스’를 미분하면 ‘옵티머스 프라임’이 되어 살아 움직이게 된다. (단, 우주로 날아갈 수도 있으니 주의할 것.)