이차함수 \(y=ax^2 + bx +c\)의 그래프는 \(a > 0\)일 때 아래쪽으로 볼록하고 \(a < 0\)일 때 위쪽으로 볼록하다. 사인이나 코사인의 경우에는 \(x\)의 값이 커짐에 따라 함수의 그래프가 볼록한 방향이 위쪽과 아래쪽으로 번갈아가면서 나타난다. 이와 같은 그래프의 볼록성은 그래프의 모양을 관찰하면 알 수 있다. 하지만 그래프를 그리지 않더라도 도함수를 이용하여 함수의 그래프의 볼록성을 조사할 수 있다.
이 포스트에서는 함수의 그래프의 볼록성을 정의하고 그와 관련된 성질을 살펴본다.
볼록성의 정의
함수의 그래프의 볼록성을 정의하는 방법은 몇 가지가 있다. 여기서는 비교적 엄밀한 방법으로 볼록성을 정의한다.
정의 1. (함수의 볼록성)
\(I\)가 공집합이 아닌 구간이고 \(f\)가 \(I\)에서 정의된 실숫값 함수라고 하자.
- \(0 \le \alpha \le 1\)인 임의의 \(\alpha\)와 \(I\)의 임의의 점 \(x,\) \(y\)에 대하여 \[f(\alpha x + (1-\alpha )y ) \le \alpha f(x) + (1-\alpha )f(y)\] 가 성립하면 ‘\(f\)는 \(I\)에서 볼록하다(convex)’ 또는 ‘\(f\)의 그래프는 \(I\)에서 아래쪽으로 볼록하다’라고 말한다. 정의역이 구간인 함수가 정의역에서 아래쪽으로 볼록할 때 그 함수를 볼록함수라고 부른다.
- \((-f)\)가 \(I\)에서 볼록하면 ‘\(f\)의 그래프는 \(I\)에서 위쪽으로 볼록하다(concave)’라고 말한다.
‘\(f\)의 그래프가 \(I\)에서 아래쪽으로 볼록하다’를 간단히 ‘\(f\)가 \(I\)에서 볼록하다’라고 표현하며, ‘\(f\)의 그래프가 \(I\)에서 위쪽으로 볼록하다’를 간단히 ‘\(f\)가 \(I\)에서 오목하다’라고 표현한다.
정의에 의하면 \(f\)가 구간 \(I\)에서 볼록할 필요충분조건은 \(f\)가 \(I\)의 임의의 부분구간에서 볼록한 것이다. 또한 일차함수의 그래프는 구간에서 아래쪽으로 볼록한 동시에 위쪽으로 볼록하다.
\(f\)의 그래프가 위쪽으로 볼록할 필요충분조건은 \((-f)\)의 그래프가 아래쪽으로 볼록한 것이므로, 함수의 볼록성에 대하여 논할 때에는 볼록함수(그래프가 아래쪽으로 볼록한 함수)에 대해서만 논해도 충분하다.
정리 1. (볼록성의 기하학적 정의)
함수 \(f\)가 구간 \(I\)에서 볼록함수일 필요충분조건은 \(I\)의 임의의 부분구간 \(\)에 대하여, 좌표평면에서 두 점 \((c,\,f(c))\)와 \((d,\,f(d))\)를 이은 선분 위의 임의의 점이 \(y=f(x)\)의 그래프의 위쪽(above) 또는 그래프의 위(on)에 놓이는 것이다.
증명
\(f\)가 \(I\)에서 볼록하고 \(x_0 \in \)라고 하자. \[x_0 = \alpha c+ (1-\alpha )d\] 인 \(\alpha \in [0,\,1]\)을 택하자. 그러면 두 점 \((c,\,f(c))\)와 \((d,\,f(d))\)를 잇는 선분 \(\ell\)의 기울기는 \[\frac{f(d)-f(c)}{d-c}\] 이다. 따라서 \((x_0 ,\, y_0 )\)이 선분 \(\ell\) 위의 점이면 \[y_0 = \alpha f(c) + (1-\alpha )f(d)\] 를 만족시킨다. 여기서 \(f\)가 볼록함수이므로 \(f(x_0 )\le y_0\)이 성립한다.
이 과정을 거슬러 올라가면 역이 증명된다.
정리 2. (기울기를 이용한 함수의 볼록성의 정의)
함수 \(f\)가 열린 구간 \((a,\,b)\)에서 볼록할 필요충분조건은 \((a,\,b)\)에서 \(f\)의 그래프의 기울기가 증가함수인 것이다. 즉 \[(a < c < x < d < b) \quad \Rightarrow \quad \frac{f(x)-f(c)}{x-c} \le \frac{f(d)-f(x)}{d-x}\] 가 성립하는 것이다.
증명
\(a < c < x < d < b\)라고 하자. 그리고 두 점 \((c,\,f(c)),\) \((d,\,f(d))\)를 잇는 직선을 그래프로 갖는 일차함수를 \(\lambda (x)\)라고 하자. \(f\)가 볼록하면 \(f(x) \le \lambda (x)\)이므로 \[\frac{f(x)-f(c)}{x-c} \le \frac{\lambda (x)-\lambda (c)}{x-c} = \frac{\lambda (d) - \lambda (x)}{d-x} \le \frac{f(d) - f(x)}{d-x}\] 가 성립한다. 역으로 \(f\)가 볼록함수가 아니면 적당한 \(x\in (c,\,d)\)에 대하여 \(\lambda (x) < f(x)\)이다. 따라서 \[\frac{f(x)-f(c)}{x-c} \ge \frac{\lambda (x) - \lambda (c)}{x-c} = \frac{\lambda (d) - \lambda (x)}{d-x} > \frac{f(d) - f(x)}{d-x}\] 가 성립한다. 이것은 \((a,\,b)\)에서 \(f\)의 그래프의 기울기가 증가하지 않는 부분이 존재함을 의미한다.
함수의 볼록성은 함수의 그래프의 기울기와 관련있으므로, 도함수를 이용하여 볼록성을 판정할 수 있다.
정리 3. (볼록성의 도함수 판정법)
\(f\)가 열린구간 \(I = (a,\,b)\)에서 미분 가능하다고 하자. 이때 \(f\)가 \(I\)에서 볼록함수일 필요충분조건은 \(I\)에서 \(f ' \)이 증가함수인 것이다.
증명
\(f\)가 \(I\)에서 볼록하다고 가정하자. 그리고 \(c,\) \(d\)가 \(I\)의 두 점이며 \(c < d\)라고 하자. 그러면 충분히 작은 양수 \(h\)가 존재하여 \(c+h < d\)와 \(d+h < b\)를 모두 만족시킨다. 따라서 정리 2에 의하여 \[\frac{f(c+h) - f(c)}{h} \le \frac{f(d+h) - f(d)}{h}\] 가 성립한다. 양변에 \(h \to 0\)인 극한을 취하면 \(f ' (c) \le f ' (d)\)를 얻는다. 즉 \(f ' \)은 \(I\)에서 증가함수이다.
다음으로 역을 증명하자. \(f ' \)이 \(I\)에서 증가함수라고 하자. 그리고 \(a < c < x < d < b\)라고 하자. 그러면 평균값 정리에 의하여, \(c\)와 \(x\) 사이에 \(x_0\)이 존재하여 \[\frac{f(x)-f(c)}{x-c} = f ' (x_0 )\] 을 만족시키고, \(x\)와 \(d\) 사이에 \(x_1\)이 존재하여 \[\frac{f(d)-f(x)}{d-x} = f ' (x_1 )\] 을 만족시킨다. 여기서 \(x_0 < x_1\)이므로 \(f ' (x_0 )\le f ' (x_1 )\)이 성립한다. 따라서 정리 2에 의하여 \(f\)는 \(I\)에서 볼록하다.
따름정리 1.
\(f\)가 열린 구간 \(I\)에서 두 번 미분 가능하다고 하자. 이때 \(f\)가 \(I\)에서 볼록함수일 필요충분조건은 \(I\)에서 \(f ' ' \ge 0\)인 것이다.
증명
\(f ' ' (x) = \frac{d}{dx} f ' (x)\)이므로 \(I\)에서 \(f ' ' \ge 0\)일 필요충분조건은 \(f ' \)이 \(I\)에서 증가함수인 것이다. 그러므로 정리 3에 의하여 \(I\)에서 \(f ' ' \ge 0\)일 필요충분조건은 \(f\)가 \(I\)에서 볼록함수인 것이다.
\(f\)가 구간에서 두 번 미분 가능할 때, 정리 1, 2, 3과 따름정리 1은 모두 정의 1과 동치인 정의를 제공한다. 즉 \(D^2\)급 함수에 대해서는 다섯 개의 명제 중 어느 것이든 볼록성의 정의로 사용해도 된다.
미분 가능성과 관련된 볼록함수의 성질
미분 가능성과 관련된 볼록함수의 여러 가지 성질을 살펴보자.
정리 4. (볼록함수의 연속성)
함수 \(f\)가 열린 구간 \(I = (a,\,b)\)에서 볼록하면 \(f\)는 \(I\)에서 연속함수이다.
증명
\(x_0 \in I\)라고 하자. \(x_0\)에서 \(f\)의 우극한이 \(f(x_0 )\)에 수렴함을 보이자.
\(a < c < x_0 < x < d < b\)라고 하자. 두 점 \((c,\,f(c))\)와 \((x_0 ,\,f(x_0 ))\)을 잇는 직선을 그래프로 갖는 일차함수를 \(g\)라고 하고, 두 점 \((x_0 ,\, f(x_0 ))\)과 \((d,\,f(d))\)를 잇는 직선을 그래프로 갖는 일차함수를 \(h\)라고 하자. \(f\)가 볼록함수이므로 정리 1에 의하여 \(f(x) \le h(x)\)가 성립한다. 점 \((x_0 ,\,f(x_0 ))\)은 \((c,\,f(c))\)와 \((x,\,f(x))\)를 잇는 선분 위(on)에 있거나 또는 그 아래쪽(below)에 있으므로 \(g(x) \le f(x)\)가 성립한다. 따라서 임의의 \(x\in (x_0 ,\,d)\)에 대하여 \[g(x) \le f(x) \le h(x)\] 가 성립한다. 그런데 \(y=g(x)\)와 \(y=h(x)\)의 그래프가 점 \((x_0 ,\, f(x_0 ))\)을 지나므로 \(x \to x_0 ^+\)일 때 \(g(x) \to g(x_0 ) ,\) \(h(x) \to f(x_0 )\)이 성립한다. 따라서 샌드위치 정리에 의하여 \(f(x) \to f(x_0 )\)을 얻는다. 같은 방법으로 \(x_0\)에서 \(f\)의 좌극한도 \(f(x_0 )\)에 수렴함을 보일 수 있다. 그러므로 \(f\)는 \(x_0\)에서 연속이다.
\(x_0\)이 \(I\)의 임의의 점이므로 \(f\)는 \(I\)에서 연속이다.
참고. \(I\)가 열린 구간이 아니면 정리 4는 성립하지 않을 수도 있다. 예를 들어 \(I = [0,\,1]\)에서 \[f(x) = \begin{cases} 0 &\quad\text{if} \,\, 0 \le x < 1 \\[8pt] 1 &\quad\text{if} \,\, 1 \le x=1 \end{cases}\] 로 정의된 함수 \(f\)는 \(I\)에서 볼록하지만 연속이 아니다.
함수 \(f\)가 \(x_0\)을 원소로 갖는 한 열린 구간 \(I\)에서 정의되었다고 하자. 만약 \(\delta > 0\)이 존재하여 \( \lvert x-x_0 \rvert < \delta\)일 때마다 \(f(x) < f(x_0 )\)이 성립하면 ‘\(f\)는 \(x_0\)에서 고유극댓값(proper maximum)을 가진다’라고 말한다. 만약 이 부등식이 반대로 성립하면, 즉 \(\delta > 0\)이 존재하여 \( \lvert x-x_0 \rvert < \delta\)일 때마다 \(f(x) > f(x_0 )\)이 성립하면 ‘\(f\)는 \(x_0\)에서 고유극솟값(proper minimum)을 가진다’라고 말한다.
정리 5. (볼록함수의 고유극값)
- 함수 \(f\)가 열린 구간 \((a,\,b)\)에서 볼록하면 \(f\)는 \((a,\,b)\)에서 고유극댓값을 갖지 않는다.
- 함수 \(f\)가 \([0,\,\infty )\)에서 볼록하고 고유극솟값을 가지면 \(x\to \infty\)일 때 \(f(x) \to \infty\)이다.
증명
[1] 결론에 반하여 \(f\)가 \(x_0 \in (a,\,b)\)에서 고유극댓값을 가진다고 가정하자. 그러면 \(c < x_0 < d\)인 \(c,\) \(d\)가 존재하여 \(c < x < d\)일 때마다 \(f(x) < f(x_0 )\)을 만족시킨다. 특히 두 점 \((c,\,f(c))\)와 \((d,\,f(d))\)를 잇는 선분 위의 점의 \(y\)좌표는 \(f(x_0 )\)보다 작다. 이것은 모순이므로 \(f\)는 \((a,\,b)\)에서 고유극댓값을 갖지 않는다.
[2] \(f\)가 \(x_0 \in (a,\,b)\)에서 고유극솟값을 가진다고 하자. \(x_1 > x_0\)인 점 \(x_1\)이 임의로 주어졌다고 하자. 그리고 두 점 \((x_0 ,\, f(x_0 ))\)과 \((x_1 ,\, f(x_1 ))\)을 잇는 직선의 방정식을 \(y=g(x)\)라고 하자. \(f\)가 \(x_0\)에서 고유극솟값을 가지므로 \(f(x_1 ) > f(x_0) \)과 \(x_1 > x_0\)을 모두 만족시키는 점 \(x_1\)이 존재한다. 따라서 \(g\)의 그래프의 기울기는 양수이다. 더욱이 정리 4의 증명 과정에서 살펴본 바와 같이 임의의 \(x\in (x_1 ,\, \infty )\)에 대하여 \(g(x) \le f(x)\)이다. 그런데 \(x\to \infty\)일 때 \(g(x) \to \infty\)이므로 \(f(x) \to \infty\)이다.
정리 6. (볼록함수의 미분 가능성)
함수 \(f\)가 열린 구간 \((a,\,b)\)에서 볼록하면 \((a,\,b)\)의 모든 점에서 \(f\)의 좌미분계수와 우미분계수가 존재하며 그들은 각각 \((a,\,b)\)에서 유한값을 갖고 증가하는 함수이다.
증명
\(h < 0\)이면 두 점 \((x,\,f(x))\)와 \((x+h ,\,f(x+h))\)를 잇는 직선의 기울기는 \[\frac{f(x+h)-f(x)}{h}\] 이다. 정리 2에 의하여 음수 \(h\)가 \(0\)에 가까워질수록 이 분수식의 값은 증가한다. 따라서 단조수렴 정리에 의하여 \(h\to 0^-\)일 때 이 분수식은 유한값에 수렴한다. 비슷한 방법으로 \(h\to 0^+\)일 때에도 이 분수식의 값이 유한값에 수렴함을 알 수 있다. 즉 \(f_l ' (x) \le f_r ' (x)\)를 얻는다.
이제 \(f_r ' (x)\)가 \((a,\,b)\)에서 증가함수임을 보이자. \(x_1 ,\) \(u,\) \(t,\) \(x_2\)가 \((a,\,b)\)의 점이고 \(x_1 < u < t < x_2\)라고 하자. 그러면 \[\frac{f(u)-f(x_1 )}{u-x_1} \le \frac{f(x_2 ) - f(t)}{x_2 -t}\] 가 성립한다. 위 부등식의 좌변에 \(u \to x_1^+\)인 극한을 취하고 우변에 \(t\to x_2^-\)인 극한을 취하면 \[f_r ' (x_1) \le f_l ' (x_2 ) \] 를 얻는다. 그런데 \(f_l ' (x_2) \le f_r ' (x_2)\)이므로 \[f_r ' (x_1) \le f_l ' (x_2) \le f_r ' (x_2)\] 이다. 즉 \(f_r ' (x)\)는 \((a,\,b)\)에서 증가한다. 같은 방법으로 \(f_l ' (x)\)도 \((a,\,b)\)에서 증가함을 보일 수 있다.
따름정리 2. (볼록함수의 미분 가능성)
함수 \(f\)가 열린 구간 \((a,\,b)\)에서 볼록하면 \((a,\,b)\)의 점 중에서 \(f\)가 미분 불가능한 것들의 모임은 유한이거나 가산이다.
증명
\((a,\,b)\)의 점 중에서 그 점에서 \(f\)의 좌미분계수가 존재하지 않거나 우미분계수가 존재하지 않은 것들의 모임을 \(E\)라고 하자. 구간에서 증가하는 함수의 불연속점의 모임은 유한이거나 가산인데, \(f_l ' \)과 \(f_r ' \)은 모두 \((a,\,b)\)에서 증가함수이므로 \(E\)는 유한이거나 가산이다.
\(x_0 \in (a,\,b) \setminus E\)라고 하자. 그러면 정리 6에 의하여 다음이 성립한다. \[f_r ' (x) \le f_l ' (x_0 ) \le f_r ' (x_0 ).\] \(f_r '\)과 \(f_l '\)이 모두 \(x_0\)에서 연속이므로, 위 식에 \(x \to x_0\)인 극한을 취하면 \[f_r ' (x_0 ) \le f_l ' (x_0 ) \le f_r ' (x_0 )\] 을 얻는다. 즉 \(f_r ' (x_0 ) = f_l ' (x_0 )\)이므로 \(f\)는 \(x_0\)에서 미분 가능하다. 그러므로 \(f\)가 미분 불가능한 점은 모두 \(E\)에만 존재한다. \(E\)가 유한이거나 가산이고, 가산집합의 부분집합은 가산집합이므로 정리의 결론을 얻는다.
따름정리 3. (함수의 증감에 대한 도함수 판정법)
함수 \(f\)가 닫힌 구간 \([a,\,b]\)에서 연속이고 열린 구간 \((a,\,b)\)에서 미분 가능하다고 하자. 만약 집합 \[E = \left\{ x \in (a,\,b) \,\vert\, f ' (x) < 0 \right\}\] 이 유한이거나 가산이면 \(f\)는 \([a,\,b]\)에서 증가함수이다.
증명
\(E\)가 공집합이 아니라고 가정하고 \(x_1 \in E\)라고 하자. 그리고 \(y\in (f ' (x_1 ) ,\, 0)\)이라고 하자. 다르부의 정리(도함수의 사잇값 정리)에 의하여 \(x \in (a,\,b)\)가 존재하여 \(f ' (x) = y < 0\)을 만족시킨다. 즉 \((f ' (x_1 ) ,\, 0)\)은 비가산집합이며, 이 집합에 속한 모든 \(y\)에 대하여 \(f ' (x) = y\)인 \(x\)가 \(E\)에 존재하게 되므로 \(E\)는 비가산집합이다. 이것은 모순이므로 \(E\)는 공집합이다.
그러므로 \((a,\,b)\)의 모든 점에서 \(f ' \ge 0\)이다. 즉 \(f\)는 \([a,\,b]\)에서 증가함수이다.
따름정리 4. (상수함수의 도함수 판정법)
함수 \(f\)가 닫힌 구간 \([a,\,b]\)에서 연속이고 열린 구간 \((a,\,b)\)에서 미분 가능하다고 하자. 만약 집합 \[E = \left\{ x \in (a,\,b) \,\vert\, f ' (x) \ne 0 \right\}\] 이 유한이거나 가산이면 \(f\)는 \([a,\,b]\)에서 상수함수이다.
증명
\(f\)와 \((-f)\)에 따름정리 3을 적용하면 원하는 결론을 얻는다.
함수의 그래프의 모양
따름정리 1을 확장하면 다음 정리를 얻는다.
정리 7. (볼록성의 이계도함수 판정법)
\(f\)가 구간 \(I\)에서 두 번 미분 가능하다고 하자.
- \(I\)의 모든 점에서 \(f ' ' > 0\)이면 \(f\)의 그래프는 \(I\)에서 아래쪽으로 볼록하다.
- \(I\)의 모든 점에서 \(f ' ' < 0\)이면 \(f\)의 그래프는 \(I\)에서 위쪽으로 볼록하다.
\(x\)의 값이 \(c\)를 지나는 순간 함수 \(y=f(x)\)의 그래프가 볼록한 방향이 바뀔 때 점 \((c,\,f(c))\)를 \(f\)의 그래프의 변곡점(point of inflection)이라고 부른다. (이 정의는 책마다 조금씩 다르다. 즉 책에 따라서는 \(f\)가 \(c\)에서 미분 가능하다는 조건이 추가되기도 한다.) 변곡점의 정의에 의하여 다음을 얻는다.
\((c,\,f(c))\)가 \(y=f(x)\)의 그래프의 변곡점이면 \(f ' ' (c)=0\)이거나 또는 \(c\)에서 \(f\)의 이계미분계수가 존재하지 않는다.
도함수를 이용하여 함수의 극값을 구하는 방법을 살펴 보자.
정리 8. (상대극값에 대한 일계도함수 판정법)
함수 \(f\)가 정의역의 한 부분구간 \(I\)에서 연속이고 \(c\)가 \(I\)의 내점이며, \(f\)가 \(c\)를 제외한 \(I\)의 모든 점에서 미분 가능하다고 하자. (\(c\)에서는 \(f\)가 미분 가능할 수도 있고 그렇지 않을 수도 있다.)
- \(x\)의 값이 증가하면서 \(c\)를 지나는 순간 \(f ' \)의 값이 음수에서 양수로 바뀌면 \(f\)는 \(c\)에서 극솟값을 가진다.
- \(x\)의 값이 증가하면서 \(c\)를 지나는 순간 \(f ' \)의 값이 양수에서 음수로 바뀌면 \(f\)는 \(c\)에서 극댓값을 가진다.
- \(x\)의 값이 증가하면서 \(c\)를 지나는 순간 \(f ' \)의 값의 부호가 바뀌지 않으면 \(f\)는 \(c\)에서 극값을 갖지 않는다.
증명
여기서는 [1]만 증명한다. \(x < c\)일 때 \(f ' (x) < 0\)이므로 \(f\)는 \(c\)의 왼쪽에서 감소한다. 따라서 \(x < c\)인 \(x\in I\)에 대해서는 \(f(x) > f(c)\)이다. 또한 \(c < x\)일 때 \(f ' (x) > 0\)이므로 \(f\)는 \(c\)의 오른쪽에서 증가한다. 따라서 \(c < x\)인 \(x\in I\)에 대해서는 \(f(c) < f(x)\)이다. 즉 임의의 \(x\in I\)에 대해서 \(f(x) \ge f(c)\)이므로 \(f\)는 \(c\)에서 극솟값을 가진다.
[2]와 [3]도 같은 방법으로 증명된다.
정리 9. (상대극값에 대한 이계도함수 판정법)
함수 \(f\)가 정의역의 한 부분구간 \(I\)에서 \(C^2\)급이고(연속인 이계도함수를 갖고) \(c\)가 \(I\)의 내점이라고 하자.
- 만약 \(f ' (c) = 0\)이고 \(f ' ' (c) < 0\)이면 \(f\)는 \(c\)에서 극댓값을 가진다.
- 만약 \(f ' (c) = 0\)이고 \(f ' ' (c) > 0\)이면 \(f\)는 \(c\)에서 극솟값을 가진다.
- 만약 \(f ' (c) = 0\)이고 \(f ' ' (c) = 0\)이면 결론을 내릴 수 없다. 즉 이 경우 \(f\)는 \(c\)에서 극댓값을 가질 수도 있고 극솟값을 가질 수도 있으며 극값을 갖지 않을 수도 있다.
증명
[1] \(f ' ' (c) < 0\)이고 \(f ' ' \)이 연속이므로 \(c\)를 원소로 갖는 한 열린 구간 \(J\) 위에서 \(f ' ' < 0\)이다. 그러므로 \(f ' \)은 \(J\)에서 감소함수이다. 그런데 \(f ' (c)=0\)이므로 \(x\)의 값이 증가하면서 \(c\)를 지나는 순간 \(f ' \)의 값은 양수에서 음수로 바뀐다. 그러므로 일계도함수 판정법에 의하여 \(f\)는 \(c\)에서 극댓값을 가진다.
[2]도 [1]과 같은 방법으로 증명된다.
[3]의 경우에는 세 가지 예를 찾으면 된다. 먼저 \(f_1 (x) = x^4\)에 대해서는 \(f_1 ' (0) = 0,\) \(f_1 ' ' (0) = 0\)이지만 \(f_1\)은 \(0\)에서 극솟값을 가진다. 다음으로 \(f_2 (x) = -x^4\)에 대해서는 \(f_2 ' (0) = 0,\) \(f_2 ' ' (0) = 0\)이지만 \(f_2\)는 \(0\)에서 극댓값을 가진다. 끝으로 \(f_3 (x) = x^3\)에 대해서는 \(f_3 ' (0) = 0,\) \(f_3 ' ' (0) = 0\)이지만 \(f_3\)은 \(0\)에서 극값을 갖지 않는다.
옌센의 부등식
이 포스트는 미적분학 미분 단원에 속하는 글이기 때문에 지금까지 미분과 관련된 내용만 서술하였다. 비록 극한과 미분 단원의 범위에는 벗어나지만 볼록함수의 성질을 다루면서 살펴보지 않고 넘어가기에는 참 아쉬운 것이 하나 있는데, 그것은 바로 옌센의 부등식(Jensen’s inequality)이다.
정리 10. (옌센의 부등식)
\(\phi\)가 닫힌 구간 \([a,\,b]\)에서 볼록함수이고 함수 \(f : [ 0,\,1] \to [a,\,b]\)와 \(\phi \circ f\)가 \([0,\,1]\)에서 적분 가능하다고 하자. 이때 \[\phi \left( \int_{a}^{b} f(x) dx \right) \le \int_0^1 ( \phi \circ f )(x) dx \tag{1}\] 가 성립한다.
증명
임의의 \(x\in [0,\,1]\)에 대하여 \(a \le f(x) \le b\)이므로 \ 라고 하면 \(c \in [a,\,b]\)이다. 또한 \[s := \sup \left\{ \left. \frac{\phi (c) - \phi (x)}{c-x} \right\vert x \in [a,\,c) \right\}\] 라고 하자. 정리 2에 의하여 임의의 \(u \in (c,\,b]\)와 \(x\in [a,\,c)\)에 대하여 \[\frac{\phi (c)-\phi (x)}{c-x} \le \frac{\phi (u) - \phi (c)}{u-c}\tag{2}\] 이므로 \(s\)는 잘 정의된 값이다. 따라서 상한의 성질에 의하여 \[s \le \frac{\phi (u) - \phi (c)}{u-c}\] 이며, 이 부등식으로부터 임의의 \(u\in \)에 대하여 다음 부등식을 얻는다. \[\phi(c) + s(u-c) \le \phi (u).\tag{3}\] 한편 \(s\)의 정의에 의하여(상한의 성질에 의하여) \(u\in [a,\,c)\)에 대하여 다음이 성립한다. \[s \ge \frac{\phi (c) - \phi (u)}{c-u}.\] 따라서 임의의 \(u\in [a,\,b]\)에 대하여 (3)이 성립한다. (3)에서 \(u=f(x)\)라고 하면 \[\phi (c) + s(f(x)-c) \le (\phi \circ f)(x)\] 를 얻는다. \([0,\,1]\) 위에서 \(x\)에 대하여 위 부등식의 양변을 적분하면 다음을 얻는다. \[\phi (c) + s \left( \int_0^1 f(x) dx - c \right) \le \int_0^1 (\phi \circ f)(x) dx.\tag{4}\] 한편 임의의 실수 \(s\)에 대하여 \[\phi \left( \int_0^1 f(x) dx \right) = \phi (c) + s \left( \int_0^1 f(x) dx -c \right)\tag{5}\] 가 성립한다. (4)와 (5)를 결합하면 (1)을 얻는다.