Определение локального максимума и локального минимума
Пусть функция
y = f(x) определена в некоторой
δ-окрестности точки
x0, где
δ > 0. Говорят, что функция
f(
x) имеет
локальный максимум в точке
x0, если для всех точек
x ≠ x0, принадлежащих окрестности
(x0− δ, x0 + δ) выполняется неравенство
f(x) ≤ f(x0).
Если для всех точек
x ≠ x0 из некоторой окрестности точки
x0 выполняется строгое неравенство
f(x) < f(x0),
то точка
x0 является
точкой строгого локального максимума.
Аналогично определяется
локальный минимум функции
f(
x). В этом случае для всех точек
x ≠ x0 из
δ-окрестности
(x0− δ, x0 + δ) точки
x0 справедливо неравенство
f(x) ≥ f(x0).
Соответственно,
строгий локальный минимум описывается строгим неравенством
f(x) > f(x0).
Понятия локального максимума и локального минимума объединяются общим термином
локальный экстремум. Слово "локальный" для краткости часто опускают и говорят просто о максимумах и минимумах функции.
На рисунке 1 схематически показаны различные точки экстремума. Точка
A(
x1) является точкой строгого локального минимума, поскольку для нее существует
δ-окрестность
(x0− δ, x0 + δ), в которой справедливо неравенство
f(x) > f(x1) ∀x ∈ (x1 − δ, x1 + δ).
Аналогично, точка
B(
x2) является точкой строгого локального максимума. В этой точке выполняется неравенство
f(x) < f(x2) ∀x ∈ (x2 − δ, x2 + δ).
(Разумеется, число
δ в каждой точке может быть совершенно разным.)
Последующие точки классифицируются таким образом:
- точка C(x3) − строгий минимум;
- точка D(x4) − нестрогий максимум;
- точка E(x5) − нестрогий максимум или минимум;
- точка F(x6) − нестрогий максимум;
- точка G(x7) − нестрогий минимум;
- точка H(x8) − нестрогий максимум или минимум;
- точка I(x9) − нестрогий максимум;
- точка J(x10) − экстремума нет.
Необходимое условие экстремума
Введем еще некоторые понятия.
Точки, в которых производная функции
f(
x) равна нулю, называются
стационарными точками.
Точки, в которых производная функции
f(
x) равна нулю либо не существует, называются
критическими точками данной функции. Следовательно, стационарные точки являются подмножеством множества критических точек.
Необходимое условие экстремума формулируется следующим образом:
Если точка
x0 является точкой экстремума функции
f(
x), то в этой точке либо производная равна нулю, либо не существует. Другими словами, экстремумы функции содержатся среди ее критических точек.
Доказательство необходимого условия экстремума следует из
теоремы Ферма.
Отметим, что выполнение необходимого условия еще не гарантирует существование экстремума. Классической иллюстрацией здесь является кубическая функция
f(x) = x3. Несмотря на то, что в точке
x = 0 производная данной функции равна нулю:
f ' (x = 0) = 0, эта точка не является экстремумом.
Экстремумы дифференцируемых функций существуют при выполнении
достаточных условий. Эти условия основаны на использовании производной первого, второго или высшего порядка. Соответственно, рассматриваются 3 достаточных условия экстремума. Перейдем к их формулировке и доказательству.
Первое достаточное условие экстремума
Пусть функция
f(
x) дифференцируема в некоторой окрестности точки
x0, кроме, быть может, самой точки
x0,
в которой, однако, функция непрерывна. Тогда:
- Если производная f '(x) меняет знак с минуса на плюс при переходе через точку x0 (слева направо), то точка x0 является точкой строгого минимума (рис.2). Другими словами, в этом случае существует число δ > 0, такое, что
∀ x ∈ (x0 − δ, x0) ⇒ f '(x) < 0,
∀ x ∈ (x0, x0 + δ) ⇒ f '(x) > 0.
- Если производная f '(x), наоборот, меняет знак с плюса на минус при переходе через точку x0, то точка x0 является точкой строгого максимума (рис.3). Иначе говоря, существует число δ > 0, такое, что
∀ x ∈ (x0 − δ, x0) ⇒ f '(x) > 0,
∀ x ∈ (x0, x0 + δ) ⇒ f '(x) < 0.
Доказательство.
Ограничимся рассмотрением случая минимума. Пусть производная
f '(x) при переходе через точку
x0 меняет знак с минуса на плюс. Слева от точки
x0 выполняется условие
∀ x ∈ (x0 − δ, x0) ⇒ f '(x) < 0.
По
теореме Лагранжа разность значений функции в точках
x и
x0 записывается как
f(x) − f(x0) = f '(c) (x − x0),
где точка
c принадлежит интервалу
(x0 − δ, x0), в котором производная отрицательна, т.е.
f '(c) < 0. Поскольку
x − x0 < 0 слева от точки
x0, то следовательно,
f(x) − f(x0) > 0 для всех x ∈ (x0 − δ, x0).
Таким же образом устанавливается, что
f(x) − f(x0) > 0 для всех x ∈ (x0, x0 + δ)
(справа от точки
x0).
На основании определения заключаем, что точка
x0 является точкой строгого минимума функции
f(
x).
Аналогично можно доказать первое достаточное условие для строгого максимума функции.
Заметим, что в первом достаточном условии не требуется, чтобы функция была дифференцируемой в точке
x0. Если в этой точке производная равна бесконечности или не существует (т.е. точка
x0 является критической, но не стационарной), то первое достаточное условие все равно можно использовать для исследования функции на максимум или минимум.
Второе достаточное условие экстремума
Пусть в точке
x0 первая производная равна нулю:
f(x0) = 0, т.е. точка
x0 является
стационарной точкой функции
f(
x). Пусть также в этой точке существует вторая производная
f ''(x0). Тогда:
- Если f ''(x0) > 0, то x0 является точкой строгого минимума функции f(x);
- Если f ''(x0) < 0, то x0 является точкой строгого максимума функции f(x).
Доказательство.
В случае строгого минимума
f ''(x0) > 0. Тогда первая производная представляет собой возрастающую функцию в точке
x0. Следовательно, найдется число
δ > 0, такое, что
∀ x ∈ (x0 − δ, x0) ⇒ f '(x) < f '(x0),
∀ x ∈ (x0, x0 + δ) ⇒ f '(x) > f '(x0).
Поскольку
f '(x0) = 0 (так как
x0 − стационарная точка), то следовательно, в
δ-окрестности слева от точки
x0 первая производная отрицательна, а справа − положительна, т.е. первая производная меняет знак с минуса на плюс при переходе через точку
x0. По первому достаточному признаку экстремума это означает, что
x0 − точка строгого минимума.
Аналогично рассматривается случай максимума.
Второй достаточный признак экстремума удобно применять, когда вычисление первых производных в окрестности стационарной точки затруднительно. С другой стороны, второй признак можно использовать лишь для стационарных точек (где первая производная равна нулю) − в отличие от первого признака, который применим к любым критическим точкам.
Третье достаточное условие экстремума
Пусть функция
f(
x) имеет в точке
x0 производные до
n-го порядка включительно. Тогда, если
f '(x0) = f ''(x0) = ... = f (n−1)(x0) = 0 и f n(x0) ≠ 0,
то при четном
n точка
x0 является
- − точкой строгого минимума, если f n(x0) > 0, и
- − точкой строгого максимума, если f n(x0) < 0.
При нечетном
n экстремума в точке
x0 не существует.
Ясно, что при
n = 2 в качестве частного случая мы получаем рассмотренное выше второе достаточное условие экстремума. Чтобы исключить такой переход, в третьем признаке полагают, что
n > 2.
Доказательство.
Разложим функцию
f(
x) в точке
x0 в
ряд Тейлора:
Поскольку по условию теоремы все первые производные до
(n − 1)-го порядка равны нулю, получаем:
где остаточный член
ο((x − x0) n) имеет более высокий порядок малости, чем
n. В результате в
δ-окрестности точки
x0 знак разности
f((x) − f(x0) будет определяться знаком
n-го члена в ряде Тейлора:
или
Если
n − четное число
(n = 2k), то
∀ x ∈ (x0 − δ, x0 + δ) ⇒ (x − x0)2k > 0.
Следовательно, в этом случае
sign [f(x) − f(x0)] = sign f (n)(x0).
При
f (n)(x0) > 0 в
δ-окрестности точки
x0 выполняется неравенство
f((x) − f(x0) > 0.
По определению это означает, что
x0 −
точка строгого минимума функции
f(
x).
Аналогично, при
f (n)(x0) < 0 в
δ-окрестности точки
x0 имеем неравенство
f((x) − f(x0) < 0,
что соответствует
точке строгого максимума.
Если
n − нечетное число
(n = 2k + 1), то степень
(x − x0)2k+1 будет менять знак при переходе через точку
x0. Тогда из формулы
sign [f(x) − f(x0)] = sign [f (n)(x0) (x − x0)2k+1]
следует, что разность
f((x) − f(x0) также меняет знак при переходе через
x0. В этом случае экстремума в точке
x0 не существует.