【专题】公共数学_多元函数极值专题
Author: Colopen 彩色铅笔
Link: https://www.colopen-blog.com
Download the pdf: 多元函数极值专题.pdf
last publication: 2021-12-11 18:00
无条件极值
无条件极值属于多元函数极值中,较为简单的一类问题,其解决的问题描述一般是:
$$
\text{给定一个多元函数 } z=f(x,y)\text{,求解他在实数域上的极值}
$$
解决该类问题的思路也很简单,直接沿用我们在 一元函数 中的手段:通过 驻点 找 极值点
用 $z$ 对 $x,y$ 分别求 偏导,然后令 一阶偏导数 为零,找出 驻点
如何判断 驻点 是否是 极值点 ?常用手段是 黑塞矩阵(Hessian Matrix)判别式
他是用于研究函数在一点处 曲率 的变化而存在的(就像一元函数求二阶导数的行为,本质相同)
黑塞矩阵判别式: $\begin{vmatrix}f_{xx} & f_{xy} \\f_{yx} & f_{yy}\end{vmatrix} \xlongequal{?} 0$
若 黑塞矩阵判别式 :
大于 $0$,则该驻点是极值点
- 若 $f_{xx} > 0$ 则为极小值点
- 若 $f_{xx} < 0$ 则为极大值点
小于 $0$,则该驻点不是极值点
等于 $0$,则 判别式失效
当 判别式失效 时,我们可以利用 极值的定义,然后通过一个 二元极限 判断该点是否是极值点
- 如果找到两条路径,一条路径极限大于该点值,一条路径极限小于该点值,则非 极值点
- 如果 去心邻域 内的值都大于或小于该驻点的值,则该驻点为极值点
关于 无条件极值,各大辅导书上步骤都有详细讲解,故这里就不准备例题了,只帮助大家理清思路
条件极值
条件极值 是考研中常考的,方法超固定,计算超复杂的一类问题
条件极值 围绕着 目标函数、约束条件 两个关键字展开
求解的是 目标函数 在 约束条件 下的 极值 问题
其问题描述一般为:
$$
\text{已知函数 }z = f(x,y) \text{,求解 }z \text{ 在约束条件 } D = \{(x,y)|g(x,y)=0\}\text{ 下的最值}
$$
通法 是 拉格朗日数乘法:是一种寻找变量受一个或多个条件所限制的多元函数的极值的方法
构造如下方程组:
$$
L(x,y,\lambda) = f(x,y) + \lambda g(x,y) \xlongequal{\text{令}} 0
$$
$$
\begin{cases}
L_x = f_x(x,y) + \lambda g_x(x,y) \xlongequal{\text{令}} 0
\\
L_y = f_y(x,y) + \lambda g_y(x,y) \xlongequal{\text{令}} 0
\\
L_\lambda = g_x(x,y) \xlongequal{\text{令}} 0
\end{cases}
$$
然后解该方程组,便可以得到 目标函数 在 约束条件 下的 极值点
然后比较几个 极值点,选出 最大最小值 即可
不过 条件极值 难,从来都不是难在做法上,而是构造的 拉格朗日数乘法方程 难解
接下来的内容,将会围绕优化解方程出发,分享几个我常用的方法
利用轮换对称式化简拉格朗日乘子
在下方的 利用齐次式化简拉格朗日乘子 中介绍过:(这个专题我是从下往上写的 w)
拉格朗日函数 是一个 多项式函数,可以利用很多 多项式的特性 对计算进行化简
而本篇中,提到的方法便是 轮换对称式
二元轮换对称式 的定义:
对于一个二元多项式 $f(x,y)$,如果用 $x$ 代替 $y$,用 $y$ 代替 $x$,后 代数式 保持不变,则称 $f(x,y)$ 具有 轮换对称性
上述定义可以扩充到 $n$ 元,此外 二元轮换对称式 也是一个 完全对称式
轮换对称性用简单一个点的话来说就是,如果交换 $x,y$ 后,$f(x,y)$ 保持不变
对于具有 轮换对称性 的函数,一定有解 $y = x$
因此我们不妨直接让 $L_x - L_y$ 然后提出 $(y-x)$ 的因式
然后分类讨论两个因式分别为 $0$ 的解
【例】设计一个容积为 $V$ 的长方体开口水箱,长宽高分别为多少时最节省材料
【解】根据题意可得 目标函数: $S = 2xz + 2zy + xy$,约束条件 $V = xyz$
构造拉格朗日函数:$L = 2xz + 2zy + xy + \lambda (xyz - V)$
显然 $x,y$ 具有轮换对称性
$$
\begin{cases}
L_x = 2z + y + \lambda yz \xlongequal{\text{令}} 0 \\
L_y = 2z + x + \lambda xz \xlongequal{\text{令}} 0 \\
L_z = 2x + 2y + \lambda xy \xlongequal{\text{令}} 0 \\
L_\lambda = xyz \xlongequal{\text{令}} V
\end{cases}
$$
利用轮换对称性,让 $L_x - L_y$ 得:
$$
\begin{aligned}
(y-x) + \lambda z(y - x) &= 0 \\
(y-x) \cdot (1 + \lambda z) &= 0 \\
\end{aligned}
$$
(1) $x = y$ 时:$L_z: 4x + \lambda x^2 = 0 \Rightarrow x(4 + \lambda x) = 0 \Rightarrow \lambda = -\dfrac{4}{x}$
$L_\lambda : z = \dfrac{V}{x^2}$,$L_x : \dfrac{2V}{x^2} + x - 4 \cdot \dfrac{V}{x^2} = 0 \Rightarrow x^3 = 2V \Rightarrow x = \sqrt[3]{2V}$
故 $\begin{cases}
x = \sqrt[3]{2V} \\
y = \sqrt[3]{2V} \\
z = \dfrac{\sqrt[3]{V}}{2^{\frac{2}{3}}}
\end{cases}$
(2) $1 + \lambda z = 0$ 时:$L_x : -\dfrac{2}{\lambda} + y - y = 0 \Rightarrow \dfrac{2}{\lambda} = 0$ 无解
由于题目保证一定有解,故最小值解为:$\begin{cases}
x = \sqrt[3]{2V} \\
y = \sqrt[3]{2V} \\
z = \dfrac{\sqrt[3]{V}}{2^{\frac{2}{3}}}
\end{cases}$
2013年超难解的多元极值问题,就可以利用本技巧化简运算,读者可以去试一下
三角换元法
这个方法很简单,本质就是沿用了大家在 二重积分 里常用的 极直互化 技巧
考虑按照 约束条件 的形式,将 直角坐标 转化成 极坐标 形式
这样就从原来的 $f(x,y)$ 极值问题,转化为 $f(r,\theta)$ 极值问题
由于是基于 约束条件 转换的坐标,转化过来后 $r,\theta$ 是带着 约束条件 的 取值范围限制
故 $f(r,\theta)$ 最后可以通过 三角恒等变形 化成一个 $ar\sin(\theta + \varphi)$ 的形式
然后就可以根据 $r$ 范围直接写出 $f$ 的 取值范围
【例】$4x^2+y^2 \le 25$,求 $L = x^2 + 12xy + 2y^2$ 的取值范围
【解】根据 约束条件 的形式,进行 极直互化
不妨令 $2x = r\cos \theta$,$y = r\sin \theta$,则 $r^2 \le 25 \Rightarrow (0 \le r \le 5$,$0 \le \theta \le 2\pi)$
对 目标函数 转 极坐标:
$$
\begin{aligned}
L
&=
x^2 + 12xy + 2y^2
\\
&=
\dfrac{r^2}{4}\cos^2\theta + 6r^2\sin\theta\cos\theta + 2r^2\sin^2\theta
\\
&=
\dfrac{r^2}{4} \cdot \dfrac{1+\cos 2\theta}{2} + 3r^2\sin 2\theta + 2r^2\cdot \dfrac{1-\cos 2\theta}{2}
\\
&=
\dfrac{r^2}{8} + \dfrac{r^2}{8}\cos 2\theta + 3r^2\sin 2\theta + r^2 - r^2\cos 2\theta
\\
&=
\dfrac{r^2}{8} \cdot \bigg({
9 + 24\sin 2\theta - 7\cos 2\theta
}\bigg)
\\
&=
\dfrac{r^2}{8} \cdot \bigg({
9 + \sqrt{24^2 + 7^2} \sin(2\theta + \varphi)
}\bigg)
\\
&=
\dfrac{r^2}{8} \cdot \bigg({
9 + 25 \sin(2\theta + \varphi)
}\bigg)
\\
\end{aligned}
$$
由于 $\theta \in [0, 2\pi], r \in [0, 5]$,故 $f(r,\theta)\in [-50, \dfrac{425}{4}]$
该方法同样适用于 三个变量平方和的等式 下
由于是等式,故可以选择两个变量建立极坐标,让第三个变量代替 $r$ 作为参数限制
如下面这题
【例】$x^2+y^2+z^2=10$,求 $L = xy + 2yz$ 的取值范围
【解】对 $L$ 进行变形:$L = y \cdot (x + 2z)$,考虑围绕 $x,z$ 建立极坐标
对约束条件进行恒等变形:$x^2 + z^2 = 10 - y^2$
建立极坐标:$x = \sqrt{10 - y^2} \cos \theta, z = \sqrt{10 - y^2} \sin \theta$
易得 $-\sqrt{10} \le y < \sqrt{10}$,$0 \le \theta \le 2\pi$
对目标函数进行换元:
$$
\begin{aligned}
L &=
y \cdot \bigg({
\sqrt{10 - y^2} \cos\theta + 2\sqrt{10 - y^2}\sin\theta
}\bigg)
\\
&=
y \sqrt{10 - y^2} \cdot
\sqrt{5} \sin (\theta + \varphi)
\\
\end{aligned}
$$
根据 $y\in[-\sqrt{10},\sqrt{10}]$,有 $y\sqrt{10-y^2} \in [-5, 5]$ (读者自证不难)
而 $\sqrt{5} \sin (\theta + \varphi) \in [-\sqrt{5}, \sqrt{5}]$
故 $L = y \sqrt{10 - y^2} \cdot \sqrt{5} \sin (\theta + \varphi) \in [-5\sqrt{5}, 5\sqrt{5}]$
利用齐次式化简拉格朗日乘子
部分参考自 @考研竞赛凯哥,及其他参考文献
这一部分,有一些数学知识作为前置铺垫,不过最后得出来的结论相当简单
如果没有想要了解的想法,只是以考试为主要目的的同学,可以直接往下滑
解 多元函数条件极值 问题时,需要用到 拉格朗日乘数法 构造 拉格朗日函数
$$
L(x_1,x_2,x_2,\lambda) = f(x_1,x_2,x_3) + \lambda [g(x_1,x_2,x_3) - m]
$$
其中 $\lambda$ 为参数
由于 $\lambda$ 是作为参数存在的,故研究 拉格朗日函数 实际上是在研究一个 多项式函数
而当研究对象转换到 多项式函数 后,就可以用到很多 特殊多项式函数 的性质
例如,本篇中会介绍的 齐次函数(如果该次数是二次型,推荐用下一个二次型解法)
k 次式的齐次函数 的 定义 为:$f(\lambda x_1,\lambda x_2,\cdots,\lambda x_n) = \lambda^kf(x_1,x_2,\cdots,x_n)$
对于 $k$ 次 齐次函数 ,有 齐次函数 的 欧拉定理:
$$
x_1\dfrac{\partial f}{\partial x_1} + x_2\dfrac{\partial f}{\partial x_2} + \cdots + x_n\dfrac{\partial f}{\partial x_n} = k f(x_1,x_2,\cdots,x_n)
$$
简单证明:
对于 $k$ 次齐次函数 $f(x_1,x_2,\cdots,x_n)$,对定义式两边求全微分:
$$
\dfrac{d}{d\lambda} f(\lambda x_1,\lambda x_2,\cdots,\lambda x_n) = \sum_{i=1}^n \dfrac{\partial f}{\partial(\lambda x_i)} \cdot \dfrac{d(\lambda x_i)}{d\lambda} = \sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)}
$$$$
\dfrac{d}{d\lambda} \lambda^k f(x_1,x_2,\cdots,x_n) = k\lambda^{k-1}f(x_1,x_2,\cdots,x_n)
$$通过这个 算两次 的思想,由于两个 全微分 必相等,于是:
$$
\sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)} =
k\lambda^{k-1}f(x_1,x_2,\cdots,x_n)
$$取 $\lambda = 1$,得:
$$
\sum_{i=1}^n x_i \dfrac{\partial f}{\partial(\lambda x_i)} =
kf(x_1,x_2,\cdots,x_n) \qquad QED
$$
回到 多元函数条件极值 问题上来
若目标函数 $f$ 和约束条件 $g = m$ 满足 $f$ 和 $g$ 是 $k$ 次多项式,那么 $F = f + \lambda g$ 也是 $k$ 次多项式。
对于 拉格朗日乘子 $L = f + \lambda(g-m)$,$L_x = 0, L_y = 0$
可以考虑 $xL_x + yL_y = 0$,即 $xF_x + yF_y = 0$(常数 $m$ 求偏导后被干掉了)
根据 欧拉定理,$kF = 0$,再根据条件 $g = m$,$kF = 0$ 可以进一步化简为 $f = -\lambda m$
因此考虑 $f$ 的最值问题,就化为考虑 $-\lambda m$ 的最值问题
理论铺垫多说无益,我们直接来一道实战题目进行讲解
题选自李林预测卷,我是在群里找来的到的
【例】求中心在坐标原点的椭圆 $x^2 - 4xy + 5y^2 = 1$ 的长半轴和短半轴长度
【解】椭圆长/短半轴长度就是椭圆上离中心点最 远/近 的距离长度
故可以目标函数就是 $\sqrt{x^2 + y^2}$,但为了化简计算,不妨设目标函数为 $x^2 + y^2$
构造拉格朗日乘数法:$L(x,y,\lambda) = x^2 + y^2 + \lambda(x^2 - 4xy + 5y^2 - 1)$
$$
\begin{cases}
L_x = 2x + 2\lambda x - 4\lambda y \xlongequal{\text{令}} 0
\\
L_y = 2y + 10\lambda y - 4\lambda x \xlongequal{\text{令}} 0
\\
L_\lambda = x^2 - 4xy + 5y^2 - 1 \xlongequal{\text{令}} 0
\end{cases}
$$
考虑使用齐次型化简转化研究对象,让 $xL_x + yL_y$:
$$
2(x^2 + y^2) + 2\lambda (x^2 - 4xy + 5y^2) = 0
$$
由于已知约束条件 $x^2 - 4xy + 5y^2 = 1$,故直接代入上式得:
$$
x^2 + y^2 = -\lambda
$$
求 $x^2 + y^2$最值的问题,成功转化为求 $-\lambda$ 最值的问题了
由于 $(x,y) \ne (0,0)$ 否则肯定不满足第三个方程 $L_\lambda(0,0) = -1 \ne 0$
故一、二两个方程 $L_x$ 和 $L_y$ 一定含有 非零解,故他们的 系数矩阵行列式 = $0$:
$$
\begin{vmatrix}
2+2\lambda & -4\lambda \\
-4\lambda & 2 + 10\lambda
\end{vmatrix} = 4\lambda^2 + 24\lambda + 4 = 0 \quad\Rightarrow\quad \lambda = -3 \pm 2\sqrt{2}
$$
由此可知 $x^2 + y^2$ 的最大值为 $3 + 2\sqrt{2}$,最小值为 $3 - 2\sqrt{2}$
对应到 $d = \sqrt{x^2 + y^2}$,$d_{min} = \sqrt{2} - 1$,$d_{max} = \sqrt{2} + 1$
利用二次型求解
根据 线性代数 知识我们知道,二次型 化成 标准型,可以通过 正交变换 实现
而 正交变换 有一个非常好的性质:保向量 模长 相等
这样就能利用该 性质,把原有的 约束条件,运用到新坐标下,产生新的 约束条件
适用的题型要求:
- 目标函数 $f(x_1,x_2,x_3)$ 是二次型
- 约束条件 $g$ 只含有平方项,形如 $x_1^2+x_2^2+x_3^2 = m$
这样,我们最终要找的 目标函数 最值,就分别是该 二次型矩阵 的 最大最小特征值
上述为直接结论,我会在下面这道例题中详细讲解原理
【例】求 $f(x_1,x_2,x_3)=x_1^2+x_2^2+3x_3^2-2x_1x_2$ 在约束条件 $x_1^2+x_2^2+x_3^2=1$ 上的最值
【解】目标函数 是 二次型,且 约束条件 为 平方和,考虑使用 二次型 计算
令 二次型 $f$ 对应的矩阵 $A = \begin{pmatrix}
1 & -1 & 0 \\
-1& 1 & 0 \\
0 & 0 & 3
\end{pmatrix}$
求出 $A$ 的 特征值,令 $|A - \lambda E| =0$
$$
\begin{vmatrix}
1-\lambda & -1 & 0 \\
-1& 1-\lambda & 0 \\
0 & 0 & 3-\lambda
\end{vmatrix} = - (\lambda - 3) \cdot \lambda \cdot (\lambda - 2)
$$
故可得特征值:$\lambda_1 = 0, \lambda_2 = 2, \lambda_3 = 3$
$\lambda = 0$ 时:$(A - 0 \cdot E) \rightarrow \begin{pmatrix}
1 & -1 & 0 \\
0 & 0 & 1 \\
0 & 0 & 0
\end{pmatrix} \quad\Rightarrow\quad \xi_1 = \begin{pmatrix}
1\\
1\\
0
\end{pmatrix} \quad\Rightarrow\quad e_1 = \dfrac{1}{\sqrt{2}}\begin{pmatrix}
1\\
1\\
0
\end{pmatrix}$
$\lambda = 2$ 时:$(A - 2 \cdot E) \rightarrow \begin{pmatrix}
1 & 1 & 0 \\
0 & 0 & 1 \\
0 & 0 & 0
\end{pmatrix} \quad\Rightarrow\quad \xi_2 = \begin{pmatrix}
-1\\
1\\
0
\end{pmatrix} \quad\Rightarrow\quad e_1 = \dfrac{1}{\sqrt{2}}\begin{pmatrix}
-1\\
1\\
0
\end{pmatrix}$
$\lambda = 3$ 时:$(A - 3 \cdot E) \rightarrow \begin{pmatrix}
1 & 0 & 0 \\
0 & 1 & 0 \\
0 & 0 & 0
\end{pmatrix} \quad\Rightarrow\quad \xi_3 = \begin{pmatrix}
0\\
0\\
1
\end{pmatrix} \quad\Rightarrow\quad e_3 = \begin{pmatrix}
0\\
0\\
1
\end{pmatrix}$
故存在 正交矩阵 $Q = (e_1,e_2,e_3), s.t. Q^TAQ = \Lambda = \begin{pmatrix}
0 & & \\
& 2 & \\
& & 3
\end{pmatrix}$
故存在 正交变换 $x = Q y, s.t. f(y_1,y_2,y_3) = 2y_2^2 + 3y_3^2$
由于 正交变换 是保向量模长的,故 $||x|| = ||y|| \Rightarrow y_1^2 + y_2^2 + y_3^2 = x_1^2 + x_2^2 + x_3^2 = 1$
故原命题就等价于:目标函数:$f(y_1,y_2,y_3) = 2y_2^2 + 3y_3^2$ 在 约束条件:$y_1^2 + y_2^2 + y_3^2 = 1$ 下的最值问题
因此,$f$ 的最大值就是把全部模长分给系数最大的分量,最小值就是分给系数最小的分量
即我在开头说过的,最大最小特征值
故 $f_{min} = 0, f_{max} = 3$
利用常见不等式求解
这里不会使用额外其他的不等式,我只介绍考研中常用的 均值不等式 和 柯西不等式
柯西不等式:
$$
(a_1^2+a_2^2+\cdots+a_n^2) \times (b_1^2+b_2^2+\cdots+b_n^2) \ge (a_1b_1+a_2b_2+\cdots+a_nb_n)^2
$$
当且仅当 $\dfrac{a_1}{b_1} = \dfrac{a_2}{b_2} = \dots = \dfrac{a_n}{b_n}$ 时,等号成立
均值不等式:
$$
\dfrac{a_1^2 + a_2^2 + \cdots + a_n^2}{n} \ge \sqrt[n]{a_1 \cdot a_2 \cdots a_n}
$$
当且仅当 $a_1 = a_2 = \cdots = a_n$ 时,等号成立
柯西不等式 建立的是 多项平方和 $\ge$ 多项和 的不等式
均值不等式 建立的是 多项平方和 $\ge$ 多项积 的不等式
一个是 平方和 到 和,一个是 平方和 到 积,这是我们考虑使用不等式时,首先要考虑的问题
【2018年19题】将 $2m$ 的铁丝分成三段,依次围城圆、正方形、正三角形。三个图形的面积之和是否存在最小值?若存在,求出最小值。
【解】令铁丝分给三个图形的长度分别为 $a ,b, c$,则 $a + b + c = 2$
通过已知周长分别计算出三个图形的面积,应为:$\dfrac{a^2}{4\pi}, \dfrac{b^2}{16}, \dfrac{c^2}{12\sqrt{3}}$
故 $S = \dfrac{a^2}{4\pi}+ \dfrac{b^2}{16}+ \dfrac{c^2}{12\sqrt{3}}$
原命题就等价于,目标函数 为 $S(a,b,c)$,在 约束条件 $a + b + c = 2$ 下的最小值
目标函数是 多项平方和,约束条件是 多项和,考虑选用 柯西不等式 放缩
构造柯西不等式:
$$
\begin{aligned}
\bigg[(\dfrac{a}{2\sqrt{\pi}})^2 + (\dfrac{b}{4})^2 + (\dfrac{c}{\sqrt{12\sqrt{3}}})^2\bigg] \cdot \bigg[(2\sqrt{\pi})^2 + 4^2 + (\sqrt{12\sqrt{3}})^2\bigg] &\ge (a + b + c)^2 \\
S \cdot \bigg[4\pi + 16 + 12\sqrt{3}\bigg] &\ge 4
\\
\dfrac{4}{4\pi + 16 + 12\sqrt{3}} &\le S
\\
\dfrac{1}{\pi + 4 + 3\sqrt{3}} &\le S
\end{aligned}
$$
故 $S_{min} = \dfrac{1}{\pi + 4 + 3\sqrt{3}}$,当且仅当 $\dfrac{a}{4\pi} = \dfrac{b}{16} = \dfrac{c}{12\sqrt{3}}$ 时等号成立
【2021年数一】设 $x,y,z$,满足 $\begin{cases}
x^2 + 2y^2-z = 6 \\
4x + 2y + z = 30
\end{cases}$,求 $z$ 的取值范围
【解】目标函数 $z$,约束条件 $\begin{cases}
x^2 + 2y^2 = z + 6 \\
4x + 2y = 30 - z
\end{cases}$
(1) 式左侧是 多项平方和,(2) 式左侧式 多项和 考虑 柯西不等式 放缩
构造 柯西不等式:
$$
\begin{aligned}
(x^2 + (\sqrt{2} y)^2) \cdot (4^2 + (\sqrt{2})^2) &\ge (4x + 2y)^2
\\
(z + 6) \cdot 18 &\ge (30 - z)^2
\\
z^2 - 78z + 792 &\le 0
\\
(z - 12)(z - 66) &\le 0
\\
\end{aligned}
$$
故 $z\in[12, 66]$