多元函数的Taylor公式与极值

多变量函数的微分学

张瑞
中国科学技术大学数学科学学院

多元函数的Taylor公式与极值

$D\subset\mathbb{R}^2$$M_0(x_0,y_0)$$M(x_0+h,y_0+k)$$D$中两点。若连接$M_0$, $M$的线段在$D$内,则

\[\phi(t)=f(x_0+th,y_0+tk), \quad t\in[0,1] \]

有定义。

  • $f(x,y)\in C^{1}(D)$, 由复合函数的求导法则,有
    \[\phi'(t)=\frac{\partial f}{\partial x}(x_0+th,y_0+tk)h+\frac{\partial f}{\partial y}(x_0+th,y_0+tk)k \]
    $\phi(t)\in C^{1}([0,1])$
  • 类似地,若$f(x,y)\in C^{n+1}(D)$,则$\phi(t)\in C^{n+1}([0,1])$

由一元函数的Taylor公式,有

\[\phi(t)=\sum_{m=0}^n\frac{\phi^{(m)}(0)}{m!}t^m +\frac{\phi^{(n+1)}(\theta t)}{(n+1)!} t^{n+1} , \theta\in(0,1) \]

\[\phi'(t)=f'_x(x_0+th,y_0+tk)h +f'_y(x_0+th,y_0+tk)k \]

因此

\[\phi'(0)=\left.\left(h\frac{\partial f}{\partial x}+k\frac{\partial f}{\partial y}\right)\right|_{M_0} \]

\[\begin{aligned} \phi''(t)=&\left(\frac{\partial f}{\partial x}(x_0+th,y_0+tk)h +\frac{\partial f}{\partial y}(x_0+th,y_0+tk)k\right)' \\ =& h(f''_{xx}h+f''_{xy}k)|_{(x_0+th,y_0+tk)} + k(f''_{yx}h+f''_{yy}k)|_{(x_0+th,y_0+tk)} \\ =&(h^2f''_{xx}h+2hkf''_{xy}+k^2f''_{yy})|_{(x_0+th,y_0+tk)} \\ \end{aligned} \]

因此

\[\phi''(0)=\left.\left(h^2\frac{\partial ^2f}{\partial x^2}+2hk\frac{\partial ^2f}{\partial x\partial y}+k^2\frac{\partial ^2f}{\partial y^2}\right)\right|_{M_0} \]

利用归纳法,可以得到

\[\begin{aligned} \phi''(0)=&\left.\left(h^2\frac{\partial ^2f}{\partial x^2}+2hk\frac{\partial ^2f}{\partial x\partial y}+k^2\frac{\partial ^2f}{\partial y^2}\right)\right|_{M_0} \\ \phi^{(m)}(0)=&\left.\sum_{l=0}^mC_m^lh^lk^{m-l}\frac{\partial ^mf}{\partial x^l\partial y^{m-l}}\right|_{M_0} \end{aligned} \]

引入算符

\[ \mathcal{D}=h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y} \]

则有

\[\mathcal{D}^m=\left(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y}\right)^m =\sum_{l=0}^mC_m^lh^lk^{m-l}\frac{\partial ^m}{\partial x^l\partial y^{m-l}} \]

这样,

\[\phi^{(m)}(0)=\left(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y}\right)^mf \bigg|_{(x_0,y_0)} \]

或者写为$\phi^{(m)}(0)=\left(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y}\right)^m f{(x_0,y_0)}$

二元函数的Taylor公式

定义 1. (凸区域)
平面区域$D$称为凸区域,如果$D$中任意两点的连线都包含在$D$中。

Taylor公式

定理 1. (Taylor公式)
$D\subset\mathbb{R}^2$为凸区域,$f\in C^{n+1}(D)$。若$(x_0,y_0)$$(x_0+h,y_0+k)\in D$,则存在$\theta\in(0,1)$,满足

\[f(x_0+h,y_0+k)=\sum_{m=0}^n\frac1{m!}\left(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y}\right)^mf(x_0,y_0)+R_n \]

其中

\[R_n=\frac{1}{(n+1)!}\left(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y}\right)^{n+1}f(x_0+\theta h,y_0+\theta k) \]

称为Lagrange余项

特别地,在$(0,0)$处展开的Taylor公式也叫MacLaurin公式

带Peano余项的Taylor公式

定理 2.
$D\subset\mathbb{R}^2$为凸区域,$f\in C^{n}(D)$。若$(x_0,y_0)$$(x_0+h,y_0+k)\in D$,则有

\[f(x_0+h,y_0+k)=\sum_{m=0}^n\frac1{m!}\left(h\frac{\partial }{\partial x}+k\frac{\partial }{\partial y}\right)^mf(x_0,y_0)+R_n \]

其中$R_n=o(\rho^n), \rho=\sqrt{h^2+k^2}\to 0$。称为Peano余项公式

一阶展开公式

\[f(x_0+h,y_0+k)=f(x_0,y_0)+\frac{\partial f}{\partial x}(x_0,y_0)h+\frac{\partial f}{\partial y}(x_0,y_0)k+R_1 \]

二阶展开公式

\[\begin{aligned} f(x_0+h,y_0+k) =&f(x_0,y_0)+\frac{\partial f}{\partial x}(x_0,y_0)h+\frac{\partial f}{\partial y}(x_0,y_0)k \\ &+\frac12(Ah^2+2Bhk+Ck^2)+R_2 \end{aligned} \]

其中

\[A=\frac{\partial ^2f}{\partial x^2}(x_0,y_0),B=\frac{\partial ^2f}{\partial x\partial y}(x_0,y_0),C=\frac{\partial ^2f}{\partial y^2}(x_0,y_0) \]

定义 2.
称矩阵

\[Hf(x_0,y_0)=\begin{pmatrix} \frac{\partial ^2f}{\partial x^2}(x_0,y_0) & \frac{\partial ^2f}{\partial x\partial y}(x_0,y_0) \\ \frac{\partial ^2f}{\partial x\partial y}(x_0,y_0) & \frac{\partial ^2f}{\partial y^2}(x_0,y_0) \end{pmatrix} \]

为二元函数$f(x,y)$$(x_0,y_0)$处的Hesse矩阵

 

显然,$Ah^2+2Bhk+Ck^2$为对称矩阵$Hf(x_0,y_0)$确定的二次型。

例 1. (例6.5.1) $f(x,y)=e^x\cos y$的MacLaurin公式展开到二次项

例 2. $\frac{\cos x}{\cos y}$的MacLaurin公式展开到二次项

例 3. $\arctan\frac{1+x+y}{1-x+y}$的MacLaurin公式展开到二次项

例 4. $f(x,y)=x^y$$(1,1)$处展开到二次项

2

chap6-5-ex2

3

chap6-5-ex3

多元函数的极值

一元时候,利用一阶导数与二阶导数,可以研究函数的极值。多元函数的时候是类似的。

定义 3.
$f(x,y)$为区域$D\subset\mathbb{R}^2$上的二元函数,$(x_0,y_0)\in D$。若存在$(x_0,y_0)$的邻域$U$,使得

\[f(x,y)\geq f(x_0,y_0), \forall (x,y)\in U \]

则称$(x_0,y_0)$为函数$f$的一个极小值点$f(x_0,y_0)$称为$f$的一个极小值。类似可以定义极大值和极大值点。极小值点和极大值点统称为极值点

定理 3.
若可微函数$f(x,y)$$(x_0,y_0)$取到极值,则

\[\frac{\partial f}{\partial x}(x_0,y_0)=0 , \frac{\partial f}{\partial y}(x_0,y_0)=0 \]

定义 4.
两个偏导数都为$0$的点,称为驻点

定理表明:极值点一定是驻点。

但驻点不一定是极值点。如$f(x,y)=xy$$(0,0)$处。

chap6-5-ex-xy

驻点什么时候是极值点呢?

类似1维情形,需要考察2阶偏导数的状态。

定理 4.
$f(x,y)$为区域$D$上的$C^2$函数,$(x_0,y_0)\in D$$f(x,y)$的驻点。记$\Delta=AC-B^2$,其中

\[%A=\frac{\partial ^2f}{\partial x^2}(x_0,y_0),B=\frac{\partial ^2f}{\partial x\partial y}(x_0,y_0),C=\frac{\partial ^2f}{\partial y^2}(x_0,y_0) A=f''_{xx}(x_0,y_0), B=f''_{xy}(x_0,y_0), C=f''_{yy}(x_0,y_0) \]

则:

(1) $\Delta>0$时,

  • $A>0$$(x_0,y_0)$为严格极小值点;
  • $A<0$$(x_0,y_0)$为严格极大值点;

(2) $\Delta<0$时,$(x_0,y_0)$不是极值点。

(3) $\Delta=0$时,不能断定$(x_0,y_0)$是否是极值点。

. 由Taylor展开,有

\[f(x,y)-f(x_0,y_0)=\frac12(Ah^2+2Bhk+Ck^2)+o(\rho^2) \]

其中$h=x-x_0$, $k=y-y_0$, $\rho=\sqrt{h^2+k^2}$。而

\[\begin{aligned} f(x,y)-f(x_0,y_0) =&\frac12(Ah^2+2Bhk+Ck^2)+o(\rho^2) \\ =&\frac{\rho^2}2\left(A\frac{h^2}{\rho^2}+2B\frac{hk}{\rho^2}+C\frac{k^2}{\rho^2}\right)+o(\rho^2) \\ \end{aligned} \]

$\frac{h}\rho=\cos\alpha$, $\sin\alpha=\frac{k}\rho$

$f(x,y)-f(x_0,y_0) =\frac{\rho^2}2 \phi(\alpha)+o(\rho^2)$, 其中

\[\phi(\alpha) = A\cos^2\alpha+2B\cos\alpha \sin\alpha +C \sin^2\alpha, \alpha\in[0,2\pi] \]

它是$[0,2\pi]$上的连续函数。

\[\begin{aligned} \phi(\alpha) =&A\left(\cos\alpha+\frac{B}A \sin\alpha\right)^2+\frac{AC-B^2}{A} \sin^2\alpha \end{aligned} \]

注意到$\cos\alpha+\frac{B}A\sin\alpha$$\cos\alpha$不同时为0,则

  • $A>0, AC-B^2>0$时,$\phi(\alpha)>0, \forall\alpha\in[0,2\pi]$
  • $A<0, AC-B^2>0$时,$\phi(\alpha)<0, \forall\alpha\in[0,2\pi]$
  • $AC-B^2<0$时,$\phi(\alpha)$$[0,2\pi]$中的值有正、有负

$A>0, AC-B^2>0$时,有$\phi(\alpha)>0, \forall\alpha\in[0,2\pi]$

由闭区间上连续函数的特性知,存在$m>0$成立

\[\phi(\alpha)\geq m> 0, \forall\alpha\in[0,2\pi] \]

这样,$\rho<\delta$充分小时,有$|\frac{2}{\rho^2}o(\rho^2)|<\frac{m}2$,从而

\[\begin{aligned} f(x,y)-f(x_0,y_0) =&\frac{\rho^2}2 \phi(\alpha)+o(\rho^2) \\ =&\frac{\rho^2}2\left( \phi(\alpha)+\frac{2}{\rho^2}o(\rho^2) \right) \\ \geq & \frac{\rho^2m}4 >0, \rho<\delta \end{aligned} \]

$(x_0,y_0)$极小值点

例 5. $z=x^2-(y-1)^2$

例 6. $z=(x-y+1)^2$

例 7. $z=x^2y^3(6-x-y)$

例 8. $z=\sin x+\cos y+\cos(x-y) , x\in[0,\frac{\pi}2], y\in[0,\frac{\pi}2]$

例 9. (例6.5.5) 求由方程$x^2+2xy+2y^2=1$所确定的隐函数$y=y(x)$的极值。

例 10. 求函数在区域$x\in[0,\pi]$, $y\in[0,\pi]$, $z\in[0,\pi]$的极值

\[u=\sin(x) + \sin(y)+\sin(z)-\sin(x+y+z) \]

9.

chap6-5-ex9

条件极值

定义 5.
$\partial D$是方程所表示的隐式曲线。

\[\phi(x,y)=0 \]
  • $f(x,y)$$\partial D$上的极大值点$M_0(x_0,y_0)$是指$\phi(x_0,y_0)=0$,且在$M_0$的某个邻域中,凡是满足$\phi(x,y)=0$的点$M(x,y)$都满足
    \[f(x,y)\leq f(x_0,y_0) \]
  • 类似可以定义$f(x,y)$$\partial D$上的极小值点

这种极值称为条件极值$f(x,y)$称为问题的目标函数,方程$\phi(x,y)=0$称为联系方程约束条件

  • 若能够从$\phi(x,y)=0$解出$y=y(x)$,则极值问题变为求
    \[z(x)=f(x,y(x)) \]
    的极值。这是通常意义下的极值问题。
  • 当联系方程比较复杂时,如何做?

$\phi(x,y)$$C^1$函数,且$\phi'_x(x,y), \phi'_y(x,y)$中至少有一个不为$0$

  • 假设$(x_0,y_0)$是一个条件极值点,
  • 不防设$\phi'_y(x_0,y_0)\neq0$,则存在定义在$x_0$附近的隐函数$y=y(x)$
  • $x_0$为一元函数 $g(x) = f(x,y(x))$ 的极值点,因此有
    \[g'(x_0)=f'_x(x_0,y_0)+f'_y(x_0,y_0)y'(x_0)=0 \]
  • $\phi(x,y(x))=0$,知$y'(x_0)$满足
    \[\phi'_x(x_0,y_0)+\phi'_y(x_0,y_0)y'(x_0)=0 \]
  • 得到
    \[{f'_x(x_0,y_0)}={f'_y(x_0,y_0)}\frac{\phi'_x(x_0,y_0)}{\phi'_y(x_0,y_0)} \]

$\lambda = -\frac{f'_x(x_0,y_0)}{\phi'_x(x_0,y_0)} $,则有

\[\begin{aligned} {f'_x(x_0,y_0)}+\lambda {\phi'_x(x_0,y_0)}=0 \\ {f'_y(x_0,y_0)}+\lambda {\phi'_y(x_0,y_0)}=0 \\ \end{aligned} \]

联合$\phi(x_0, y_0)=0$即可求解点$(x_0, y_0)$

这个式子对$\phi'_y(x_0,y_0)\neq0$时也成立。

  • $\phi'_x(x_0,y_0)\neq0$,则存在定义在$y_0$附近的隐函数$x=x(y)$
  • 类似分析可以得到
    \[{f'_y(x_0,y_0)}={f'_x(x_0,y_0)}\frac{\phi'_y(x_0,y_0)}{\phi'_x(x_0,y_0)} \]

Lagrange乘数法

为便于记忆。引入辅助函数

\[F(x,y,\lambda)=f(x,y)+\lambda\phi(x,y) \]

则辅助函数的极值点满足

\[\begin{aligned} F'_x(x,y,\lambda)=&f'_x(x,y)+\lambda\phi'_x(x,y)=0, \\ F'_y(x,y,\lambda)=&f'_y(x,y)+\lambda\phi'_y(x,y)=0, \\ F'_{\lambda}(x,y,\lambda)=&\phi(x,y)=0 \end{aligned} \]

因此,条件极值的点,就是辅助函数的驻点。

这种方法称为Lagrange乘数法$\lambda$称为Lagrange乘子

一般多维条件极值

考虑目标函数$f(x_1,\cdots,x_n)$$m(<n)$个约束条件

\[\begin{cases} \phi_1(x_1,\cdots,x_n)=0 \\ \phi_2(x_1,\cdots,x_n)=0 \\ \cdots \\ \phi_m(x_1,\cdots,x_n)=0 \end{cases} \]

下的极值问题,可以类似地求辅助函数

\[F(x_1,\cdots,x_n,\lambda_1,\cdots,\lambda_m) =f+\lambda_1\phi_1+\cdots+\lambda_m\phi_m \]

的极值点,在这些极值点中找条件极值点。

找到函数$F$的驻点为$x_1^0,\cdots,x_n^0,\lambda_1^0,\cdots,\lambda_m^0$, 如何判定是极大值还是极小值?

考察

\[\Delta =f(x_1,\cdots,x_n)-f(x_1^0,\cdots,x_n^0) \]

的符号。注意到点$(x_1,\cdots,x_n)$也需要满足约束条件,则

\[\Delta = \tilde F(x_1,\cdots,x_n)-\tilde F(x_1^0,\cdots,x_n^0) \]

其中$\tilde F$$F$$\lambda_i$取值为$\lambda_i^0$

\[\tilde F(x_1,\cdots,x_n)=f(x_1,\cdots,x_n) +\lambda_1^0\phi_1 +\lambda_m^0\phi_m \]

可以看到,

  • $d^2\tilde F(x_1^0,\cdots,x_n^0)>0$,则$(x_1^0, \cdots, x_n^0)$是极小值点。
  • $d^2\tilde F(x_1^0,\cdots,x_n^0)<0$,则$(x_1^0, \cdots, x_n^0)$是极大值点。

需要特别注意的是,在判定$d^2\tilde F$符号的过程中, $dx_1,\cdots,dx_n$并不是独立的,它们需要满足约束

\[\phi_i(x_1,\cdots,x_n)=0, \Rightarrow \frac{\partial \phi_i}{\partial x_1}dx_1+\cdots +\frac{\partial \phi_i}{\partial x_n}dx_n=0 , i=1,\cdots,m \]

例 11. 求在约束条件$x+y=1$下,$z=xy$的极值

例 12. 求在约束条件$x+2y+3z=a$, $x>0$, $y>0$, $z>0$, $a>0$下,$u=xy^2z^3$的极值

例 13. (例6.5.9) 求在约束条件$x_1+x_2+\cdots+x_n=a$, $x_i>0$下,$x_1x_2\cdots x_n$的极值

例 14. 求在约束条件$\frac{x_1}{a_1}+\frac{x_2}{a_2}+\cdots+\frac{x_n}{a_n}=1, (a_i>0)$下, $x_1^2+x_2^2+\cdots +x_n^2$的极值

例 15. 求在约束条件$x^2+\frac{y^2}4=1$下,$x^2+y^2$的极值

例 16. $y=x^2$$x-y-2=0$间的最短距离

11

目录

谢谢

例 17. 本节读完

例 18. 考察函数

\[u=x^3-4x^2+2xy-y^2 , (x,y)\in[-5,5]\times[-1,1] \]

的极值和最值。

例 19. 确定函数$u=x^2+y^2-12x+16y$,在$x^2+y^2\leq 25$上的上确界和下确界。

例 20. 证明不等式

\[\displaystyle \frac{x^n+y^n}2\geq\left(\frac{x+y}2\right)^n, n\geq 1, x\geq 0, y\geq 0 \]

17.