月度归档:2022年11月

1.9 导数与函数极值

费马定理给出了极值的必要条件,如何给出充分条件?这节将介绍导数与极值的关系,从而给出函数极值的几个充分条件。当然,讲到极值就离不开最大和最小值,极值一般指函数的局部属性,而最大值与最小值反映了函数一种整体属性.本节主要讨论极值与最大值、最小值的判定和求法。
极值定义:设函数y=f(x)在点x_0\delta领域内有定义,如果对去心领域内任何一点x都有f(x_0 )\le f(x)(或f(x_0 )\ge f(x)),则称f(x_0)是函数f(x)的极小值,或为极大值。
函数的极大值与极小值统称为函数的极值,使函数取得极值的点称为极值点。
如何判断一点是否为函数的极值点?费马定理只给出了极值点的必要条件,极值点的充分条件如何呢?这里介绍一种使用导数来判断是否极值的方法。
1)利用一阶导数
设函数f(x)在点x_0连续,在点x_0的某去心领域可导。
x\in(x_0-\delta,x_0),f'(x)<0; x\in(x_0,x_0+\delta),f'(x)>0,则函数f(x)在点x_0处取得极小值;
x\in(x_0-\delta,x_0),f'(x)>0; x\in(x_0,x_0+\delta),f'(x)<0,则函数f(x)在点x_0处取得极大值;
x\in(x_0-\delta,x_0),or x\in(x_0,x_0+\delta),f'(x)符合保持不变,则函数f(x)在点x_0处没有极值。
2)利用二阶导数
设函数f(x)在点x_0处二阶可导,且x_0为驻点(即f'(x_0 )=0)
f''(x_0 )<0, 则函数f(x)在点x_0处取得极大值; 如f''(x_0 )>0, 则函数f(x)在点x_0处取得极小值;
f''(x_0 )=0, 则函数f(x)在点x_0不一定取得极值,需进一步分析。
驻点、拐点、极值点、鞍点的异同(这里的函数为一元函数)

例1:判断下列函数在x=0处的情况
y=10x^2,y=10x^3
解:
这两个函数的图像为:
从图可知:

第1章 一元函数微积分

一元函数是微积分的核心内容,微积分为研究函数性质提供了理论和方法,在机器学习中被广泛使用,尤其在寻找函数极值方面。

1.1 导数的定义

导数定义为函数f(x)的自变量变化趋于0时,函数值的变化量与自变量变化量比值的极限,函数y=f(x)在x点处的导数定义为:
f'(x)=\underset{\Delta x \to 0}{lim} \frac{f(x+\Delta x)-f(x)}{\Delta x} \tag{5.1}
如果式(5.1)的极限存在,则称函数f(x)在x点处可导。
例1 当f(x)=3x时,
f'(x)=\underset{\Delta x \to 0}{lim}\frac{3(x+\Delta x)-3x}{\Delta x}=\underset{\Delta x \to 0}{lim}\frac{3\Delta x}{\Delta x}=3
例2 f(x)=x^2时,
\begin{aligned}f'(x)&=\underset{\Delta x \to 0}{lim}\frac{(x+\Delta x)^2-x^2}{\Delta x}\\&=\underset{\Delta x \to 0}{lim}\frac{2x\Delta x+(\Delta x)^2}{\Delta x}\\&=\underset{\Delta x \to 0}{lim}(2x+\Delta x)\\&=2x \end{aligned}
已知函数f(x),求导函数f'(x) ,称为对函数f(x)求导。当式(5.1)的极限存在时,称函数可导。导函数的含义如图5-1所示。作出函数f(x)的图像, f'(x)表示图像切线的斜率。
图5-1 导数的含义,f'(x)表示切线PQ的斜率。

式(5.1)的极限也可写成如下形式:
f'(x_0)=\underset{\Delta x \to x_0}{lim}\frac{f(x)-f(x_0)}{x-x_0} \tag{5.2}
式(5.1)与式(5.2)是等价的。
函数y=f(x)在x点处的导数除用f^' (x)表示之外,以下表达式是等价的。
f'(x)=y'=\frac{dy}{dx}=\frac{df}{dx}=\frac{d}{dx}f(x)=Df(x)
其中\frac{d}{dx}和D是微分运算符,表示微分操作。常见函数的微分有:
Dc=0(c是一个常数)
Dx^a=ax^{a-1} (a是任意实数)
De^x=e^x
Dln(x)=\frac{1}{x}
Dsinx=conx
Dconx=-sinx
基本函数的求导公式:
幂函数:(x^a )'=ax^{a-1}
指数函数:
(e^x )'=e^x
(a^x )'=a^x lna
三角函数:
(sinx )'=cosx
(cosx )'=-sin x
(tanx )'=\frac{1}{{cos}^2 x}={sec}^2 x
(cotx )'=\frac{-1}{{sin}^2 x}={-csc}^2 x
对数函数:
(lnx )'=\frac{1}{x}
(log_ax )'=\frac{1}{lna\frac{1}{x} }

1.2 导数的四则运算

1)加法
(f(x)+g(x))'=f'(x)+g'(x)
2)减法
(f(x)-g(x))'=f'(x)-g'(x)
3)乘法
(cf(x))'=cf'(x)
(f(x)g(x))'=f'(x)g(x)+f(x)g'(x)
4)除法
(\frac{f(x)}{g(x)})'=\frac{f'(x)g(x)-f(x)g'(x)}{g^2(x)}
5)倒数
(\frac{1}{f(x)})'=-\frac{f'(x)}{f^2(x)}

1.3 复合函数的导数

假设z=f(y),y=g(x)
则复合函数z=f(g(x))的导数为:
z'=f'(g(x))g'(x)\tag{5.3}
或写成如下:
\frac{dz}{dx}=\frac{dz}{dy}\frac{dy}{dx}\tag{5.4}
这称为链式法则,这个公式可以推广到多元函数。
例 3: 求sin(x^2)的导数
该函数是sin(x)x^2的复合函数,其导数为
(sin(x^2))'=cos(x^2)(x^2)'=2xcos(x^2)
练习:
1.求函数f(x)=\frac{1}{2}x^2+3x+4的导数。
2.求函数f(x)=(x^2+x)sin(x)的导数。
3.求函数f(x)=\frac{1}{1+e^{-x}}的导数,该函数也称为sigmoid函数。

1.4 高阶导数

对导数继续求导可以得到高阶导数,如二阶导数是一阶导数的导数,表示为:
f''(x)\frac{d^2 y}{dx^2}
例如:求函数f(x)=x^3+e^{-x}的二阶导数
其一阶导数为:f'(x)=3x^2+e^{-x}\times(-1)=3x^2-e^{-x}
其二阶导数为: f''(x)=6x+e^{-x}

1.5 导数与极值点

函数导数与极值点有一定关系,费马定理说明了两者的关系,费马定理的具体内容为:
假设函数f(x)在点x_0点可导,如果在x_0点处取得极值,则必定有:
f'(x_0 )=0
费马定理给出了可导函数取极值的一阶必要条件,导数为0的点又称为函数的驻点。
【注意】导数为0是函数取极值的必要条件,而不是充分条件。即
f'(x_0)=0\nRightarrow x_0f(x)的极值点。
例如,f(x)=x^3,在x=0处的导数为0,但x=0不是函数f(x)的极值点,如下图所示:

函数f(x)=x^3的图形
不过我们通常通过求函数的驻点来寻找函数的候选极值点。在SVM算法中使用。
如果函数f(x)在点x_0处导数等于0,是否存在x_0为极值点的充分条件呢?当然有:
(1)通过判断点x_0,左右侧导数来确定是极大还是极小值;
(2)如果函数f(x)存在二阶导数,则可通过在点x_0二阶导数大于0还是小于0来判断;
(3)如果函数f(x)为凸(或凹)函数,则驻点就是极值点。

1.6 导数与中值定理

微分中值定理建立了导数与函数值之间的关系,是导数应用的基础,在微积分理论中占有重要地位,本节将介绍 3 个中值定理,先介绍罗尔定理,然后再由它推出拉格朗日中值定理、柯西中值定理。
1、中值定理概览

2、简单证明
(1)证明罗尔中值定理:
基本思路:根据费马定理,要证明函数f(x)在某点导数为0,如果能说明这点为极值即可。如果f(x)在[a,b]为常数,则在该区域内,导数处处为0;如果函数f(x)不为常数,因f(x)在[a,b]上连续,故其在[a,b]上必定存在极值点,因f(a)=f(b),所以,这个极值点,不在端点a或b上,即在(a,b)至少存在一点\zeta,为函数f(x)的极值点,根据费马定理可得,该点的导数必为0,即有:f'(\zeta)=0
(2)拉格朗日中值定理
罗尔中值定理中条件f(a)=f(b)比较严苛,拉格朗日中值定理去掉这个条件,不过通过构造一个辅助函数,在利用罗尔中值定理可证明拉格朗日中值定理。
该辅助函数为:g(x)=f(x)-\frac{f(b)-f(a)}{b-a}x
可以证明g(a)=g(b),然后利用罗尔中值定理即可证明。
(3)柯西中值定理
通过构造一个辅助函数,再利用罗尔中值定理便可证明,该辅助函数为:
F(x)=f(x)-f(a)-\frac{f(b)-f(a)}{b-a}(g(x)-g(b))
可以证明F(a)=F(b),然后再利用罗尔中值定理便可证明。
3、实例
例1:证明当x>0,ln(x+1)<x 证明: 设f(t)=ln(t+1),显然f(t) 在[0,x]上满足拉格朗日中值定理,故在(0,x)中至少存在一点\zeta使得下式成立: f'(\zeta)=\frac{f(x)-f(0)}{x} 代入f(t)=ln(t+1)得:\frac{1}{1+\zeta}=\frac{f(x)-f(0)}{x}=\frac{ln(x+1)}{x}\zeta>0,故有:\frac{ln(x+1)}{x}<1,从而ln(x+1)<x

1.7 导数与函数的单调性

函数导数与函数的单调性有密切关系,当然需要满足一定条件。
定理;假设函数f(x) 在[a,b]连续,在(a,b)上可导,则有:
(1)如果在(a.b)内f'(x)>0 时,那么函数f(x)在[a,b]内单调递增;
(2)如果在(a.b)内f'(x)<0 时,那么函数f(x)在[a,b]内单调递减。
证明:利用拉格朗日中值定理可以证明。
在[a,b]上,任取两点x_1,x_2 (x_1<x_2),由拉格朗日中值定理可得: 在(x_1,x_2)内,至少存在一点\zeta,使得下式成立: f'(\zeta)=\frac{f(x_2 )-f(x_1)}{x_2-x_1} 这里f'(\zeta)>0,x_1<x_2 从而可得:f(x_2 )>f(x_1),即函数f(x)在[a,b]单调递增
同理可证明在(a,b)内f'(x)<0时,函数f(x)在[a,b]内单调递减。 例1:证明当x>0时,lnx<x-1
证明:令f(x)=x-1-lnx
f'(x)=1-\frac{1}{x}=\frac{x-1}{x}
0<x\le 1时,f'(x)<0,函数单调递减,所以f(x)>f(1)=0
x>1时,f'(x)>0,函数单调递增,所以f(x)>f(1)=0
所以,当x>0时,f(x)>0,即:lnx<x-1

1.8 导数与函数的凹凸性

函数的单调性反映在图形上就是曲线的上升或下降,但上升或下降过程中还
要考虑曲线的弯曲方向,如下图所示:

两条弧线都是上升的,但ADB 是凸的曲线弧,而ACB 是凹的曲线弧,即两者凹凸性不同.下面来讨论曲线的凹凸性及其判定方法.曲线的凹凸性可以用连接曲线弧上任意两点的弦的点与弧线上弦的点具有相同横坐标的点的位置关系来描述,我们有如下定义:
【说明】这里的定义以机器学习中命名为准,国内高中的凹凸定义可能与之相反。

例1,判断曲线y=x^3的凹凸性
解:该曲线的图像为:

当x>0时,y''=6x>0,y为凸函数
当x<0时,y''=6x<0,y为凹函数
【注意】这里函数y=x**3的凹凸性在点(0,0)处发生改变,我们称这样的点为拐点。
拐点的定义:
设y=f(x)在区间I上连续,x_0是I内的点.如果曲线y=f(x)在经过点(x_0,f(x_0))时,曲线的凹凸性(或函数二阶导的符号)改变了,那么就称点(x_0,f(x_0))为这曲线的拐点(反曲点)。需要明确的是:拐点是曲线上的一点,它由横坐标和纵坐标构成,不要只把横坐标当成拐点。

1.9 导数与函数极值

1.10泰勒公式

1.11最小二乘法应用实例