【重拾数学知识】导数、极值和最值 - 一起AI技术

让AI知识触手可及

首页 » 【重拾数学知识】导数、极值和最值

日期： 2024-06-11
时间： 15:07
作者： Dongming
阅读量: 3,350

文章目录

前言

在深度学习中，梯度下降法是一种常用的优化算法，用于更新模型参数以最小化损失函数。这梯度下降法中涉及到数学中的导数、极值等相关知识，因此我们重新回顾相关内容，以便加深理解。

相关概念

导数

一个问题

如何求得一个曲线f(x)中任意一点(x0)的斜率？

核心思想：在曲线上另外存在一个P点，P点无限接近x0，x0和P的连线将无限接近x0点的斜率。

在上图中：

我们求x0点和P点的之间的斜率为：

斜率公式：

$k = \frac{y_1-y_2}{x_1-x_2} = \frac{f(x_0+Δx) - f(x_0)}{Δx}$
加入极限条件Δx→0趋近于0时

$f'(x) = lim(Δx->0) \frac{f(x + Δx) - f(x)}{Δx}$

定义

导数表示函数 f(x) 在某一点 x 处的变化率(或斜率)，通常记作 f'(x) 或 df/dx。

常见求导公式

偏导

接着，我们看下什么是偏导。如下图所示：

在左侧的二维平面中，一元函数f(x)在x0的导数为x0点的斜率，即为导数；
在右侧的三维空间中，二元函数z = f(x,y)，在固定住y坐标轴(即：y=y0，如图中黑色线段向下切所示)时，求z=f(x, y0)在x0的导数，即为偏导数。

定义

偏导数是多元函数在某一点上对某个特定变量的导数，即函数在该点上沿着某个坐标轴方向的变化率。

偏导数本质上是在多元函数中，通过固定某一变量为常量，将多元降维。

极值与最值

在下面图例函数中，

$f(x) = \frac{1}{3}x^3 + \frac{1}{2}x^2 - 2x - 1$

通过求导，得到导数为

$f'(x) = x^2 + x -2$

其中：

解方程f'(x) = 0，得到极值点为 x = -2 和 x = 1
- 当x = -2时，f'(x) < 0；
- 当x = 1 时，f'(x) > 0；
- 也就是说：x=-2的左侧是单调递增，x=-2到x=1之间是单调递减，x=-2这个点比左边要高，比右侧也要高，我们把这种点成为极值点。

定义

极值是函数在某一点或某一区间内取得的最大值或最小值。极大值是函数在该点附近取得的最大值，极小值是函数在该点附近取得的最小值。
最值是函数在定义域内取得的最大值或最小值。最大值是函数在整个定义域内取得的最大值，最小值是函数在整个定义域内取得的最小值。

特别注意：极值≠最值；一个曲线在一段区间内，可能有多个极值，但最值只有一个。

极大值和极小值

若x0是极值点，则f'(x0) = 0，这种情况下有两种可能：

若导函数由正往负，那么对应原函数先增后减，那么x0为极大值点。
若导函数由负往正，那么对应原函数先减后增，那么x0为极小值点。

参考资料

B站：《"导数"一课通！1h零基础上手》

B站：《“偏导数”一课通！1h零基础上手！|高数下》

欢迎关注公众号以获得最新的文章和新闻

声明：一起AI技术所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。
原创不易，内容版权受保护，感谢您的尊重与支持。

2人评论了“【重拾数学知识】导数、极值和最值”

李泉亮
2024-06-12 在下午1:38

牛！梯度和梯度下降我还是不太懂

登录以回复
郑滔
2024-07-01 在上午9:22

感谢整理！非常有用！

登录以回复

发表评论取消回复

要发表评论，您必须先登录。

见天地，见众生，见自己。

分类文章

机器学习 583

深度学习 456

模型训练 269

计算机视觉 269

自然语言处理 221

模型部署 75

数学知识 24

环境配置 16

项目实战 15

模型评估 15

推荐活动

推荐文章

【工具技巧】使用mcp工具进行tapd的快速操作

2026-01-05

3 weeks ago

【工具技巧】ClaudCodeRouter的使用方法简介

2025-12-19

1 month ago

【项目实战】通过ClaudeCode进行one-api系统改造的实践过程总结

2025-10-24

3 months ago

【工具技巧】通过ClaudeCode的Skills实现Excel文件的读写

2025-11-12

2 months ago

【工具技巧】通过ClaudeCode的Skills实现周报自动发送

2025-11-04

2 months ago

【工具技巧】通过Claude Code+K2模型编写Dify插件的实践过程

2025-07-17

6 months ago

【工具技巧】Claude Code 使用技巧

2025-10-23

3 months ago

【工具技巧】通过ClaudeCode实现技术交底书agent

2025-10-30

2 months ago

【工具技巧】Claude Code+Deepseek模型的配置使用方法

2025-09-30

3 months ago

【项目实战】通过多模态+LangGraph实现PPT生成助手

2025-06-09

7 months ago