广义梯度:在优化与非光滑分析中,对“不可微”或“分段可微”的函数,将传统梯度(gradient)的概念推广得到的“梯度替代物”。常见形式包括 Clarke 广义梯度(把附近可微点的梯度进行凸包化),用于描述方向变化并支持最优化算法的收敛分析。
(注:在某些语境中也可泛指“推广后的梯度概念”,具体定义依所用理论而定。)
/ˈdʒɛnərəlaɪzd ˈɡreɪdiənt/
The generalized gradient is useful when the function is not differentiable.
当函数不可微时,广义梯度很有用。
Using the generalized gradient, the algorithm can handle kinks and still converge under mild conditions.
借助广义梯度,该算法可以处理函数的“折点/尖点”,并在较弱条件下仍然收敛。
generalized 来自 generalize(使一般化、推广),表示“把原本适用于特定情况的概念扩展到更广范围”。gradient 源自拉丁语 *gradi-*(步、级),在数学里指“变化率的方向与大小”。合在一起,generalized gradient 就是“把梯度这一概念推广到更一般(尤其不可微)情形”。