约束优化一阶最优性条件

优化模型

可行域 (集):

不等式约束的KKT条件

  • 下降方向与可行方向:
    可行方向锥: ,有
    下降方向锥:
  • 几何最优性条件:
    局部最优解处不存在可行且下降的方向
    设考虑约束优化问题 ,其中 为非空集合, . 处可微. 若 是该问题的一个局部最优解,则 .

Proof.
反证法. 假设存在 ,则 .
,对 ,有 ;
,对 ,有 .
,则当 ,有 , 与 为局部最优解矛盾.


  • 几何最优性条件的化简:
    用局部约束方向锥描述可行方向锥
    ,记 在点 处的局部约束方向锥 (或内方向锥).
    其中 称为积极约束指标集.
    于是以上几何约束条件可简化为: 设 处可微, 处连续,如果 是局部最优解,则 .
  • FJ条件
    将交集为空视为不等式联立无解
    处可微, 处连续,若 是局部最优解,则存在不全为零的数 ,使得

也可写作:


Proof. 由几何最优性条件和Gordan定理直接可得.
Gordan定理: 设 矩阵,那么 有解的充要条件是不存在非零向量 ,使得 .


  • KKT条件 通过线性无关保证目标函数信息得到反映
    考虑问题 处可微, 连续, 线性无关,若 是局部最优解,则存在非负数 ,使得

其中 线性无关称为约束规格 (Constraint Qualification)
也可写作:


Proof.
由FJ条件存在不全为零的非负数 ,使得

显然 ,否则 线性相关,矛盾。 于是,令 ,得

等式约束的最优性条件

曲面与曲线: 称点集 为曲面 上的一条曲线,如果对所有 均有 .如果导数 存在,则称曲线是可微的. 此时的一阶导数 是曲线在点 处的切向量.
切平面: 曲面 上在点 处所有可微曲线的切向量组成的集合称为曲面 在点 的切平面,记为 .
子空间: 其中
:

  1. 是约束集合 上的点, 处的切平面, 为相应的线性化可行方向集,则有 ,即若向量 ,则有 .
  2. 线性无关,则 .

Proof.
,考虑非线性方程组 其中 . 该方程组有解 .在 处, 关于 的Jacobi矩阵为 由隐函数定理,在 的邻域,存在连续可微函数 ,使 成立. 令 ,则 为曲面 上过 的一条曲线。在点 ,切向量为 ,又 线性无关 可逆, .


  • 几何最优性条件
    处可微, 处连续, 处连续可微,且 线性无关。如果 是问题 的局部最优解,则在 处,有

其中

  • KKT条件
    考虑问题

为可行点, . 处可微, 连续, 连续可微,向量集 线性无关(即LICQ成立),若 是局部最优解,则存在数 ,使得

  • 拉格朗日函数
    Lagrange函数定义为

其中 称为Lagrange乘子.
于是, KKT条件可以改写为:

凸优化问题中的KKT条件

凸优化模型

是凸函数, 是凹函数, 是线性函数,则原问题为凸规划.

性质

  • 凸优化的任一局部最优解为全局最优解

Proof.
为凸优化局部最优解,则存在 ,对任意 都有 .
反证法. 假设 不是全局最优解,则存在 ,使得 考虑线段 上一点 ,由凸函数定义: 充分小时, , 这与 为局部最优解矛盾. 证毕


  • 于是, 凸优化的最优解集为凸集
  • 由严格凸的定义知, 严格凸函数若最优解存在则唯一
  • 凸优化的全局最优解与稳定点等价

Def.
为约束优化问题 的稳定点,若满足 .
Proof.
为稳定点,即对任意 .利用凸函数的性质得

因而 为全局最优解.
为凸优化问题的全局最优解,由一阶最优性条件可知,在 处不存在可行且使得目标函数下降的方向。注意到,由 的凸性可知 ,

因此, 处的可行方向. 从而 ,即 为稳定点. 证毕 (注: 该性质对任意解集为非空闭凸集的优化模型均成立)


  • 若( , , )是凸优化的KKT点对, 则( , , )为Lagrange函数的鞍点; 若( , , )是优化问题Lagrange函数的鞍点,则( , , )为KKT点对

Def.
为约束优化问题

的Lagrange函数 的鞍点,若

Proof.
结论1: 先证 关于 为凸函数

再证 .

结论2: 由

知: 因此, 为KKT点对 (注意:该定理无需问题为凸优化)

对偶问题与对偶理论

原问题与对偶问题

原始优化问题

Lagrange对偶问题

其中

对偶问题一定为凸规划

弱对偶定理

分别是原问题和对偶问题的可行解,则


Proof.
是可行解,


强对偶定理

  • 对偶间隙:
  • 为优化问题(P)的Lagrange函数的鞍点,则 分别是原问题与对偶问题的最优解且对偶间隙为零.

Proof.
可得: 再结合
于是对原问题的任一可行解
已证 为原问题的最优值 ,由弱对偶定理可知: 对对偶问题的任一可行解 ,有 则对偶问题的最优解为 ,且 .