凸分析

1. 函数的一阶性质

  • 海瑟矩阵:
  • 雅可比矩阵:向量值函数,则
  • 链式法则:
  • 泰勒展开: 。若二阶连续可微,则在有二阶泰勒展式:
  • Lipschitz连续:设连续可微,若存在常数有:则称。 -

2.广义实值函数与适当函数

  • 给定广义实值函数

3.凸函数的定义和性质

  • 定义:;若

  • 下水平集,闭函数与下半连续函数:设广义实值函数 .

    • -下水平集: .
    • 的上方图: .
    • 为闭函数: 为闭集.
    • 为下半连续函数: 对任意的 ,有 .
    • 设广义实值函数 ,则下列命题等价: 的任意 -下水平集都是闭集; 是下半连续的; 是闭函数.
    • 1. 加法: 若 均为适当的下半连续函数,且 , 则 也是下半连续函数. 2. 仿射函数的复合: 若 为下半连续函数,则 也为下半连续函数; 3. 上确界: 若 均为下半连续函数,则 也为下半连续函数.
  • 凸函数的性质:

    • Jensen不等式: 设 是凸函数,则对于 ,有:
    • 概率Jensen 不等式: 设 是凸函数,则对任意随机变量 ,
    • 设 f : 为凸函数,则 连续.
  • 凸函数的判定:

    • 函数 为凸函数当且仅当其上方图epi 是凸集.

    • 为可微函数且 是凸集,则 是凸函数当且仅当

    是严格凸函数当且仅当(1)或(2)对所有 严格成立 设 为定义在凸集上的二阶连续可微函数,则 是凸函数当且仅当

    如果 ,则 是严格凸函数.

  • 强凸函数:

    • 定义:
    • 充要条件:
    • 二次下界:
  • 保凸函数运算:为凸函数,则

4.共轭函数

  • 定义:适当函数的共轭函数:
  • 凸性:
  • Fenchel不等式:

5.方向导数

  • 对于凸函数 ,给定点 以及方向 , 其方向导数定义为

对于可微函数, .

  • 方向导数有限: 设 为凸函数, ,则对 , 有限.
  • 方向导数和次梯度: 设 为凸函数, ,则对 ,有

6.次梯度

  • 定义:设适当凸函数,若向量满足

  • 存在性:设

  • 性质:

    • 是凸函数,则对 是闭凸集(可能为空集).
    • 是凸函数,则对 是非空有界集.
    • 设凸函数 处可微,则 .
    • 次梯度的单调性 设 是凸函数, ,则
    • 次梯度的连续性 设 是闭凸函数且 . 若

    .

  • 计算:

    • 凸函数的非负线性组合: 设 ,凸函数 满 足 ,若

    的次微分

    • 线性变量替换: 设 为适当凸函数, . 若存 在 使得 ,则
    • 两个函数之和的次梯度 (Moreau-Rockafellar定理). 设 是凸函数,则 对任意的

    ,则对任意的 ,

7. 非凸函数的次微分

  • 为适当、下半连续函数. 对给定的 ,满足如下条件的所有向量 的集合定义为 在点 处的Fréchet 次微分:

记为 ; 若 ,定义 .

  • 在点 处的极限次微分(或Mordukhovich次微分,或简称为次微分):

最优性条件

1. 最优解存在性:

  • 是恰当且闭的,则 为非空紧集,若如下任一条件成立: (1) 是有界的; (2) 使得下水平集 非空有界; (3) 是强制的,i.e.,

2. 最优解唯一性:

  • 强拟凸函数: 给定非空凸集 与函数 ,若对任意的 以及 ,均有: 则称 上的强拟凸函数.
  • 给定非空凸紧集 ,设 是适当、闭、强拟凸函数,则 为单点集,i.e.,存在唯一的 满足:

3. 无约束优化最优性条件

  • 下降方向:设 是任一给定向量, . 若存在 ,对任意 ,有 ,则称 为函数 在点 处的一个下降方向. 处的下降方向
  • 一阶必要性条件:若 是无约束优化问题的一个局部最优解,则有:
  • 二阶必要性条件:若 是无约束优化问题的一个局部最优解,则有: 为半正定矩阵.
  • 二阶充分性条件:若 满足 为正定矩阵. 则 是无约束优化问题的一个严格局部最优解.
  • 特别的: 若无约束优化问题(1) 的目标函数 是连续可微的凸函数,则 是凸优化的全局最优解当且仅当
  • 非光滑优化最优性条件:
    • 一阶充要条件:若无约束优化问题(1) 的目标函数 是适当凸函数,则 是凸规划的全局最优解当且仅当 . 一阶充要条件
    • 一阶必要条件:设优化问题(1) 的目标函数 是适当下半连续的,若 是问题(1)的一个局部最优解,则 .
  • 复合优化最优性条件:
    • 数学模型: 其中 (可能非凸), 为适当闭函数(可能非光滑).
    • 一阶必要性条件: 若 是复合优化问题(2) 的一个局部最优解,则:

数值迭代算法概述

1.全局收敛与局部收敛

  • 收敛:设 是最优化问题的某种解集合, 为某种算法. 给定集合 ,若对于任意初始点 ,算法 产生的迭代点列 中任一收敛子列的极限都属于 ,则称算法 上收敛.
  • 全局收敛:若集合 可以任意选取 (无需限定在解集合很小的邻域内),则相应的收敛性为全局收敛性 (global convergence) ;
  • 局部收敛:若集合 只能取接近解集合的点集,则相应的收敛性为局部收敛性 (local convergence).

2.子序列收敛与全序列收敛

  • 算法 产生的迭代点列 中任一收敛子列的极限点都属于解集 ,则称为子序列收敛 (subsequence convergence),若 ,则称为全序列收敛(whole sequence convergence).

3.收敛速度

  • 定义1:设点列 收敛到 ,若存在实数 ,使得则称点列 阶收敛速率收敛到 .
    • -次线性收敛:
    • -线性收敛:
    • -超线性收敛:
    • 二次收敛:
  • 定义2:设点列 收敛到 ,若存在实数 ,使得则称点列 -线性收敛到 . 若存在实数 ,以及收敛到 0 的正数列 ,使得则称点列 -超线性收敛到 . 同级收敛速度Q-收敛速率快于R-收敛速率

3. 迭代复杂度

设某一算法求解 产生的迭代点列 收敛到最优解 , 若存在实数 ,使得则称该算法是 阶收敛到 .

  • 若需要算法满足精度 ,只需令 ,从而得到 . 因此该优化算法对应的迭代次数复杂度为
  • 越大,收敛越快,复杂度越低,算法越好.

4. 二次终止性

若某个算法对任意的严格凸二次函数, 从任意的初始点出发, 都能经有限步迭代达到其极小值点, 则称该算法具有二次终止性.

5.空间复杂性与时间复杂性

  • 定义:描述算法的存储要求和运行时间要求, 分为算法的空间复杂性和算法的时间复杂性. 利用算法需要的初等运算次数表示算法的时间复杂性.
  • 多项式时间算法:求解实例 的算法的基本运算总次数 是实例输入长度 的一个函数, 该函数被另一个函数 控制,即存在一个函数 和一个常数 ,使得

为多项式函数,则称该算法对实例 是多项式时间的算法; 若对于这类问题的任意实例 是多项式时间的算法,则称该算法为求解这一类问题的多项式时间算法.类似地可以定义的指数时间算法.