从二次型最优化问题中理解矩阵特征值的意义

2015年12月15日

从二次型最优化来理解

最小化二次型目标函数,其中A为已知的实对称二阶矩阵,.这个问题的求解很简单,这里以此为例来说明该问题与矩阵特征值的关系。

首先,可以得到目标函数的网格图与等高线图如下。

1 2

对矩阵A进行特征分解可以得到其特征向量为[-0.7071, 0.7071], [0.7071, 0.7071],对应的特征值分别是0.5, 1.5.

观察函数的等高线图可以知道,等高线最密集的地方,函数值变化最快,而这个函数值变化最快的方向归一化后就是[0.7071, 0.7071],这恰好是矩阵的一个特征向量。同样地,可以观察,等高线最稀疏的地方,函数值变化最慢,变化方向则是矩阵的另一个特征向量。可以看出,矩阵特征值的大小与函数值的变化快慢有关,较大特征值所对应的特征向量方向上函数值的变化较快,较小特征值所对应的特征向量方向上函数值的变化较慢。

进一步,对于实对称矩阵,我们总是可以对其进行相似变化,得到一个以该矩阵特征值为对角线元素的对角阵。,其中,P为正交矩阵,有性质P的逆等于P的转置。把目标函数改写为,其中. 相似变换的作用可以理解为将等高线图进行旋转,于是得到下面经过旋转后的等高线图。

3

在这张图上说明矩阵特征值的意义。当函数值取1时所对应的椭圆等高线的长轴长度为, 即由矩阵特征值0.5决定。同理,该椭圆短轴长度为,由矩阵特征值1.5决定。

二阶矩阵的理解较为直观。高阶矩阵的道理是一样的。

资料

【1】如何理解矩阵特征值

from painterlin