量量矩陣的大小: Frobenius 和 Spectral Norm


向量的 norm 我們很熟悉了, 但對於一個矩陣的 norm 又該怎麼定義呢?
最直覺的想法就是把矩陣 flatten 成一個向量, 套用向量的 norm 即可. 這引導出了 Frobenius norm.
但是矩陣還包含了將向量做線性轉換的作用, 所以向量經過矩陣轉換後的 norm 變化是不是可以用來當作矩陣 norm 的度量方式呢? 這樣的想法引導出了 operator norm 或 spectral norm.
先給出 take away 總結:

  • Frobenius norm: 開根號的 “singular value 平方和”

    $$\begin{aligned} \|A\|_F := \sqrt{\sum_{i,j}|a_{ij}|^2} =\mathrm{Tr}(A^HA)=\sqrt{\sum_i^{\min\{m,n\}}\sigma_i^2(A)} \end{aligned}$$
  • Spectral norm: 最大的 singular value

    $$\begin{aligned} \|A\|_2 :=\sup_{\|x\|_2\leq1}\{\|Ax\|_2\}=\sqrt{\lambda_{\max}(A^HA)}=\sigma_{\max}(A) \end{aligned}$$

💡 為什麼 spectral norm 這麼定義?
推薦閱讀周老師的文章, 矩陣範數, 非常具有啟發性!更多延伸:譜半徑與矩陣範數

  • 兩者的關係: $$\begin{aligned} \|A\|_2 \leq \|A\|_F \end{aligned}$$

接著詳細記錄定義和推導證明 (參考自黃子嘉線性代數講義)


Operator, Spectral 與 Frobenius Norm 的定義

對於一個 $m\times n$ 矩陣 $A$ 來說, 令有兩個 vector norm $\|\cdot\|_\alpha$$\|\cdot\|_\beta$.
$A$ 的 operator norm 定義如下 [wiki]:
$$\begin{align} \|A\|_p=\sup_{\|x\|_p\leq1}\{\|Ax\|_p\} \end{align}$$$p=2$ 的時候我們稱為 spectral norm, 它有一個重要的特性為
$$\begin{align} {\color{orange}{\|A\|_2=\sqrt{\lambda_{\max}(A^HA)}=\sigma_{\max}(A)}} \end{align}$$ 其中 $\lambda_{\max},\sigma_{\max}$ 分別是最大的 eigenvalue 和 singular value
對於矩陣還有一個常見的 norm 為 Frobenius norm, 定義如下:
$$\begin{align} {\color{orange}{\|A\|_F}} &= \sqrt{\sum_{i,j}|a_{ij}|^2} \\ & {\color{orange}{=\sqrt{\mathrm{Tr}(A^HA)}=\sqrt{\sum_i^{\min\{m,n\}}\sigma_i^2(A)} }} \end{align}$$ 其中 $\sigma_i$ 表示 i-th singular value of $A$.
則可以看出, 如果 $A$ 只有一個非 $0$ 的 singular value, 則剛好 $\|A\|_F=\sigma_{\max}(A)=\|A\|_2$.
因此 spectral norm 和 Frobenius norm 有如下關係:
$$\begin{align} {\color{orange}{ \|A\|_2 \leq \|A\|_F }} \end{align}$$ 接著來證明 spectral norm 與 eigen/singular value 的關係 (式 (2))


證明 Spectral Norm 是最大的 Singular Value

先定義 Rayleigh Quotient, 假設 $A\in\mathbb{C}^{n\times n}$ 為 Hermitian matrix, i.e. $A^H=A$

Rayleigh Quotient Principle

定義 Rayleigh Quotient $\rho(x)$
$$\begin{align} \rho(x)=\frac{Q(x)}{\|x\|_2^2} \\ , \text{where }\quad Q(x)=x^HAx \end{align}$$$\lambda_1\leq\rho(x)\leq\lambda_n$, 其中 $\lambda_i$ 為 i-th eigenvalue 且為由小到大排序.
並且有 $\max_x\rho(x)=\lambda_n$$\min_x\rho(x)=\lambda_1$ 的關係.
茲證明如下
因為 $A$ 為 Hermitian 矩陣, 所以 $A$ 可以對角化:
$A=PDP^H$, 其中 $P$ 為 unitary matrix, $D$ 為由 eigenvalues $\{\lambda_i\}_{i=1}^n$ 構成的對角矩陣
代入 (6) 得到
$$\begin{aligned} \rho(x) &=\frac{x^HPDP^Hx}{x^Hx}=\frac{(P^Hx)^HD(P^Hx)}{x^HPP^Hx} \\ &= \frac{(P^Hx)^HD(P^Hx)}{(P^Hx)^H(P^Hx)}=:\frac{y^HDy}{y^Hy}=\frac{\sum_{i=1}^n y_i^2\lambda_i}{\sum_{i=1}^n y_i^2} \end{aligned}$$ 其中我們令 $y:=P^Hx$. 所以得到:
$$\begin{align} \lambda_{\color{orange}{1}}= \frac{\sum_{i=1}^n y_i^2\lambda_{\color{orange}{1}}}{\sum_{i=1}^n y_i^2}\leq \rho(x)=\frac{\sum_{i=1}^n y_i^2\lambda_i}{\sum_{i=1}^n y_i^2}\leq \frac{\sum_{i=1}^n y_i^2\lambda_{\color{orange}{n}}}{\sum_{i=1}^n y_i^2}=\lambda_{\color{orange}{n}} \end{align}$$ Q.E.D.

Spectral Norm 對應最大的 eigenvalue/singular value

從矩陣 $A$ 的 spectral norm 定義出發, 我們討論有限維度因此 $\sup$ 改為 $\max$ 即可
$$\begin{aligned} \|A\|_2^2 &=\left(\max_{\|x\|_2\leq1}\{\|Ax\|_2\}\right)^2 \\ &= \left(\max_{x\neq0}\frac{\|Ax\|_2}{\|x\|_2}\right)^2 = \max_{x\neq0}\frac{\|Ax\|_2^2}{\|x\|_2^2} \\ &=\max_{x\neq0}\frac{x^HA^HAx}{x^Hx}=:\max_{x\neq0}\rho(x) \end{aligned}$$ 注意到 $\rho(x)$ 是矩陣 $A^HA$ 的 Rayliegh quotient, 則我們已經知道 則 $\lambda_1\leq\rho(x)\leq\lambda_n$. 因此
$$\begin{aligned} \|A\|_2^2 &=\cdots=\max_{x\neq0}\rho(x)=\lambda_{\max}(A^HA) \end{aligned}$$$\|A\|_2=\sqrt{\lambda_{\max}(A^HA)}$.
$A$ 的 SVD 分解為 $A=U\Sigma V^H$, 則
$$\begin{aligned} \|A\|_2 &=\sqrt{\lambda_{\max}(A^HA)}=\sqrt{\lambda_{\max}(V\Sigma^H U^HU\Sigma V^H)} \\ &= \sqrt{\lambda_{\max}(V\Sigma ^H\Sigma V^H)} \end{aligned}$$ 由於 $V\Sigma^H\Sigma V^H$$\Sigma^H\Sigma$ unitary similar (么正相似) 則它們的 eigenvlues 不變, 因此
$$\begin{aligned} \|A\|_2 &=\cdots = \sqrt{\lambda_{\max}(V\Sigma ^H\Sigma V^H)} \\ &= \sqrt{\lambda_{\max}(\Sigma^H\Sigma)}=\sigma_{\max}(A) \end{aligned}$$ Q.E.D.


證明 Frobenius Norm 是 Singular Value 平方和的開根號

證明式 (4)
首先如果 $Q$ 是 unitary matrix, 我們知道 $\|M\|_F^2$ 在算所有 elements 的平方和, 則
$$\begin{aligned} \|QA\|_F^2 &= \|\begin{array}{cccc}Qa_1&Qa_2&\cdots&Qa_n\end{array}\|_F^2 \\ &= \sum_{i=1}^n\|Qa_i\|_2^2 = \sum_{i=1}^n a_i^TQ^TQa_i \\ &=\sum_{i=1}^n a_i^Ta_i = \sum_{i=1}^n\|a_i\|_2^2=\|A\|_F^2 \end{aligned}$$ 得到若 $Q$ 是 unitary, 則對 Frobenius norm 同樣有”保長”的特性, $\|Qx\|_F=\|x\|_F$.
$A$ 的 SVD 分解為 $A=U\Sigma V^T$, 則
$$\begin{aligned} \|A\|_F &=\|U\Sigma V^T\|_F=\|\Sigma V^T\|_F=\|(\Sigma V^T)^T\|_F \\ &= \|V\Sigma^T\|_F=\|\Sigma\|_F=\sqrt{\sum_i^{\min\{m,n\}}\sigma_i^2(A)} \end{aligned}$$ Q.E.D.


範例: Unitary Matrix 的 Spectral 與 Frobenius Norm

$A$ 是 unitary 矩陣, i.e. $A^HA=AA^H=I$. 我們知道 unitary 矩陣 “保長”
$$\begin{aligned} \|Ax\|_2^2=x^HA^HAx=x^Hx=\|x\|_2^2 \\ \Longrightarrow\|Ax\|_2=\|x\|_2 \end{aligned}$$ 我們先直覺想一下, 由於 eigenvalue 表示對 eigenvector 方向的”拉伸”程度
因為 $A$ 保長, 是不是表示不應該有”拉伸”才對, 所以 eignevalues 的大小應該都等於 $1$? 也因此 spectral norm 等於 $1$? Frobenius norm 等於 $\sqrt{n}$?
Determinant 大小等於 $1$? (因為是 eignevalues 乘積, 參考 determinant 的物理意義)
我們先證明一下 eignevalues 的大小都等於 $1$, 從保長出發:
$$\begin{aligned} \|x\|_2^2=\|Ax\|_2^2=\|\lambda x\|_2^2=|\lambda|^2\|x\|_2^2 \end{aligned}$$ 得到 $|\lambda|=1$. 因此 $|\det(A)|=1$.
所以 spectral norm 為
$$\begin{aligned} \|A\|_2=\sqrt{\lambda_{\max}(A^HA)}=\sqrt{\lambda_{\max}(I)}=1 \end{aligned}$$ Frobenius norm 為
$$\begin{aligned} \|A\|_F=\sqrt{\mathrm{Tr}(A^HA)}=\sqrt{\mathrm{Tr}(I)}=\sqrt{n} \end{aligned}$$ 這樣的結果符合物理直覺, unitary matrix or orthogonal matrix 在做的事情只是座標旋轉.