討論區

(3)參考解答
$1^\circ$ 由 (2) 得 $A$ 必不為 symmetric, 令 $A = \begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix}$, $v$ 為 $\mathbb{R}^2$ 之任意向量, 令 $v = \begin{bmatrix} x \\ y \end{bmatrix}$,
因此 $Av = \begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} y \\ -x \end{bmatrix}$
$2^\circ$ $\langle Av, v \rangle = \begin{bmatrix} y \\ -x \end{bmatrix} \cdot \begin{bmatrix} x \\ y \end{bmatrix} = (yx) - (xy) = 0$, 故 $A = \begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix}$ 滿足上述條件
建議
這邊給 (3) 做補充。
實際上對於實方陣 $A$,$A^t = -A$ 若且唯若 $\langle Av, v \rangle = 0$, $\forall v$。
首先若 $A^t = -A$,對於每個 $v$,有 $\langle Av, v \rangle = v^tA^tv = -v^tAv = -\langle Av, v\rangle$,得 $\langle Av, v \rangle = 0$。
回顧對於方陣 $A$,我們有 $A = \frac{1}{2}(A + A^t) + \frac{1}{2}(A - A^t)$。因為 $(A - A^t)^t = -(A - A^t)$,有 $v^tAv = \frac{1}{2}v^t(A + A^t)v$ i.e. $\langle Av, v \rangle = \frac{1}{2} \langle (A + A^t)v, v \rangle$。如果 $\langle Av, v \rangle = 0$,則 $\langle (A + A^t)v, v \rangle = 0$。若這對每個 $v$ 都成立,則 (2) 告訴我們 $A + A^t = O$,有 $A^t = -A$。
矩陣與線性映射連結
設 $T_1$, $T_2$ 皆為 $V$ 到 $W$ 的 linear transformation。如何說 $T_1,T_2$ 是一樣的 linear transformation 呢?大家應該記得『基底決定一切』。如果找到 $\mathbf{v}_1,\dots,\mathbf{v}_n$ 為 $V$ 的一組 basis 滿足 $T_1(\mathbf{v}_i)=T_2(\mathbf{v}_i)$, $\forall\,i=1,\dots,n$,則 $T_1=T_2$。
對於兩個 $m\times n$ matrices $A,B$,我們也可將之看成 $\mathbb{R}^n$ 到 $\mathbb{R}^m$ 的 linear transformation。所以同樣的若 $\mathbf{v}_1,\dots,\mathbf{v}_n$ 為 $\mathbb{R}^n$ 的一組 basis,且 $A\mathbf{v}_i=B\mathbf{v}_i$, $\forall\,i=1,\dots,n$,則 $A=B$。所以上面小題(2)的參考解答既然證得 $A\mathbf{u}_i=\mathbf{0}$,是不是可以省掉後面那一堆不必要的論述呢?
從這裡,大家有沒有發現小題(2)不需 $A$ 為對稱這麼「強」的假設,只要 $A$ 是 diagonalizable 就成立。
如何找反例
一般習題要求找反例,大多數同學習慣找個反例交差了事。事實上讓大家了解反例是如何找到,比直接給反例有趣。猜想同學很容易理解 $\langle A\mathbf{v},\mathbf{v}\rangle=0$,表示 $\mathbf{v},A\mathbf{v}$ 垂直,所以預期見到的反例是常見的(逆時針)旋轉 $90^\circ$ 的旋轉矩陣。不過上面小題(3)參考解答卻不是我預期的。所以儘量分享如何找到反例,比較有意思,且更能啟發反例發生的真實原因;而不是給個答案。
其實原題(2)太強的前提假設對稱矩陣,原來的目標也是希望利用轉置矩陣與內積的關聯引導找到反例。後來覺得可能太難,所以僅探討二階的情況,可用幾何觀點找到反例。很高興有同學想到 symmetric 的相反 skew-symmetric 的觀念切入。不過有了想法後,可以慢慢修正,用較簡明的方式讓真正的原因顯露。
這裡還是鼓勵同學用轉置矩陣與內積的關聯處理(以後高線談內積空間這樣的看法很重要)。現因 $\langle A\mathbf{v},\mathbf{v}\rangle=\langle \mathbf{v},A^t\mathbf{v}\rangle=\langle A^t\mathbf{v},\mathbf{v}\rangle$,故知 $\langle (A+A^t)\mathbf{v},\mathbf{v}\rangle=2\langle A\mathbf{v},\mathbf{v}\rangle$。所以由 $\langle A\mathbf{v},\mathbf{v}\rangle=0$, $\forall\,\mathbf{v}\in\mathbb{R}^n$ 的假設以及 $A+A^t$ 為 symmetric 得知 $A+A^t$ 為零矩陣(即 $A$ 為 skew-symmetric)。注意這個論證用到了 over 實數的內積有交換性(即 $\langle \mathbf{v},\mathbf{w}\rangle=\langle \mathbf{w},\mathbf{v}\rangle$)若在 over 複數的內積並沒有交換性,所以這個反例在複數的情況就不會成立了!大家以後修高線時應該會學到:在複數的情況若 $\langle A\mathbf{v},\mathbf{v}\rangle=0$ 對所有的 $\mathbf{v}$ 成立,則 $A$ 必為零矩陣。
若大家知道小題(2)其實對任意可對角化矩陣皆成立,我們又有一個有趣的結果:skew-symmetric matrix 除了零矩陣外,都不能對角化。
(1)(2) 參考解答
(1) Prove: $A^tA$ is orthogonal diagonalizable 且 其 eigenvalues 皆 $\ge 0$.
因 $(A^tA)^t = A^t(A^t)^t = A^tA$,
故 $A^tA$ is orthogonal diagonalizable.
設 $\lambda$ 為 $A^tA$ 的一個 eigenvalue,
則 $\exists \mathbf{v} \neq \mathbf{0}$ s.t. $A^tA\mathbf{v} = \lambda \mathbf{v}$.
Consider $\langle A^tA\mathbf{v}, \mathbf{v} \rangle = \langle A\mathbf{v}, A\mathbf{v} \rangle = \|A\mathbf{v}\|^2$
且 $\langle A^tA\mathbf{v}, \mathbf{v} \rangle = \langle \lambda \mathbf{v}, \mathbf{v} \rangle = \lambda \langle \mathbf{v}, \mathbf{v} \rangle = \lambda \|\mathbf{v}\|^2$
故有 $\|A\mathbf{v}\|^2 = \lambda \|\mathbf{v}\|^2$.
因 $\mathbf{v} \neq \mathbf{0}$,故 $\|\mathbf{v}\|^2 > 0$,
得出 $\lambda = \frac{\|A\mathbf{v}\|^2}{\|\mathbf{v}\|^2} \ge 0$.
(2) 假設 $A$ is symmetric.
Prove: $\forall \mathbf{v} \in \mathbb{R}^n$ 皆有 $\langle A\mathbf{v}, \mathbf{v} \rangle = 0 \Rightarrow A$ 為零矩陣.
若 $\forall \mathbf{v} \in \mathbb{R}^n$ 皆有 $\langle A\mathbf{v}, \mathbf{v} \rangle = 0$,
因 $A$ is symmetric matrix,
故 $\exists \mathbf{u}_1, \dots, \mathbf{u}_n \in \mathbb{R}^n$ 為一組 orthonormal basis 皆為 $A$ 之 eigenvalue 分別為 $\lambda_1, \dots, \lambda_n$ 的 eigenvector.
$\Rightarrow A\mathbf{u}_i = \lambda_i \mathbf{u}_i$.
根據假設,知 $\langle A\mathbf{u}_i, \mathbf{u}_i \rangle = 0$.
又 $\langle A\mathbf{u}_i, \mathbf{u}_i \rangle = \langle \lambda_i \mathbf{u}_i, \mathbf{u}_i \rangle = \lambda_i \langle \mathbf{u}_i, \mathbf{u}_i \rangle = \lambda_i \|\mathbf{u}_i\|^2$,$\forall i = 1, \dots, n$.
故 $\lambda_i \|\mathbf{u}_i\|^2 = 0$.
因 $\|\mathbf{u}_i\| = 1$($\mathbf{u}_i$ 為 orthonormal 的原因),
故 $\lambda_i = 0$,$\forall i = 1, \dots, n$.
令 $Q = [\mathbf{u}_1 \dots \mathbf{u}_n]$, $D = \begin{bmatrix} \lambda_1 & & O \\ & \ddots & \\ O & & \lambda_n \end{bmatrix} = O$,
有 $Q^t A Q = D$.
即 $A = Q D Q^t = Q O Q^t = O$.
$\therefore A$ 為零矩陣.