当前位置：首页 > ops >正文

向量外积与秩1矩阵的关系

ops 2025/6/17 12:19:46

向量外积与秩1矩阵的关系

flyfish

向量外积是构造秩1矩阵的基本工具，其本质是用两组向量的线性组合刻画矩阵的行和列相关性；
任意秩1矩阵必可表示为外积，而低秩矩阵（秩 $k$ ）可分解为 $k$ 个外积矩阵的和，这正是低秩分解通过“基向量组合”压缩矩阵信息的核心原理。
从代数角度，秩1矩阵必为两个向量的外积 $\boldsymbol{u}\boldsymbol{v}^T$ ，其结构由两个向量唯一确定；
从几何角度，秩1矩阵对应“将任意向量投影到 $\boldsymbol{u}$ 方向的线性变换”，其变换效果仅由 $\boldsymbol{u}$ （像空间方向）和 $\boldsymbol{v}$ （投影系数）决定。
这种分解是低秩分解的基础，例如矩阵的奇异值分解（SVD）中，秩1矩阵是构成任意矩阵的“原子单元”。

一、向量外积的定义与几何意义

1. 向量外积的定义
设两个列向量 $\mathbf{u} \in \mathbb{R}^m$ 和 $\mathbf{v} \in \mathbb{R}^n$ ，其外积（Outer Product）定义为矩阵乘法：
$\mathbf{u} \mathbf{v}^T = \begin{pmatrix} u_1 \\ u_2 \\ \vdots \\ u_m \end{pmatrix} \begin{pmatrix} v_1 & v_2 & \cdots & v_n \end{pmatrix} = \begin{pmatrix} u_1v_1 & u_1v_2 & \cdots & u_1v_n \\ u_2v_1 & u_2v_2 & \cdots & u_2v_n \\ \vdots & \vdots & \ddots & \vdots \\ u_mv_1 & u_mv_2 & \cdots & u_mv_n \end{pmatrix}$

外积的结果是一个 $\times n$ 的矩阵，其每个元素为 $\mathbf{u}$ 和 $\mathbf{v}$ 对应元素的乘积。
对比内积（点积）： $\mathbf{u} \cdot \mathbf{v} = \mathbf{u}^T\mathbf{v} = \sum_{i=1}^m u_i v_i$ ，结果是一个标量；而外积结果是矩阵。

2. 外积矩阵的关键性质
以二维向量为例，设 $\mathbf{u} = \begin{pmatrix} a \\ b \end{pmatrix}$ ， $\mathbf{v} = \begin{pmatrix} c \\ d \end{pmatrix}$ ，则外积为：
$\mathbf{u}\mathbf{v}^T = \begin{pmatrix} a \\ b \end{pmatrix} \begin{pmatrix} c & d \end{pmatrix} = \begin{pmatrix} ac & ad \\ bc & bd \end{pmatrix}$

观察矩阵结构：每一行都是 $\mathbf{v}^T$ 的倍数（第一行是 $a\mathbf{v}^T$ ，第二行是 $b\mathbf{v}^T$ ），即行向量线性相关；
每一列都是 $\mathbf{u}$ 的倍数（第一列是 $c\mathbf{u}$ ，第二列是 $d\mathbf{u}$ ），即列向量线性相关。

二、秩1矩阵的定义与性质

1. 矩阵秩的定义
矩阵的秩是其线性无关的行向量（或列向量）的最大数量。若一个 $\times n$ 矩阵 $\mathbf{A}$ 的秩为 1，则：

所有行向量都是某一非零行向量的标量倍数；
所有列向量都是某一非零列向量的标量倍数。

2. 秩1矩阵的核心特征
设 $\mathbf{A}$ 是秩1的 $\times n$ 矩阵，则存在非零向量 $\mathbf{u} \in \mathbb{R}^m$ 和 $\mathbf{v} \in \mathbb{R}^n$ ，使得 $\mathbf{A} = \mathbf{u}\mathbf{v}^T$ 。

三、原理证明：任意秩1矩阵可表示为外积

步骤1：利用秩1矩阵的行向量线性相关
设 $\mathbf{A}$ 的秩为 1，且其第一行 $\mathbf{r}_1 \neq \mathbf{0}$ ，则其他行 $\mathbf{r}_i$ 可表示为 $\mathbf{r}_i = k_i \mathbf{r}_1$ （ $k_i$ 为标量）。
令 $\mathbf{u} = \begin{pmatrix} 1 \\ k_2 \\ \vdots \\ k_m \end{pmatrix}$ ， $\mathbf{v}^T = \mathbf{r}_1$ ，则：
$\mathbf{u}\mathbf{v}^T = \begin{pmatrix} 1 \\ k_2 \\ \vdots \\ k_m \end{pmatrix} \mathbf{r}_1 = \begin{pmatrix} \mathbf{r}_1 \\ k_2\mathbf{r}_1 \\ \vdots \\ k_m\mathbf{r}_1 \end{pmatrix} = \begin{pmatrix} \mathbf{r}_1 \\ \mathbf{r}_2 \\ \vdots \\ \mathbf{r}_m \end{pmatrix} = \mathbf{A}$

步骤2：示例验证
设秩1矩阵 $\mathbf{A} = \begin{pmatrix} 2 & 4 & 6 \\ -1 & -2 & -3 \\ 3 & 6 & 9 \end{pmatrix}$ ，观察行向量：

第二行是第一行的 $-\frac{1}{2}$ 倍，第三行是第一行的 $\frac{3}{2}$ 倍。
取第一行作为 $\mathbf{v}^T = \begin{pmatrix} 2 & 4 & 6 \end{pmatrix}$ ，系数向量 $\mathbf{u} = \begin{pmatrix} 1 \\ -\frac{1}{2} \\ \frac{3}{2} \end{pmatrix}$ ，则：
$\mathbf{u}\mathbf{v}^T = \begin{pmatrix} 1 \\ -\frac{1}{2} \\ \frac{3}{2} \end{pmatrix} \begin{pmatrix} 2 & 4 & 6 \end{pmatrix} = \begin{pmatrix} 2 & 4 & 6 \\ -1 & -2 & -3 \\ 3 & 6 & 9 \end{pmatrix} = \mathbf{A}$

四、从外积到低秩分解的本质理解

1. 秩1矩阵的“基向量”意义
外积 $\mathbf{u}\mathbf{v}^T$ 可理解为：

列向量 $\mathbf{u}$ 定义了矩阵的“方向”（所有列都是 $\mathbf{u}$ 的线性组合）；
行向量 $\mathbf{v}^T$ 定义了矩阵的“权重”（所有行都是 $\mathbf{v}^T$ 的线性组合）。
因此，秩1矩阵本质上是用两个向量的外积来“压缩”矩阵信息，仅保留一组基向量的线性组合。

2. 低秩分解的推广（以秩k矩阵为例）
任意秩 $k$ 的矩阵 $\mathbf{A}$ 可分解为 $k$ 个秩1矩阵的和：
$\mathbf{A} = \sum_{i=1}^k \mathbf{u}_i\mathbf{v}_i^T$
其中 $\{\mathbf{u}_i\}$ 和 $\{\mathbf{v}_i\}$ 分别为列向量和行向量组。这等价于用 $k$ 组外积矩阵的线性组合近似表示 $\mathbf{A}$ ，而原始矩阵的秩为 $k$ ，即其信息可由 $k$ 组基向量刻画。

五、简单示例：秩2矩阵的外积分解

设矩阵 $\mathbf{B} = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 1 & 3 & 5 \end{pmatrix}$ ，先求其秩：

前两行线性相关（第二行是第一行的2倍），第三行与前两行线性无关，故 $\text{rank}(\mathbf{B}) = 2$ 。

分解步骤：

取前两行构成秩1矩阵 $\mathbf{B}_1 = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 0 & 0 & 0 \end{pmatrix} = \mathbf{u}_1\mathbf{v}_1^T$ ，其中 $\mathbf{u}_1 = \begin{pmatrix} 1 \\ 2 \\ 0 \end{pmatrix}$ ， $\mathbf{v}_1^T = \begin{pmatrix} 1 & 2 & 3 \end{pmatrix}$ ；
剩余部分为 $\mathbf{B} - \mathbf{B}_1 = \begin{pmatrix} 0 & 0 & 0 \\ 0 & 0 & 0 \\ 1 & 3 & 5 \end{pmatrix} = \mathbf{u}_2\mathbf{v}_2^T$ ，其中 $\mathbf{u}_2 = \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix}$ ， $\mathbf{v}_2^T = \begin{pmatrix} 1 & 3 & 5 \end{pmatrix}$ ；
最终分解： $\mathbf{B} = \mathbf{u}_1\mathbf{v}_1^T + \mathbf{u}_2\mathbf{v}_2^T$ 。