首页
/ 正文

Python 编写一个程序实现矩阵乘法（长文解析）

更新时间: 2025-04-14 01:58:04

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;演示链接： http://116.62.199.48:7070 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 90w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 3100+ 小伙伴加入学习，欢迎点击围观

前言

在数据科学、机器学习和工程计算领域，矩阵乘法是一个基础且关键的操作。无论是构建神经网络模型、解决线性方程组，还是进行图像处理，矩阵运算都扮演着核心角色。对于编程初学者和中级开发者而言，理解矩阵乘法的原理并掌握其在 Python 中的实现方法，能够显著提升对算法和数据结构的理解深度。本文将从基础概念出发，逐步拆解矩阵乘法的逻辑，并通过代码示例和优化技巧，帮助读者系统掌握这一技能。

一、矩阵乘法的核心规则与数学原理

1.1 矩阵的定义与维度

矩阵可以视为一个二维数组，由行和列构成。例如，一个 $m \times n$ 的矩阵包含 $m$ 行和 $n$ 列的元素。例如：

matrix_A = [  
    [1, 2, 3],  # 第 1 行  
    [4, 5, 6]   # 第 2 行  
]

关键点：矩阵的维度是后续运算的基础，尤其在乘法中，矩阵的行数和列数必须满足特定条件。

1.2 矩阵乘法规则

矩阵乘法并非简单的对应元素相乘，而是通过行与列的点积计算得到结果。具体规则如下：

维度匹配：矩阵 $A$（$m \times n$）与矩阵 $B$（$n \times p$）相乘的结果是一个 $m \times p$ 的矩阵。
计算方式：结果矩阵的第 $i$ 行第 $j$ 列的元素，等于矩阵 $A$ 的第 $i$ 行与矩阵 $B$ 的第 $j$ 列对应元素的乘积之和。

形象比喻：
可以将矩阵乘法想象为“行与列的对话”。例如，矩阵 $A$ 的某一行与矩阵 $B$ 的某一列“握手”，通过计算它们的“共同兴趣”（元素乘积之和），最终形成结果矩阵的一个元素。

1.3 示例：手动计算矩阵乘法

假设我们有两个矩阵：
| Matrix A (2×3) | Column 1 | Column 2 | Column 3 |
|----------------|----------|----------|----------|
| Row 1 | 1 | 2 | 3 |
| Row 2 | 4 | 5 | 6 |

Matrix B (3×2)	Column 1	Column 2
Row 1	7	8
Row 2	9	10
Row 3	11	12

计算结果矩阵 C (2×2)：

C[0][0] = (1×7) + (2×9) + (3×11) = 7 + 18 + 33 = 58
C[0][1] = (1×8) + (2×10) + (3×12) = 8 + 20 + 36 = 64
C[1][0] = (4×7) + (5×9) + (6×11) = 28 + 45 + 66 = 139
C[1][1] = (4×8) + (5×10) + (6×12) = 32 + 50 + 72 = 154

最终结果矩阵为：
| Result C (2×2) | Column 1 | Column 2 |
|-----------------|----------|----------|
| Row 1 | 58 | 64 |
| Row 2 | 139 | 154 |

二、Python 实现矩阵乘法的步骤与代码示例

2.1 方法一：基础循环实现

通过嵌套循环逐个计算结果矩阵的每个元素。

步骤说明：

初始化结果矩阵：创建一个全零的 $m \times p$ 矩阵。
遍历行和列：外层循环遍历矩阵 $A$ 的行，内层循环遍历矩阵 $B$ 的列。
计算点积：对每个元素，遍历矩阵 $A$ 的当前行与矩阵 $B$ 的当前列，计算它们的乘积之和。

def matrix_multiply(A, B):  
    # 获取矩阵维度  
    rows_A = len(A)  
    cols_A = len(A[0]) if A else 0  
    rows_B = len(B)  
    cols_B = len(B[0]) if B else 0  

    # 检查维度是否匹配  
    if cols_A != rows_B:  
        raise ValueError("矩阵 A 的列数必须等于矩阵 B 的行数")  

    # 初始化结果矩阵  
    result = [[0 for _ in range(cols_B)] for _ in range(rows_A)]  

    # 计算每个元素  
    for i in range(rows_A):  
        for j in range(cols_B):  
            for k in range(cols_A):  
                result[i][j] += A[i][k] * B[k][j]  
    return result

测试代码：

A = [[1, 2, 3], [4, 5, 6]]  
B = [[7, 8], [9, 10], [11, 12]]  

result = matrix_multiply(A, B)  
for row in result:  
    print(row)

2.2 方法二：列表推导式优化

通过列表推导式简化代码结构，但逻辑与循环方法一致。

def matrix_multiply_comp(A, B):  
    cols_A = len(A[0])  
    rows_B = len(B)  
    if cols_A != rows_B:  
        raise ValueError("维度不匹配")  

    return [  
        [  
            sum(A[i][k] * B[k][j] for k in range(cols_A))  
            for j in range(len(B[0]))  
        ]  
        for i in range(len(A))  
    ]

2.3 方法三：使用 NumPy 库（高级优化）

NumPy 是 Python 中用于科学计算的核心库，其矩阵运算通过底层 C 语言实现，速度极快。

安装与导入：

pip install numpy

import numpy as np  

A = np.array([[1, 2, 3], [4, 5, 6]])  
B = np.array([[7, 8], [9, 10], [11, 12]])  
result = A @ B  # 或者使用 np.dot(A, B)  

print(result)

三、常见问题与优化技巧

3.1 维度不匹配的错误处理

在函数中添加维度检查逻辑是关键。例如：

if cols_A != rows_B:  
    raise ValueError("矩阵 A 的列数必须等于矩阵 B 的行数")

3.2 时间复杂度分析

矩阵乘法的时间复杂度为 $O(m \times n \times p)$，其中 $m$、$n$、$p$ 分别是矩阵的行数、列数和目标列数。对于大型矩阵，需考虑优化策略，如：

分块矩阵法：将大矩阵拆分为小块，逐块计算。
Strassen 算法：通过减少乘法次数降低复杂度（适用于特定规模的矩阵）。

3.3 空间优化：原地计算

对于内存敏感的场景，可以通过覆盖原始矩阵或分批次计算来减少空间占用，但需谨慎处理数据覆盖问题。

四、应用场景与扩展学习

4.1 实际应用案例

机器学习：在神经网络中，权重矩阵与输入特征的乘法是前向传播的核心步骤。
计算机图形学：通过矩阵乘法实现三维物体的旋转、缩放和平移。
物理学：求解线性方程组时，矩阵运算可快速找到解空间。

4.2 进阶方向

张量运算：了解 NumPy 的多维数组（Tensor）操作。
并行计算：使用多线程或 GPU 加速大规模矩阵运算。
符号计算：通过 SymPy 库进行符号化的矩阵推导。

结论

通过本文，读者已掌握矩阵乘法的数学原理、Python 实现方法以及性能优化策略。无论是通过基础的循环结构，还是借助 NumPy 的高效库函数，都能灵活应对不同场景的需求。对于初学者，建议从手动实现开始，逐步理解算法逻辑；对于中级开发者，可以深入探索向量化操作和并行计算，进一步提升代码效率。掌握这一技能后，读者可以将其应用于数据分析、算法竞赛或科研项目中，为更复杂的任务打下坚实基础。

在实践中，建议读者尝试以下操作：

尝试编写一个函数，计算矩阵的转置或逆矩阵。
通过修改代码，实现矩阵的加法或减法运算。
使用不同规模的矩阵测试 NumPy 的性能优势。

通过持续练习和探索，矩阵运算将不再是抽象的数学概念，而是成为开发者手中灵活的工具。

Python 编写一个程序实现矩阵乘法（长文解析）

前言

一、矩阵乘法的核心规则与数学原理

1.1 矩阵的定义与维度

1.2 矩阵乘法规则

1.3 示例：手动计算矩阵乘法

二、Python 实现矩阵乘法的步骤与代码示例

2.1 方法一：基础循环实现

步骤说明：

测试代码：

2.2 方法二：列表推导式优化

2.3 方法三：使用 NumPy 库（高级优化）

安装与导入：

三、常见问题与优化技巧

3.1 维度不匹配的错误处理

3.2 时间复杂度分析

3.3 空间优化：原地计算

四、应用场景与扩展学习

4.1 实际应用案例

4.2 进阶方向

结论

最新发布

Rider 2025.1.1 最新破解版安装教程（附激活码~）

Clion 2025.1 最新激活码，破解版安装教程（至2099年~）

GoLand 2025.1 最新激活码，破解版安装教程（至2099年~）

PhpStorm 2025.1 最新破解版安装教程（附激活码~）

DataGrip 2025.1 最新激活码，破解版安装教程（至2099年~）

Webstorm 2025.1 最新激活码，破解版安装教程（至2099年~）

Pycharm 2025.1 最新激活码，破解版安装教程（至2099年~）

IDEA 2025.1 最新激活码，破解版安装教程（至2099年~）

Cursor @ 符号（千字长文）

POP3 协议（一文讲透）