首页
/ 正文

Python 随机数生成（超详细）

更新时间: 2025-03-26 19:13:22

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 82w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 2900+ 小伙伴加入学习，欢迎点击围观

在编程领域，随机数生成是一项基础但至关重要的技术。无论是游戏开发中的道具掉落、数据分析中的抽样操作，还是密码学中的密钥生成，都离不开对随机性的精准控制。Python 作为一门简洁高效的编程语言，提供了多种实现随机数生成的方法，能够满足从简单需求到复杂场景的多样化需求。本文将从基础概念出发，逐步深入讲解 Python 中的随机数生成技术，并通过实际案例帮助读者掌握其核心原理与应用场景。

一、随机数生成的基础概念

什么是随机数？

随机数是指在给定范围内随机选择的数值，其核心特征是“不可预测性”和“无规律性”。但在计算机领域，由于算法的局限性，大多数随机数生成器实际生成的是“伪随机数”，即通过特定算法模拟出的随机效果。例如，可以将伪随机数理解为一个“有规律的魔术表演”——虽然观众看到的是随机变化的魔术动作，但背后其实遵循着预设的规则。

为什么需要随机数生成？

模拟现实场景：例如模拟天气变化、用户行为分析等；
算法优化：如机器学习中的随机森林、遗传算法等依赖随机性；
安全加密：密钥生成、验证码设计等场景需要高质量的随机性保障。

二、Python 的随机数生成模块：random 模块详解

Python 内置的 random 模块是随机数生成的入门工具，适合大多数非加密场景的需求。

1. 基础函数与用法

(1) 生成均匀分布的随机数

import random  

random_float = random.random()  
print("随机浮点数:", random_float)  

random_int = random.randint(1, 10)  # 包含 10  
print("随机整数:", random_int)

关键点：randint(a, b) 的上限 b 是包含的，而 random() 的结果范围是 [0.0, 1.0)。

(2) 随机选择与排列

my_list = [10, 20, 30, 40, 50]  

selected = random.choice(my_list)  
print("随机选择:", selected)  

random.shuffle(my_list)  
print("打乱后的列表:", my_list)

比喻：shuffle() 就像把一副牌洗一遍，但每次洗牌的结果都由“洗牌算法”决定。

2. 伪随机数的“种子”控制

伪随机数的“随机性”其实依赖于一个初始值——“种子”（seed）。通过设置相同的种子，可以保证每次运行代码时生成的随机数序列一致。

random.seed(42)  # 固定种子为 42  
print(random.randint(1, 100))  # 输出结果始终相同

应用场景：在数据分析或机器学习中，设置固定种子可以确保实验结果的可复现性。

3. 非均匀分布的随机数生成

除了均匀分布外，random 模块还支持多种统计分布的随机数生成，例如正态分布、指数分布等。

normal_num = random.gauss(0, 1)  
print("正态分布随机数:", normal_num)  

exp_num = random.expovariate(1)  
print("指数分布随机数:", exp_num)

三、进阶：numpy 模块与高性能随机数生成

对于需要处理大规模数据或复杂分布的场景，numpy 模块提供了更高效、更灵活的随机数生成能力。

1. numpy 的核心优势

向量化运算：直接生成数组或矩阵形式的随机数据；
支持多种分布：如泊松分布、伽马分布、多维正态分布等；
并行计算优化：适合高性能计算场景。

2. 常用函数示例

import numpy as np  

arr_uniform = np.random.rand(3, 3)  
print("均匀分布数组:\n", arr_uniform)  

samples = np.random.normal(loc=0, scale=1, size=1000)  
print("前 5 个正态分布样本:", samples[:5])

3. 自定义随机种子与分布参数

np.random.seed(42)  # numpy 的种子设置方式  

poisson_data = np.random.poisson(lam=3, size=5)  
print("泊松分布数据:", poisson_data)

四、安全场景：secrets 模块与加密级随机数

当需要生成密码、验证码或敏感密钥时，random 模块的安全性可能不足。此时应使用 secrets 模块，它基于操作系统提供的加密安全随机源。

1. secrets 模块的核心函数

import secrets  

secure_key = secrets.token_hex(10)  
print("安全密钥:", secure_key)  

secure_int = secrets.randbelow(100000)  
print("安全整数:", secure_int)

2. 与 random 模块的关键区别

特性	random 模块	secrets 模块
安全性	不适合加密场景	设计用于加密敏感数据
随机源	基于 Mersenne Twister 算法	操作系统提供的加密安全源
可重复性	可通过 seed 控制	不可预测且不可复现

五、实际案例：掷骰子游戏的实现

案例需求

模拟一个六面骰子的投掷过程，要求：

每次投掷返回 1-6 的随机整数；
可通过种子复现特定结果；
统计 1000 次投掷后各点数的出现频率。

实现代码

import random  

def roll_dice(seed=None):  
    if seed is not None:  
        random.seed(seed)  
    return random.randint(1, 6)  

def main():  
    # 固定种子以保证可复现  
    random.seed(42)  

    results = []  
    for _ in range(1000):  
        results.append(roll_dice())  

    # 统计频率  
    frequency = {i: results.count(i) for i in range(1, 7)}  
    print("各点数出现次数:", frequency)  

if __name__ == "__main__":  
    main()

输出示例

各点数出现次数: {1: 165, 2: 178, 3: 152, 4: 167, 5: 169, 6: 169}

六、常见问题与最佳实践

1. 为什么随机数看起来不随机？

伪随机数的局限性：由于算法的确定性，伪随机数在足够大的样本量下仍会呈现统计规律；
分布选择不当：例如，使用 randint() 生成大量数值时，需确保分布均匀。

2. 如何避免随机数重复？

在需要唯一标识的场景（如验证码），应结合时间戳或唯一 ID；
使用加密安全模块（如 secrets）生成关键数据。

3. 性能优化建议

对于大规模随机数生成，优先使用 numpy 的向量化函数；
避免在循环中频繁调用 random()，可预先生成批次数据。

七、结论

Python 提供了从基础到高级的随机数生成工具链，开发者需根据具体需求选择合适的模块：

日常开发：random 模块足够应对大多数场景；
科学计算：numpy 提供高性能和多样化的分布支持；
安全场景：secrets 是加密数据的唯一选择。

通过合理设置种子、理解分布特性并结合实际案例，读者可以掌握 Python 随机数生成的核心技巧，为后续的算法设计、数据分析和应用开发奠定基础。