首页
/ 正文

C++ 容器类 <set>（千字长文）

更新时间: 2025-04-14 19:53:11

💡一则或许对你有用的小广告

欢迎加入小哈的星球 ，你将获得：专属的项目实战 / 1v1 提问 / Java 学习路线 / 学习打卡 / 每月赠书 / 社群讨论

新项目:《从零手撸：仿小红书（微服务架构）》 正在持续爆肝中，基于 Spring Cloud Alibaba + Spring Boot 3.x + JDK 17...，点击查看项目介绍 ;

《从零手撸：前后端分离博客项目（全栈开发）》 2 期已完结，演示链接： http://116.62.199.48/ ;

截止目前，星球内专栏累计输出 82w+ 字，讲解图 3441+ 张，还在持续爆肝中.. 后续还会上新更多项目，目标是将 Java 领域典型的项目都整一波，如秒杀系统, 在线商城, IM 即时通讯，权限管理，Spring Cloud Alibaba 微服务等等，已有 2900+ 小伙伴加入学习，欢迎点击围观

前言

在 C++ 标准模板库（STL）中，容器类 <set> 是一个功能强大且常被低估的工具。它以高效的方式管理集合数据，确保元素的唯一性和有序性，尤其适合需要去重或快速查找的场景。本文将从基础概念逐步深入，结合实际案例，帮助读者掌握 <set> 的核心特性与应用场景。

基础概念与特性

数据结构特性

<set> 是基于 红黑树（Red-Black Tree） 实现的关联容器，其核心特性包括：

元素唯一性：同一元素只能存储一次，插入重复元素会被自动忽略。
自动排序：元素按特定规则（默认为升序）自动排序，无需额外操作。
快速查找：支持对数时间复杂度（O(log n）的查找、插入和删除操作。

形象比喻：可以将 <set> 视为一个 图书馆的索引系统。书籍（元素）被按标题排序存放，读者（程序）能快速找到目标书籍，且同一标题的书籍不会重复出现。

基本操作与语法

#include <set>  
using namespace std;  

// 声明一个默认排序的整型 set  
set<int> mySet;  

// 插入元素  
mySet.insert(5);  
mySet.insert(3);  
mySet.insert(7);  

// 查找元素  
auto it = mySet.find(3);  
if (it != mySet.end()) {  
    cout << "Found element: " << *it << endl;  
}

核心功能详解

元素插入与查找

插入元素

insert() 方法会自动检查元素是否已存在。例如：

mySet.insert(5);  // 成功插入  
mySet.insert(5);  // 无变化，返回 pair<bool, iterator> 的 first 为 false

查找与存在性判断

find() 返回指向元素的迭代器，若未找到则返回 end()：

auto it = mySet.find(5);  
if (it != mySet.end()) {  
    cout << "存在该元素";  
}

遍历集合

通过迭代器或范围 for 循环遍历：

for (const auto& num : mySet) {  
    cout << num << " ";  
}  
// 输出：3 5 7

高级特性与扩展

自定义排序规则

默认排序规则是按元素类型的小于运算符（<），但可通过 仿函数（Functor） 自定义排序逻辑。例如，实现降序排列：

struct DescendingCompare {  
    bool operator()(int a, int b) const {  
        return a > b;  
    }  
};  

set<int, DescendingCompare> descSet;  
descSet.insert(3);  
descSet.insert(7);  
// 遍历时元素顺序为 7、3

哈希表实现：`unordered_set`

若仅需元素唯一性而不关心顺序，可使用 <unordered_set>，其底层基于哈希表实现，查找时间复杂度为 O(1)：

unordered_set<string> words;  
words.insert("apple");  
words.insert("banana");

实际案例与应用场景

案例1：去重与统计

假设需要统计一段文本中不重复的单词数量：

#include <set>  
#include <string>  
#include <fstream>  

int main() {  
    ifstream file("input.txt");  
    set<string> uniqueWords;  
    string word;  
    while (file >> word) {  
        uniqueWords.insert(word);  
    }  
    cout << "Unique words count: " << uniqueWords.size() << endl;  
    return 0;  
}

优点：利用 <set> 的自动去重特性，无需手动判断重复。

案例2：快速查找与区间查询

在游戏开发中，假设需要快速判断玩家是否在某个等级范围内：

set<int> levelRange{10, 20, 30, 40};  
int playerLevel = 25;  

// 查找第一个大于等于 playerLevel 的元素  
auto it = levelRange.lower_bound(playerLevel);  
if (it != levelRange.end()) {  
    cout << "Next level threshold: " << *it << endl;  
}

lower_bound() 和 upper_bound() 方法可高效实现区间查询。

常见问题与最佳实践

误区与注意事项

元素不可修改：<set> 的元素存储在红黑树节点中，直接通过迭代器修改值可能导致未定义行为。
```
mySet.insert(5);  
auto it = mySet.find(5);  
*it = 10;  // 错误！元素可能被重新排序，导致逻辑错误  
```
正确做法：删除旧元素并插入新元素。
内存管理：<set> 会自动管理内存，但需确保元素类型支持拷贝构造和赋值操作。

性能对比

操作	`vector`	`set`	`unordered_set`
插入（尾部）	O(1)	O(log n)	O(1) 平均
查找（任意位置）	O(n)	O(log n)	O(1) 平均
保持有序性	不自动排序	自动排序	无序

结论

<set> 是 C++ 中处理集合数据的强大工具，其 自动排序、唯一性和高效查找特性 在需要去重、快速判断存在性或区间查询的场景中尤为突出。通过自定义排序规则和结合 unordered_set，开发者能灵活应对不同需求。掌握 <set> 的核心用法和注意事项，可显著提升代码的简洁性和性能。

对于初学者，建议从基础操作入手，逐步尝试自定义排序和复杂场景的应用；中级开发者则可探索 <multiset> 或 <map> 的扩展功能，进一步优化数据管理逻辑。

C++ 容器类 <set>（千字长文）

前言

基础概念与特性

数据结构特性

基本操作与语法

核心功能详解

元素插入与查找

插入元素

查找与存在性判断

遍历集合

高级特性与扩展

自定义排序规则

哈希表实现：`unordered_set`

实际案例与应用场景

案例1：去重与统计

案例2：快速查找与区间查询

常见问题与最佳实践

误区与注意事项

性能对比

结论

最新发布

数据结构与算法（手把手讲解）

插入排序（长文讲解）

希尔排序（千字长文）

归并排序（建议收藏）

随机化快速排序（保姆级教程）

双路快速排序（超详细）

三路排序算法（建议收藏）

排序算法衍生问题（长文解析）

堆的基本存储（建议收藏）

堆的 shift up（保姆级教程）

C++ 容器类 <set>（千字长文）

前言

基础概念与特性

数据结构特性

基本操作与语法

核心功能详解

元素插入与查找

插入元素

查找与存在性判断

遍历集合

高级特性与扩展

自定义排序规则

哈希表实现：unordered_set

实际案例与应用场景

案例1：去重与统计

案例2：快速查找与区间查询

常见问题与最佳实践

误区与注意事项

性能对比

结论

最新发布

数据结构与算法（手把手讲解）

插入排序（长文讲解）

希尔排序（千字长文）

归并排序（建议收藏）

随机化快速排序（保姆级教程）

双路快速排序（超详细）

三路排序算法（建议收藏）

排序算法衍生问题（长文解析）

堆的基本存储（建议收藏）

堆的 shift up（保姆级教程）

哈希表实现：`unordered_set`