并发集合深入剖析

传统集合的并发问题

在JDK 1.5之前，如果需要在多线程环境中使用线程安全的集合，开发者只能选择Vector、Hashtable这类古老的同步集合，或者使用Collections.synchronizedXXX()方法包装普通集合。

这些传统方案都存在严重的性能问题：它们对增删改查等所有方法都加上了synchronized同步锁，相当于给整个集合加了一把大锁。这种粗粒度的锁机制导致每个操作都要竞争同一把锁，在高并发场景下会形成严重的性能瓶颈。

mermaid

graph TB
    A[传统集合并发方案] --> B[Vector]
    A --> C[Hashtable]
    A --> D[Collections.synchronizedXXX]
    
    B --> E[全局synchronized锁]
    C --> E
    D --> E
    
    E --> F[性能问题]
    F --> F1[锁竞争激烈]
    F --> F2[吞吐量低]
    F --> F3[扩展性差]
    
    G[JUC并发集合] --> H[细粒度锁]
    G --> I[CAS无锁算法]
    G --> J[写时复制]
    
    H --> K[高性能]
    I --> K
    J --> K
    
    style A fill:#ffcdd2
    style E fill:#fff9c4
    style F fill:#ffccbc
    style G fill:#c8e6c9
    style K fill:#81c784

CopyOnWriteArrayList写时复制机制

什么是COW

Copy-On-Write简称COW，是一种用于程序设计中的优化策略。其基本思路是，从一开始大家都在共享同一个内容，当某个人想要修改这个内容的时候，才会真正把内容Copy出去形成一个新的内容然后再改，这是一种延时懒惰策略。

从JDK 1.5开始，Java并发包里提供了两个使用CopyOnWrite机制实现的并发容器：CopyOnWriteArrayList和CopyOnWriteArraySet。CopyOnWrite容器非常有用，可以在非常多的并发场景中使用到。

mermaid

graph TB
    A[COW核心思想] --> B[共享读取]
    A --> C[写时复制]
    
    B --> B1[多线程共享同一份数据]
    B --> B2[读操作无需加锁]
    
    C --> C1[修改时复制新副本]
    C --> C2[在副本上执行修改]
    C --> C3[替换原数据引用]
    
    D[JDK 1.5引入] --> E[CopyOnWriteArrayList]
    D --> F[CopyOnWriteArraySet]
    
    style A fill:#e8f5e9,rx:10
    style B fill:#c8e6c9,rx:10
    style C fill:#a5d6a7,rx:10
    style D fill:#e3f2fd,rx:10

设计思想

在绝大多数业务场景中，对集合的读取操作远多于写入操作。由于读取操作不会修改原有数据，每次读取都加锁实际上是一种资源浪费。CopyOnWriteArrayList实现了一种读写分离的极致优化：读操作完全无锁，写操作采用写时复制策略。

CopyOnWriteArrayList相当于线程安全的ArrayList，它使用写时复制的方法：当有新元素add到CopyOnWriteArrayList时，先从原有的数组中拷贝一份出来，然后在新的数组做写操作，写完之后，再将原来的数组引用指向到新数组。

这样做的好处是：我们可以对CopyOnWrite容器进行并发的读，而不需要加锁，因为当前容器不会添加任何元素。所以CopyOnWrite容器也是一种读写分离的思想，读和写不同的容器。

CopyOnWriteArrayList的核心思想是：读读不互斥、读写不互斥、写写互斥。相比ReentrantReadWriteLock的读写锁，它更进一步实现了读操作的零开销。

写时复制原理

当需要修改（add、set、remove等）CopyOnWriteArrayList的内容时，不会直接修改原数组，而是：

复制底层数组创建一个新副本
在新副本上执行修改操作
将对象的引用指向新数组

这样可以保证正在进行的读操作不受写操作影响，因为读操作始终访问的是修改前的旧数组。

mermaid

sequenceDiagram
    participant R as 读线程
    participant W as 写线程
    participant A as 原数组
    participant B as 新数组副本
    
    R->>A: 读取数据（无锁）
    W->>W: 获取锁
    W->>A: 复制数组
    A-->>B: 创建副本
    W->>B: 在副本上修改
    R->>A: 继续读取旧数组（不受影响）
    W->>W: 替换数组引用
    W->>W: 释放锁
    Note over R,B: 后续读操作访问新数组

线程安全保证

CopyOnWriteArrayList的整个add操作都是在锁的保护下进行的，也就是说add方法是线程安全的。

java

// CopyOnWriteArrayList的add方法源码简化版
public boolean add(E e) {
    final ReentrantLock lock = this.lock;
    lock.lock();  // 加锁保证写操作的线程安全
    try {
        Object[] elements = getArray();
        int len = elements.length;
        // 复制新数组，长度+1
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        // 在新数组上添加元素
        newElements[len] = e;
        // 替换数组引用
        setArray(newElements);
        return true;
    } finally {
        lock.unlock();  // 释放锁
    }
}

// 读操作完全无锁
public E get(int index) {
    return get(getArray(), index);  // 直接读取，无需加锁
}

与ArrayList的对比

和ArrayList不同的是，CopyOnWriteArrayList具有以下特性：

特性	ArrayList	CopyOnWriteArrayList
线程安全	否	是
读操作开销	低	低（无锁）
写操作开销	低	高（需复制数组）
迭代器类型	fail-fast	fail-safe
支持remove()	是	否（迭代器不支持）
内存占用	低	较高（写时需双倍内存）

CopyOnWriteArrayList的核心特点：

支持高效率并发且是线程安全的
因为通常需要复制整个基础数组，所以可变操作（add()、set()和remove()等）的开销很大
迭代器支持hasNext()、next()等不可变操作，但不支持可变remove()等操作
使用迭代器进行遍历的速度很快，并且不会与其他线程发生冲突。在构造迭代器时，迭代器依赖于不变的数组快照

java

// 使用示例：系统配置白名单
public class WhitelistManager {
    // 使用COW容器存储白名单，读多写少场景
    private CopyOnWriteArrayList<String> whitelist = new CopyOnWriteArrayList<>();
    
    // 检查是否在白名单中（高频读操作，无锁）
    public boolean isWhitelisted(String ip) {
        return whitelist.contains(ip);
    }
    
    // 添加到白名单（低频写操作）
    public void addToWhitelist(String ip) {
        if (!whitelist.contains(ip)) {
            whitelist.add(ip);  // 线程安全
        }
    }
    
    // 从白名单移除
    public void removeFromWhitelist(String ip) {
        whitelist.remove(ip);  // 线程安全
    }
    
    // 安全遍历，不会抛出ConcurrentModificationException
    public void printAll() {
        for (String ip : whitelist) {
            System.out.println(ip);
        }
    }
}

适用场景

CopyOnWrite并发容器用于读多写少的并发场景。比如白名单、黑名单、商品类目的访问和更新场景。

适合使用的场景：

读操作占绝大多数，写操作很少
集合数据量不大（避免频繁复制大数组）
对数据实时一致性要求不高（允许短暂的最终一致性）

不适合使用的场景：

写操作频繁，会导致频繁复制数组，性能很差
集合数据量非常大，复制开销不可接受
需要强一致性，不能容忍读到旧数据

mermaid

graph TB
    A[使用场景判断] --> B{写操作频率?}
    B -->|频繁写入| C[不推荐COW]
    B -->|读多写少| D{数据量大小?}
    
    D -->|数据量大| E[谨慎使用]
    D -->|数据量适中| F{一致性要求?}
    
    F -->|强一致性| G[不推荐COW]
    F -->|最终一致性| H[推荐使用COW]
    
    C --> I[考虑ConcurrentHashMap等]
    E --> J[评估复制开销]
    H --> K[白名单/黑名单/配置缓存等]
    
    style H fill:#c8e6c9,rx:10
    style C fill:#ffcdd2,rx:10
    style G fill:#ffcdd2,rx:10

典型应用场景包括：监听器列表、配置信息缓存、白名单黑名单、商品类目等。

ConcurrentLinkedQueue无锁队列

阻塞队列vs非阻塞队列

Java提供的线程安全队列分为两大类：

阻塞队列（BlockingQueue）：当队列满时插入操作会阻塞，当队列空时获取操作会阻塞。通过锁机制实现线程安全，适合生产者-消费者模式。

非阻塞队列：不会阻塞调用线程，通过CAS（Compare-And-Swap）无锁算法实现线程安全。ConcurrentLinkedQueue就是典型的非阻塞队列实现。

高性能设计

ConcurrentLinkedQueue是一个基于链表结构的无界非阻塞队列，它使用CAS原子操作来保证线程安全，性能极高。主要特点包括：

采用无锁算法，避免了线程阻塞和上下文切换
基于链表结构，理论上容量无限（受内存限制）
遵循FIFO（先进先出）原则
不允许null元素

应用场景选择

选择ConcurrentLinkedQueue的场景：

对性能要求较高的并发环境
多个线程同时进行读写操作
不需要阻塞等待的业务逻辑
如果加锁成本较高，优先使用无锁方案

选择BlockingQueue的场景：

需要实现生产者-消费者模式
需要线程等待/通知机制
需要控制队列容量上限

BlockingQueue阻塞队列家族

BlockingQueue核心概念

阻塞队列（BlockingQueue）在生产者-消费者模式中应用广泛。它提供了可阻塞的插入和移除方法：

当队列已满时，生产者线程的插入操作会被阻塞
当队列为空时，消费者线程的获取操作会被阻塞

这种自动阻塞机制简化了生产者-消费者模式的实现，不需要手动编写wait/notify代码。

mermaid

graph TB
    A[BlockingQueue接口] --> B[有界队列]
    A --> C[无界队列]
    A --> D[特殊队列]
    
    B --> B1[ArrayBlockingQueue<br/>数组实现]
    B --> B2[LinkedBlockingQueue<br/>链表实现可指定容量]
    
    C --> C1[LinkedBlockingQueue<br/>不指定容量]
    C --> C2[PriorityBlockingQueue<br/>优先级队列]
    C --> C3[DelayQueue<br/>延时队列]
    
    D --> D1[SynchronousQueue<br/>零容量同步队列]
    D --> D2[LinkedTransferQueue<br/>传输队列]
    
    style A fill:#e1f5fe
    style B fill:#fff9c4
    style C fill:#f0f4c3
    style D fill:#ffe0b2

ArrayBlockingQueue数组阻塞队列

ArrayBlockingQueue是基于数组实现的有界阻塞队列，主要特点：

底层采用数组结构，创建时必须指定容量且不可变
使用ReentrantLock控制并发，插入和删除共用一把锁
支持公平锁和非公平锁模式

创建公平性队列示例：

java

// 创建容量为100的公平队列
BlockingQueue<Order> orderQueue = new ArrayBlockingQueue<>(100, true);

// 生产者线程
new Thread(() -> {
    try {
        Order order = new Order("ORD2024001");
        orderQueue.put(order);  // 队列满时会阻塞
        System.out.println("订单已加入队列：" + order.getOrderId());
    } catch (InterruptedException e) {
        Thread.currentThread().interrupt();
    }
}).start();

// 消费者线程
new Thread(() -> {
    try {
        Order order = orderQueue.take();  // 队列空时会阻塞
        System.out.println("订单开始处理：" + order.getOrderId());
    } catch (InterruptedException e) {
        Thread.currentThread().interrupt();
    }
}).start();

LinkedBlockingQueue链表阻塞队列

LinkedBlockingQueue基于单向链表实现，相比ArrayBlockingQueue具有更高的吞吐量：

可以指定容量（有界）也可以不指定容量（理论无界，最大Integer.MAX_VALUE）
插入和删除使用两把锁（takeLock和putLock），减少锁竞争
满足FIFO特性

java

// 创建有界队列，容量1000
LinkedBlockingQueue<Task> taskQueue = new LinkedBlockingQueue<>(1000);

// 创建无界队列（不推荐，可能导致内存溢出）
LinkedBlockingQueue<Task> unboundedQueue = new LinkedBlockingQueue<>();

// 批量任务处理
for (int i = 0; i < 100; i++) {
    Task task = new Task("任务-" + i);
    boolean success = taskQueue.offer(task, 3, TimeUnit.SECONDS);
    if (!success) {
        System.out.println("队列已满，任务入队失败：" + task.getName());
    }
}

PriorityBlockingQueue优先级队列

PriorityBlockingQueue是支持优先级排序的无界阻塞队列：

元素按照自然顺序或自定义比较器排序
不允许插入null值
插入操作不会阻塞（无界队列），但取出操作在队列空时会阻塞
内部使用ReentrantLock保证线程安全
空间不足时会自动扩容

java

// 定义任务优先级
class PriorityTask implements Comparable<PriorityTask> {
    private String name;
    private int priority;  // 数字越小优先级越高
    
    public PriorityTask(String name, int priority) {
        this.name = name;
        this.priority = priority;
    }
    
    @Override
    public int compareTo(PriorityTask other) {
        return Integer.compare(this.priority, other.priority);
    }
}

// 创建优先级队列
PriorityBlockingQueue<PriorityTask> queue = new PriorityBlockingQueue<>();

// 添加不同优先级的任务
queue.put(new PriorityTask("普通任务", 5));
queue.put(new PriorityTask("紧急任务", 1));
queue.put(new PriorityTask("低优先级任务", 10));

// 按优先级顺序处理（输出：紧急任务 -> 普通任务 -> 低优先级任务）
while (!queue.isEmpty()) {
    PriorityTask task = queue.take();
    System.out.println("处理任务：" + task.name);
}

DelayQueue延时队列

DelayQueue是一个支持延时获取元素的无界阻塞队列，元素必须实现Delayed接口：

只有到期的元素才能被取出
内部使用PriorityQueue存储元素
适用于缓存过期、定时任务调度等场景

java

// 延时任务
class DelayedTask implements Delayed {
    private String taskName;
    private long executeTime;  // 执行时间戳
    
    public DelayedTask(String taskName, long delayMillis) {
        this.taskName = taskName;
        this.executeTime = System.currentTimeMillis() + delayMillis;
    }
    
    @Override
    public long getDelay(TimeUnit unit) {
        long diff = executeTime - System.currentTimeMillis();
        return unit.convert(diff, TimeUnit.MILLISECONDS);
    }
    
    @Override
    public int compareTo(Delayed other) {
        return Long.compare(this.executeTime, 
                           ((DelayedTask) other).executeTime);
    }
}

// 使用延时队列
DelayQueue<DelayedTask> delayQueue = new DelayQueue<>();

// 添加延时任务
delayQueue.put(new DelayedTask("5秒后执行", 5000));
delayQueue.put(new DelayedTask("3秒后执行", 3000));
delayQueue.put(new DelayedTask("10秒后执行", 10000));

// 按到期时间顺序获取任务
while (!delayQueue.isEmpty()) {
    DelayedTask task = delayQueue.take();  // 阻塞直到有任务到期
    System.out.println("执行任务：" + task.taskName);
}

SynchronousQueue同步队列

SynchronousQueue是一个特殊的阻塞队列，它没有容量（或者说容量为0）：

每个插入操作必须等待对应的删除操作
每个删除操作必须等待对应的插入操作
不存储元素，只负责线程间的直接交接
常用于线程池的直接提交策略

java

SynchronousQueue<String> queue = new SynchronousQueue<>();

// 生产者线程
new Thread(() -> {
    try {
        System.out.println("生产者准备发送消息");
        queue.put("重要数据包");  // 阻塞直到有消费者接收
        System.out.println("消息已被接收");
    } catch (InterruptedException e) {
        Thread.currentThread().interrupt();
    }
}).start();

// 消费者线程
new Thread(() -> {
    try {
        Thread.sleep(2000);  // 模拟延迟
        String data = queue.take();  // 阻塞直到有生产者发送
        System.out.println("消费者接收到：" + data);
    } catch (InterruptedException e) {
        Thread.currentThread().interrupt();
    }
}).start();

ConcurrentSkipListMap跳表实现

跳表数据结构

跳表是一种可以快速查找的数据结构，通过建立多级索引来加速查询。它的查找时间复杂度是O(log n)，与平衡树相当，但实现更简单。

跳表的关键优势在于：

插入和删除只需局部调整，不需要全局重新平衡
在高并发环境下，只需要部分锁即可，而平衡树需要全局锁
所有元素保持有序

mermaid

graph LR
    A[第3层索引] --> B[3] --> C[17]
    D[第2层索引] --> E[3] --> F[9] --> G[17] --> H[25]
    I[第1层索引] --> J[3] --> K[6] --> L[9] --> M[12] --> N[17] --> O[20] --> P[25] --> Q[30]
    R[原始链表] --> S[1] --> T[3] --> U[6] --> V[9] --> W[12] --> X[17] --> Y[20] --> Z[25] --> AA[30]
    
    style A fill:#e1bee7
    style D fill:#ce93d8
    style I fill:#ba68c8
    style R fill:#ab47bc

ConcurrentSkipListMap特性

ConcurrentSkipListMap是基于跳表实现的并发Map，主要特点：

键值对按照键的自然顺序或自定义比较器排序
提供了预期O(log n)时间复杂度的查找、插入、删除操作
使用CAS操作保证线程安全，支持高并发访问
不允许null键，但允许null值

选择ConcurrentSkipListMap的场景：

需要有序的并发Map
需要范围查询功能
不需要强一致性的遍历

选择ConcurrentHashMap的场景：

不需要有序性
纯粹追求读写性能

总结

JUC并发集合为不同场景提供了高性能的线程安全解决方案：

集合类型	适用场景	核心机制
CopyOnWriteArrayList	读多写少	写时复制
ConcurrentLinkedQueue	高性能非阻塞	CAS无锁
ArrayBlockingQueue	有界生产消费	单锁阻塞
LinkedBlockingQueue	高吞吐生产消费	双锁阻塞
PriorityBlockingQueue	优先级处理	堆排序
DelayQueue	延时调度	延时获取
SynchronousQueue	直接交接	零容量
ConcurrentSkipListMap	有序并发Map	跳表

合理选择并发集合可以在保证线程安全的同时最大化系统性能。

更新: 2025-12-04 17:36:22
原文: https://www.yuque.com/u22210564/zoxfmt/doc-07-14-27

并发集合深入剖析 ​

传统集合的并发问题 ​

CopyOnWriteArrayList写时复制机制 ​

什么是COW ​

设计思想 ​

写时复制原理 ​

线程安全保证 ​

与ArrayList的对比 ​

适用场景 ​

ConcurrentLinkedQueue无锁队列 ​

阻塞队列vs非阻塞队列 ​

高性能设计 ​

应用场景选择 ​

BlockingQueue阻塞队列家族 ​

BlockingQueue核心概念 ​

ArrayBlockingQueue数组阻塞队列 ​

LinkedBlockingQueue链表阻塞队列 ​

PriorityBlockingQueue优先级队列 ​

DelayQueue延时队列 ​

SynchronousQueue同步队列 ​

ConcurrentSkipListMap跳表实现 ​

跳表数据结构 ​

ConcurrentSkipListMap特性 ​

总结 ​

并发集合深入剖析

传统集合的并发问题

CopyOnWriteArrayList写时复制机制

什么是COW

设计思想

写时复制原理

线程安全保证

与ArrayList的对比

适用场景

ConcurrentLinkedQueue无锁队列

阻塞队列vs非阻塞队列

高性能设计

应用场景选择

BlockingQueue阻塞队列家族

BlockingQueue核心概念

ArrayBlockingQueue数组阻塞队列

LinkedBlockingQueue链表阻塞队列

PriorityBlockingQueue优先级队列

DelayQueue延时队列

SynchronousQueue同步队列

ConcurrentSkipListMap跳表实现

跳表数据结构

ConcurrentSkipListMap特性

总结