CopyOnWriteArrayList 使用与分析

计算机

August 14, 2020

张可

CopyOnWriteArrayList

先看看百科上关于 COW 的介绍：

写入时复制（英语：Copy-on-write，简称COW）是一种计算机程序设计领域的优化策略。其核心思想是，如果有多个调用者（callers）同时请求相同资源（如内存或磁盘上的数据存储），他们会共同获取相同的指针指向相同的资源，直到某个调用者试图修改资源的内容时，系统才会真正复制一份专用副本（private copy）给该调用者，而其他调用者所见到的最初的资源仍然保持不变。这过程对其他的调用者都是透明的（transparently）。此作法主要的优点是如果调用者没有修改该资源，就不会有副本（private copy）被创建，因此多个调用者只是读取操作时可以共享同一份资源。简单来说，就是读取时直接读取不用加锁同步，写入数据时会复制一份副本，然后将新的数据写入到副本中，然后再把副本替换成原来的数据。

因此 CopyOnWriteArrayList 是线程安全的，另外也允许 null 元素。

这种方式导致了读取速度很快，写入速度较慢，适合多线程环境中经常读取但写入很少的场景。

所以如果有个场景需要在多线程环境中使用，频繁读取，但写入次频率很低，例如黑名单白名单，每天更新一次，那就可以使用 CopyOnWriteArrayList 来实现。

其中的迭代器是不允许对数据修改的，调用remove,set,add这些方法会直接抛异常。

一般可以按照常规的 List 来使用，其中没有什么特殊的方法，就直接开始看源码吧。

CopyOnWriteArrayList 下面简称 COWList。

源码

我们先看其中两个最重要的方法：

private transient volatile Object[] array;
final Object[] getArray() {
    return array;
}
final void setArray(Object[] a) {
    array = a;
}

上面定义的array变量就是 COWList 中存储数据的地方。所有的读取写入操作都是通过对这个数组的操作。

因此构造函数也是创建一个空的数组然后调用setArray方法设置数组。

public CopyOnWriteArrayList() {
    setArray(new Object[0]);
}

COWList 的优势之一就是即使在多线程环境中，读取也是不需要加锁的，所以效率很高，那么我们来看看读取方法是如何实现的：

public E get(int index) {
    return get(getArray(), index);
}
private E get(Object[] a, int index) {
    return (E) a[index];
}

可以看到这里直接通过索引读取了数组的值，没有加锁。这根我们使用Collections.synchronizedList方法获取到的SynchronizedList效率要高。

可以看下SynchronizedList是如何实现读取及写入的：

//SynchronizedList
public E get(int index) {
    synchronized (mutex) {
        return list.get(index);
    }
}
public E set(int index, E element) {
    synchronized (mutex) {
        return list.set(index, element);
    }
}

对比一下显而易见，读取不加锁的话效率就高多了。

那么 COWList 是如何实现多线程环境下的安全问题的呢，看下写入方法就明白了。

public boolean add(E e) {
    synchronized (lock) {
        Object[] elements = getArray();
        int len = elements.length;
        //复制数组
        Object[] newElements = Arrays.copyOf(elements, len + 1);
        newElements[len] = e;
        setArray(newElements);
        return true;
    }
}

可以看到添加元素会加锁，加锁之后会将原数组复制到一个更大（len + 1）的数组中去，并将追加元素添加到数组末尾，完成操作后调用setArray方法设置新数组。

所以写入的效率是很低的，需要进行一次数组复制操作，用 COWList 时应该尽量降低写入操作的频率，如果需要经常写入，那说明可能不适合用这个。