volatile 关键字是用来保证有序性和可见性的。
我们所写的代码,不一定是按照我们自己书写的顺序来执行的,编译器会做重排序,CPU 也会做重排序的,这样做是为了了减少流水线阻塞,提高 CPU 的执行效率。这就需要有一定的顺序和规则来保证,不然程序员自己写的代码都不不知道对不对了,所以有 happens-before 规则。
其中有条就是 volatile 变量规则:对一个变量的写操作先行发生于后面对这个变量的读操作、有序性实现的是通过插入内存屏障来保证的。
被 volatile 修饰的共享变量量,就具有了以下两点特性:
从 CPU 层面来了解一下什么是内存屏障。
CPU 的乱序执行,本质还是 CPU 多核心、CPU 高速缓存。存在多个缓存的时候,就必须通过缓存一致性协议(MESI)来避免数据不一致的问题,而这个通讯的过程就可能导致乱序访问的问题,也就是运行时的内存乱序访问。
现在的 CPU 架构都提供了内存屏障功能,在 x86 的 CPU 中,实现了相应的内存屏障,写屏障(Store Barrier)、读屏障(Load Barrier)和全屏障(Full Barrier),主要的作用是:
在 JVM 底层 volatile 是采用「内存屏障」来实现的。当我们观察加入 volatile 关键字和没有加入 volatile 关键字时所生成的汇编代码会发现,加入 volatile 关键字时,会多出一个 lock 前缀指令,lock 前缀指令实际上相当于一个内存屏障,内存屏障会提供三个功能:
会引发两件事情:
什么意思呢?意思就是说当一个共享变量被 volatile 修饰时,它会保证修改的值会立即被更新到主存,当有其他线程需要读取时,它会去内存中读取新值,这就保证了可见性。
一个变量 i 被 volatile 修饰,两个线程想对这个变量修改,都对其进行自增操作也就是 i++,i++ 的过程可以分为三步,首先获取 i 的值,其次对 i 的值进行加1,最后将得到的新值写会到缓存中。
线程 A 首先得到了 i 的初始值100,但是还没来得及修改,就阻塞了,这时线程 B 开始了,它也得到了 i 的值,由于 i 的值未被修改,即使是被 volatile 修饰,主存的变量还没变化,那么线程 B 得到的值也是100,之后对其进行加 1 操作,得到101后,将新值写入到缓存中,再刷入主存中。根据可见性的原则,这个主存的值可以被其他线程可见。
问题来了,线程 A 已经读取到了 i 的值为100,也就是说读取的这个原子操作已经结束了,所以这个可见性来的有点晚,线程 A 阻塞结束后,继续将 100 这个值加 1,得到101,再将值写到缓存,最后刷入主存,所以即便是 volatile 具有可见性,也不能保证对它修饰的变量具有原子性。
测试案例:
/*** 实体类,观察num值的可见性,此时没有volatile*/
class Volatile {// volatile int num = 0; 加上volatile关键字int num = 0; // 不加volatile关键字public void addTo60() {this.num = 60;}
}//测试类
public class test {public static void main(String[] args) {//测试可见性seeVolatileOk();}/*** aaa线程修改num值为60后,main线程拿到的num=0,死循环。说明线程之间共享变量不可见。*/private static void seeVolatileOk() {Volatile v = new Volatile();new Thread(() -> {System.out.println(Thread.currentThread().getName() + "\t come in ");try {TimeUnit.SECONDS.sleep(2);} catch (InterruptedException e) {e.printStackTrace();}v.addTo60();System.out.println(Thread.currentThread().getName() + "\t updated num value:" + v.num);}, "aaa").start();while (v.num==0){}System.out.println(Thread.currentThread().getName() + "\t mission is over,updated num value:" + v.num);}
}
为了实现 volatile 的内存语义,编译器在生成字节码时,会在指令序列中插入内存屏障来禁止特定类型的处理器重排序。内存屏障插入策略非常保守,但它可以保证在任意处理器平台,任意的程序中都能得到正确的 volatile 内存语义。
volatile 仅仅保证对单个 volatile 变量的读/写具有原子性,而锁的互斥执行的特性可以确保对整个临界区代码的执行具有原子性。在功能上锁比 volatile 更强大,在可伸缩性和执行性能上 volatile 更有优势。