Volatile实现原理 —— 禁止指令重排序
为了实现volatile
的内存语义,编译器在生成字节码时,会在指令序列中插入内存屏障来禁止特定类型的处理器重排序。
对于编译器来说,发现一个最优布置来最小化插入屏障的总数几乎不可能。为了,JMM采取保守策略:
volatile写操作:
- 在每个volatile写操作的前面插入一个StoreStore屏障
- 在每个volatile写操作的后面插入一个StoreLoad屏障
如图:StoreStore屏障可以保证在volatile写之前,其前面的所有普通写操作已经对任意处理器可见了。这是因为StoreStore屏障将保障上面所有的普通写操作在volatile写之前刷新到主内存。
volatile写后面的StoreLoad屏障的作用是避免volatile写与后面可能有的volatile读/写操作重排序。因为编译器常常无法准确判断在一个volatile写的后面是否需要插入一个StoreLoad屏障(对应的场景:一个volatile写之后方法立即返回结果了)。为了保证能正确实现volatile的内存语义,JMM采用了保守策略:要么在每个volatile写的后面,要么在每个volatile读的前面插入一个StoreLoad屏障。
从整体的执行效率的角度考虑,JMM最终选择了在每个volatile写的后面插入一个StoreLoad屏障。因为volatile读/写的内存语义的常用使用模式是:一个写线程写volatile变量,多个读线程读同一个volatile变量。当读线程的数量大大超过写线程时,选择在volatile写之后插入StoreLoad屏障将带来可观的执行效率的提升。此处可以看出JMM在实现上的一个特点:首先确保正确性,然后再去追求执行效率。
volatile读操作:
- 在每个volatile读操作的后面插入一个LoadLoad屏障
- 在每个volatile读操作的后面插入一个LoadStore屏障
上述内存屏障插入策略非常保守,但它可以保证在任意处理器平台、任意的程序中都能得到正确的volatile内存语义。
在实际执行时,只要不改变volatile读/写的内存语义,编译器可以根据具体情况省略不必要的屏障。
【🌰栗子】
class VolatileBarrierExample { |