Disruptor 学习笔记
Disruptor 是什么
Disruptor 是一个高性能异步处理框架,也可以认为是一个消息框架,它实现了观察者模式。
Disruptor 比传统的基于锁的消息框架的优势在于:它是无锁的、CPU友好;它不会清除缓存中的数据,只会覆盖,降低了垃圾回收机制启动的频率。
Disruptor 为什么快
1. 不使用锁。通过内存屏障和原子性的CAS操作替换锁。
2. 缓存基于数组而不是链表,用位运算替代求模。缓存的长度总是2的n次方,这样可以用位运算 i & (length - 1) 替代 i % length。
3. 去除伪共享。CPU的缓存一般是以缓存行为最小单位的,对应主存的一块相应大小的单元;当前的缓存行大小一般是64字节,每个缓存行一次只能被一个CPU核访问,如果一个缓存行被多个CPU核访问,就会造成竞争,导致某个核必须等其他核处理完了才能继续处理,响应性能。去除伪共享就是确保CPU核访问某个缓存行时不会出现争用。
4.预分配缓存对象,通过更新缓存里对象的属性而不是删除对象来减少垃圾回收。
核心类和接口
EventHandler:用户提供具体的实现,在里面实现事件的处理逻辑。
Sequence:代表事件序号或一个指向缓存某个位置的序号。
WaitStrategy:功能包括:当没有可消费的事件时,根据特定的实现进行等待,有可消费事件时返回可事件序号;有新事件发布时通知等待的 SequenceBarrier。
Sequencer:生产者用于访问缓存的控制器,它持有消费者序号的引用;新事件发布后通过WaitStrategy 通知正在等待的SequenceBarrier。
SequenceBarrier:消费者关卡。消费者用于访问缓存的控制器,每个访问控制器还持有前置访问控制器的引用,用于维持正确的事件处理顺序;通过WaitStrategy获取可消费事件序号。
EventProcessor:事件处理器,是可执行单元,运行在指定的Executor里;它会不断地通过SequenceBarrier获取可消费事件,当有可消费事件时调用用户提供的 EventHandler实现处理事件。
EventTranslator:事件转换器,由于Disruptor只会覆盖缓存,需要通过此接口的实现来更新缓存里的事件来覆盖旧事件。
RingBuffer:基于数组的缓存实现,它内部持有对Executor、WaitStrategy、生产者和消费者访问控制器的引用。
Disruptor:提供了对 RingBuffer 的封装,并提供了一些DSL风格的方法,方便使用。
实现
Sequence 类
Sequence类表示一个序号,是对long型字段的线程安全的封装,用于跟踪ringBuffer的进度和事件处理器的进度。支持一些并发操作,包括CAS和有序写。尝试在volatile字段周围填充内容来避免伪共享,变得更高效。
public class Sequence { static final long INITIAL_VALUE = -1L; private static final Unsafe UNSAFE; private static final long VALUE_OFFSET; static { UNSAFE = Util.getUnsafe(); final int base = UNSAFE.arrayBaseOffset( long[].class ); final int scale = UNSAFE.arrayIndexScale( long[].class ); VALUE_OFFSET = base + (scale * 7); } // 15个元素,从0开始,有效值处于第7个,这样前后各有7个long字段填充, // 8个long型占共用64字节,而当前CPU的缓存行大小也是64字节,这样可以避免对Sequence的读写出现伪共享。 private final long [] paddedValue = new long [15]; // 原子地读 public long get() { return UNSAFE .getLongVolatile(paddedValue, VALUE_OFFSET); } // 原子地写 public void set(final long value) { UNSAFE.putOrderedLong(paddedValue , VALUE_OFFSET, value); } // CAS public boolean compareAndSet(final long expectedValue, final long newValue) { return UNSAFE .compareAndSwapLong(paddedValue, VALUE_OFFSET, expectedValue, newValue); } public long addAndGet(final long increment) { long currentValue; long newValue; do { currentValue = get(); newValue = currentValue + increment; } while (!compareAndSet(currentValue, newValue)); return newValue; }
Disruptor类
Disruptor类是这个类库的门面,用DSL的形式直观地提供了组装事件回调处理的关系链的功能,并提供获取事件、发布事件的方法,缓存容器生命周期管理。
属性
private final RingBuffer ringBuffer ; // 核心,绝大多数功能都委托给ringBuffer处理 private final Executor executor ; // 用于执行事件处理器的线程池 private final ConsumerRepository consumerRepository = new ConsumerRepository(); // 事件处理器仓库,就是事件处理器的集合 private final AtomicBoolean started = new AtomicBoolean( false); // 启动时检查,只能启动一次 private ExceptionHandler exceptionHandler; // 异常处理器
设置EventHandler事件处理器
/* * barrierSequences是eventHandlers的前置事件处理关卡,是用来保证事件处理的时序性的关键; * */ EventHandlerGroup createEventProcessors( final Sequence[] barrierSequences, final EventHandler[] eventHandlers) { checkNotStarted(); // 确保在容器启动前设置 final Sequence[] processorSequences = new Sequence[eventHandlers.length ]; // 存放游标的数组 final SequenceBarrier barrier = ringBuffer.newBarrier(barrierSequences); // 获取前置的序号关卡 for ( int i = 0, eventHandlersLength = eventHandlers.length; i < eventHandlersLength; i++) { final EventHandler eventHandler = eventHandlers[i]; // 封装为批量事件处理器BatchEventProcessor,其实现了Runnable接口,所以可以放到executor去执行处理逻辑;处理器还会自动建立一个序号Sequence。 final BatchEventProcessor batchEventProcessor = new BatchEventProcessor(ringBuffer , barrier, eventHandler); if (exceptionHandler != null) { // 如果有则设置异常处理器 batchEventProcessor.setExceptionHandler( exceptionHandler); } // 添加到消费者仓库,会先封装为EventProcessorInfo对象(表示事件处理的一个阶段), consumerRepository.add(batchEventProcessor, eventHandler, barrier); processorSequences[i] = batchEventProcessor.getSequence(); } if (processorSequences. length > 0) {// 如果有前置关卡,则取消之前的前置关卡对应的EventProcessor 的 链的终点标记。 consumerRepository.unMarkEventProcessorsAsEndOfChain(barrierSequences); } // EventHandlerGroup是一组EventProcessor,作为disruptor的一部分,提供DSL形式的方法,作为方法链的起点,用于设置事件处理器。 return new EventHandlerGroup(this, consumerRepository, processorSequences); } }
RingBuffer 类
// 属性的初始化声明 public static final long INITIAL_CURSOR_VALUE = Sequence.INITIAL_VALUE ; private final int indexMask ; private final Object[] entries ; private final int bufferSize ; private final Sequencer sequencer ; // 属性的初始化代码 RingBuffer(EventFactory eventFactory, Sequencer sequencer) { this.sequencer = sequencer; this.bufferSize = sequencer.getBufferSize(); if (bufferSize < 1) { throw new IllegalArgumentException("bufferSize must not be less than 1"); } if (Integer.bitCount( bufferSize) != 1) { throw new IllegalArgumentException("bufferSize must be a power of 2"); } this.indexMask = bufferSize - 1; this.entries = new Object[sequencer.getBufferSize()]; fill(eventFactory); }
从以上这些代码可以看出:
RingBuffer是基于数组构建的,因为数组是缓存友好的,相邻的元素一般处于同一个缓存块。
缓存的大小必须是2的X次方,这是为了用位运算提高性能;由于数组缓存的容量总是有限,当缓存填满后,又要从 下标0 开始填充,如果缓存大小不是2的X次方,那只能用求模运算来获得新下标,所以还有个indexMask 来保存下标掩码;通过与indexMask 进行按位与可以得到一个安全的下标,不再需要进行下标检查,如:(E)entries[( int)sequence & indexMask ]。
从缓存获取事件
// 从缓存获取指定序号的事件 public E get(long sequence) { // 这个按位与操作说明了为什么ringBuffer的大小必须是2的n次方:用高效的 按位与 代替 低效的求模操作。 return (E) entries[(int ) sequence & indexMask]; } }
发布事件
发布事件有3步:获取新事件的序号,覆盖旧事件,通知等待着。最简单的发布事件形式:
public void publishEvent(EventTranslator translator) { final long sequence = sequencer .next(); // 通过生产者序号控制器获取可用序号 translateAndPublish(translator, sequence); // 转换事件到队列缓存并发布事件 } } private void translateAndPublish(EventTranslator translator, long sequence) { try { // 发布事件前要先获取对应位置上的旧事件,再用translator把新事件的属性转换到旧事件的属性,从而达到发布的目的。 // 这就是说,Disruptor对于已消费的事件是不删除的,有新事件时只是用新事件的属性去替换旧事件的属性。 // 这带来的一个问题就是内存占用 translator.translateTo(get(sequence), sequence); } finally { sequencer.publish(sequence); // 原子性地更新生产者的序号,并通知在等待的消费者关卡。 } } }
生产者序号控制器与消费者关卡是共用同一个等待策略的,一个Disruptor容器只有一个等待策略实例。
EventProcessor
事件处理器的执行单元。有两个实现:NoOpEventProcessor 和 BatchEventProcessor,其中NoOpEventProcessor 是不处理事件的,就不关注了。
BatchEventProcessor
Disruptor提供的唯一有用的 EventProcessor 实现类。
Disruptor容器启动时,会调用 ConsumerInfo 的 start方法,如果 ConsumerInfo 封装的是用户提交的EventHandler 实例,那么会在线程池里运行 EventProcessor,也就是 BatchEventProcessor 实例的 run方法。
public void run() { // 确保一次只有一个线程执行此方法,这样访问自身的序号就不要加锁 if (! running.compareAndSet(false, true)) { throw new IllegalStateException("Thread is already running"); } sequenceBarrier.clearAlert(); // 清除前置序号关卡的通知状态 notifyStart(); // 声明周期通知,开始前回调 T event = null; long nextSequence = sequence.get() + 1L; // sequence指向上一个已处理的事件,默认是-1 try { while (true ) { try { // 从它的前置序号关卡获取下一个可处理的事件序号。 // 如果这个事件处理器不依赖于其他的事件处理器,则前置关卡就是生产者序号; // 如果这个事件处理器依赖于1个或多个事件处理器,那么这个前置关卡就是这些前置事件处理器中最慢的一个。 // 通过这样,可以确保事件处理器不会超前处理地事件。 final long availableSequence = sequenceBarrier.waitFor(nextSequence); // 处理一批事件 while (nextSequence <= availableSequence) { event = dataProvider.get(nextSequence); eventHandler.onEvent(event, nextSequence, nextSequence == availableSequence); nextSequence++; } // 设置它自己最后处理的事件序号,这样依赖于它的处理器可以它处理刚处理过的事件。 sequence.set(availableSequence); } catch (final TimeoutException e) { // 获取事件序号超时处理 notifyTimeout( sequence.get()); } catch (final AlertException ex) { // 处理通知事件;检测是否要停止,如果非则继续处理事件 if (!running .get()) { break; } } catch (final Throwable ex) { // 其他异常,用事件处理器处理;然后继续处理下一个事件 exceptionHandler.handleEventException(ex, nextSequence, event); sequence.set(nextSequence); nextSequence++; } } } finally { // 声明周期通知,停止事件回调;复位运行状态标志,确保可以再次运行此方法。 notifyShutdown(); running.set(false ); } } }
从 while 循环可以看出,事件处理可以分为三步:
从 SequenceBarrier 获取获取可以处理的最大事件序号;
循环处理可处理事件;
更新自身的已处理的事件序号,让依赖自身的事件处理器可以继续处理。
sequence .set 和 sequence .get 方法都是原子性地读取、更新序号的,这样就避免了加锁,从而提供性能。
sequenceBarrier .waitFor 最终也会调用 sequence .get 方法。
SequenceBarrier
协作式关卡,用于跟踪生产者游标和依赖的事件处理器的序号的数据结构。有两个实现DummySequenceBarrier 和 ProcessingSequenceBarrier,类如其名,前者是虚拟的,只有空方法;后者是实用的。
SequenceBarrier接口定义
public interface SequenceBarrier { // 等待指定的序号变得可消费 long waitFor(long sequence) throws AlertException, InterruptedException, TimeoutException; // 返回当前可读的游标(一个序号) long getCursor(); // 当前是否有通知状态给此关卡 boolean isAlerted(); // 通知事件处理器状态发生改变,并保持这个状态直到被清除 void alert(); // 清除当前通知状态 void clearAlert(); // 检查通知状态,如果有异常则抛出 void checkAlert() throws AlertException; }
ProcessingSequenceBarrier
生成ProcessingSequenceBarrier的实例是由框架控制的,首先在Disruptor类的createEventProcessors方法内:
final SequenceBarrier barrier = ringBuffer.newBarrier(barrierSequences); ... // RingBufferd 的newBarrier方法: public SequenceBarrier newBarrier(Sequence... sequencesToTrack) { return sequencer.newBarrier(sequencesToTrack); // 是通过生产者序号控制器生成的。 } ... // AbstractSequencer的newBarrier方法。 public SequenceBarrier newBarrier(Sequence... sequencesToTrack) { return new ProcessingSequenceBarrier(this, waitStrategy, cursor, sequencesToTrack); } ... /** * @param sequencer 生产者序号控制器 * @param waitStrategy 等待策略 * @param cursorSequence 生产者序号 * @param dependentSequences 依赖的Sequence */ p public ProcessingSequenceBarrier(final Sequencer sequencer, final WaitStrategy waitStrategy, final Sequence cursorSequence, final Sequence[] dependentSequences) { this. sequencer = sequencer; this. waitStrategy = waitStrategy; this. cursorSequence = cursorSequence; // 如果事件处理器不依赖于任何前置处理器,那么dependentSequence也指向生产者的序号。 if (0 == dependentSequences. length) { dependentSequence = cursorSequence; } else { // 如果有多个前置处理器,则对其进行封装,实现了组合模式。 dependentSequence = new FixedSequenceGroup(dependentSequences); } }
获取序号的方法
/** * 该方法不保证总是返回未处理的序号;如果有更多的可处理序号时,返回的序号也可能是超过指定序号的。 */ public long waitFor(final long sequence) throws AlertException, InterruptedException, TimeoutException { // 首先检查有无通知 checkAlert(); // 通过等待策略来获取可处理事件序号, long availableSequence = waitStrategy.waitFor(sequence, cursorSequence, dependentSequence , this); // 这个方法不保证总是返回可处理的序号 return availableSequence; if (availableSequence < sequence) { } // 再通过生产者序号控制器返回最大的可处理序号 return sequencer.getHighestPublishedSequence(sequence, availableSequence); } }
WaitStrategy:
BlockingWaitStrategy:没有可消费事件时阻塞等待生产者唤醒。
BusySpinWaitStrategy:忙等策略。
TimeoutBlockingWaitStrategy:阻塞等待策略
YieldingWaitStrategy:通过调用Thread.yield方法来让出CPU,达到等待的目的,等待时长没保证,取决于线程的调度系统。
已有 0 人发表留言,猛击->> 这里<<-参与讨论
ITeye推荐