ME>>См. цитату из intel reference.
По поводу этой цитаты еще вот что могу добавить:
Accesses to cacheable memory that are split across bus widths
Как я понимаю, типичным Access такого рода является инструкция add [mem],...
Она должна сачала прочитать ячейку памяти, потом произвести сложение, а потом её записать. Между чтением и записью другой процессор действительно может что-то натворить

.
Но вспомни с чего началась эта ветка. Человек предложил использовать переменную nbDoCalc. В том случае требуются только чтение и запись.