Re[2]: Оптимизация доступа к массиву значений в CUDA
От: mossad_re  
Дата: 21.11.17 08:30
Оценка:
Здравствуйте, Nikе, Вы писали:

N>Здравствуйте, mossad_re, Вы писали:


_>>Доброго времени суток.

_>>У меня следующий вопрос:
_>>Есть двумерный массив перестановок:
_>>__device__ int ArrayDev[8][64] = {{.....}};

_>>И в теле каждого потока я обращаюсь к его элементам.

_>>int A = AnyFactor;
_>>int B = OtherFactor;
_>>int C = ArrayDev[A][B];
_>>......

_>>Вопрос, как можно оптимизировать такой доступ? Именно он отнимает много времени.

_>>Массив ArrayDev определён глобально.

N>Ну массив маленький, запихнуть его в память блока?



Ну не такой уж и маленький.
У меня 2048 блоков. А shared всего 49 кб.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.