51static FUNC_PREFIX void diffusivefluxkernelthermalized_single_precision_diffusivefluxkernelthermalized_single_precision(
float D,
float *
RESTRICT const _data_j,
float *
RESTRICT const _data_rho,
int64_t const _size_j_0,
int64_t const _size_j_1,
int64_t const _size_j_2,
int64_t const _stride_j_0,
int64_t const _stride_j_1,
int64_t const _stride_j_2,
int64_t const _stride_j_3,
int64_t const _stride_rho_0,
int64_t const _stride_rho_1,
int64_t const _stride_rho_2,
uint32_t block_offset_0,
uint32_t block_offset_1,
uint32_t block_offset_2,
uint32_t field_size_0,
uint32_t field_size_1,
uint32_t field_size_2,
uint32_t seed,
uint32_t time_step) {
81 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]) * 0.16292407789368385f + (
random_0_0 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.977416969040271f;
109 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) * 0.16292407789368385f + (
random_0_1 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.977416969040271f;
137 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 2 * _stride_j_3] = D * (-_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]) * 0.16292407789368385f + (
random_0_2 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.977416969040271f;
165 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 3 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) * 0.11520472029718914f + (
random_0_3 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.6628028407278295f;
193 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 4 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2]) * 0.11520472029718914f + (
random_1_0 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.6628028407278295f;
221 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 5 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 0.11520472029718914f + (
random_1_1 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]), 0.5f) * 1.6628028407278295f;
249 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 6 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 0.11520472029718914f + (
random_1_2 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]), 0.5f) * 1.6628028407278295f;
277 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 7 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 0.11520472029718914f + (
random_1_3 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]), 0.5f) * 1.6628028407278295f;
305 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 8 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 0.11520472029718914f + (
random_2_0 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]), 0.5f) * 1.6628028407278295f;
333 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 9 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 0.09406426022938992f + (
random_2_1 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]), 0.5f) * 1.5025119784898082f;
361 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 10 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 0.09406426022938992f + (
random_2_2 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]), 0.5f) * 1.5025119784898082f;
389 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 11 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 0.09406426022938992f + (
random_2_3 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]), 0.5f) * 1.5025119784898082f;
391 if (
ctr_1 < _size_j_1 - 1 &&
ctr_2 < _size_j_2 - 1) {
417 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 12 * _stride_j_3] = D * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 0.09406426022938992f + (
random_3_0 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]), 0.5f) * 1.5025119784898082f;