51static FUNC_PREFIX void diffusivefluxkernelwithelectrostaticthermalized_single_precision_diffusivefluxkernelwithelectrostaticthermalized_single_precision(
float D,
float *
RESTRICT const _data_j,
float *
RESTRICT const _data_phi,
float *
RESTRICT const _data_rho,
int64_t const _size_j_0,
int64_t const _size_j_1,
int64_t const _size_j_2,
int64_t const _stride_j_0,
int64_t const _stride_j_1,
int64_t const _stride_j_2,
int64_t const _stride_j_3,
int64_t const _stride_phi_0,
int64_t const _stride_phi_1,
int64_t const _stride_phi_2,
int64_t const _stride_rho_0,
int64_t const _stride_rho_1,
int64_t const _stride_rho_2,
uint32_t block_offset_0,
uint32_t block_offset_1,
uint32_t block_offset_2,
float f_ext_0,
float f_ext_1,
float f_ext_2,
uint32_t field_size_0,
uint32_t field_size_1,
uint32_t field_size_2,
float kT,
uint32_t seed,
uint32_t time_step,
float z) {
81 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2] = D * (-f_ext_0 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]) + kT * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]) * 2.0f + z * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2]) * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2])) * 0.081462038946841925f * ((1.0f) / (kT)) + (
random_4_0 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.977416969040271f;
109 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + _stride_j_3] = D * (-f_ext_1 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) + kT * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) * 2.0f + z * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2]) * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2])) * 0.081462038946841925f * ((1.0f) / (kT)) + (
random_4_1 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.977416969040271f;
137 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 2 * _stride_j_3] = D * (f_ext_2 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]) + kT * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] - _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]) * 2.0f + z * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2]) * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2])) * -0.081462038946841925f * ((1.0f) / (kT)) + (
random_4_2 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.977416969040271f;
165 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 3 * _stride_j_3] = D * (f_ext_0 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) * -2.0f + f_ext_1 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) * -2.0f + kT * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) * 4.0f + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2] + _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2]) + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2])) * 0.028801180074297286f * ((1.0f) / (kT)) + (
random_4_3 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.6628028407278295f;
193 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 4 * _stride_j_3] = D * (f_ext_0 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2]) * -2.0f + f_ext_1 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2]) * 2.0f + kT * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2]) * 4.0f + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2]) * (-_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2] + _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2]) + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2])) * 0.028801180074297286f * ((1.0f) / (kT)) + (
random_5_0 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2]), 0.5f) * 1.6628028407278295f;
221 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 5 * _stride_j_3] = D * (f_ext_0 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 2.0f + f_ext_2 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 2.0f + kT * (-_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 4.0f + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] + _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2]) - z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2])) * -0.028801180074297286f * ((1.0f) / (kT)) + (
random_5_1 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]), 0.5f) * 1.6628028407278295f;
249 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 6 * _stride_j_3] = D * (f_ext_0 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * -2.0f + f_ext_2 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 2.0f + kT * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 4.0f + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * (-_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2]) + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2])) * 0.028801180074297286f * ((1.0f) / (kT)) + (
random_5_2 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]), 0.5f) * 1.6628028407278295f;
277 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 7 * _stride_j_3] = D * (f_ext_1 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 2.0f + f_ext_2 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 2.0f + kT * (-_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 4.0f + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2]) - z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2])) * -0.028801180074297286f * ((1.0f) / (kT)) + (
random_5_3 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]), 0.5f) * 1.6628028407278295f;
305 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 8 * _stride_j_3] = D * (f_ext_1 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * -2.0f + f_ext_2 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 2.0f + kT * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 4.0f + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * (-_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2]) + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2])) * 0.028801180074297286f * ((1.0f) / (kT)) + (
random_6_0 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]), 0.5f) * 1.6628028407278295f;
333 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 9 * _stride_j_3] = D * (-f_ext_0 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - f_ext_0 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] - f_ext_1 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - f_ext_1 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] - f_ext_2 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - f_ext_2 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + kT * -2.0f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + kT * 2.0f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + z * _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + z * _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] - z * _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - z * _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 0.04703213011469496f * ((1.0f) / (kT)) + (
random_6_1 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]), 0.5f) * 1.5025119784898082f;
361 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 10 * _stride_j_3] = D * (-f_ext_0 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - f_ext_0 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2] - f_ext_1 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - f_ext_1 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2] + f_ext_2 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + f_ext_2 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2] + kT * -2.0f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2] + kT * 2.0f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + z * _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + z * _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2] - z * _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - z * _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 - _stride_phi_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 0.04703213011469496f * ((1.0f) / (kT)) + (
random_6_2 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 - _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]), 0.5f) * 1.5025119784898082f;
389 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 11 * _stride_j_3] = D * (-f_ext_0 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - f_ext_0 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + f_ext_1 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + f_ext_1 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] - f_ext_2 * z * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - f_ext_2 * z * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + kT * -2.0f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] + kT * 2.0f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + z * _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + z * _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2] * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2] - z * _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - z * _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2 - _stride_phi_2] * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]) * 0.04703213011469496f * ((1.0f) / (kT)) + (
random_6_3 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 - _stride_rho_2]), 0.5f) * 1.5025119784898082f;
391 if (
ctr_1 < _size_j_1 - 1 &&
ctr_2 < _size_j_2 - 1) {
417 _data_j[_stride_j_0 *
ctr_0 + _stride_j_1 *
ctr_1 + _stride_j_2 *
ctr_2 + 12 * _stride_j_3] = D * (f_ext_0 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * -2.0f + f_ext_1 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 2.0f + f_ext_2 * z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 2.0f + kT * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] - _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * 4.0f + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * (-_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2]) - z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] + _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2]) + z * (_data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]) * (_data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2] + _data_phi[_stride_phi_0 *
ctr_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_1 + _stride_phi_2 *
ctr_2] - _data_phi[_stride_phi_0 *
ctr_0 - _stride_phi_0 + _stride_phi_1 *
ctr_1 + _stride_phi_2 *
ctr_2 + _stride_phi_2])) * 0.02351606505734748f * ((1.0f) / (kT)) + (
random_7_0 - 0.5f) *
powf(D * (0.5f * _data_rho[_stride_rho_0 *
ctr_0 + _stride_rho_1 *
ctr_1 + _stride_rho_2 *
ctr_2] + 0.5f * _data_rho[_stride_rho_0 *
ctr_0 - _stride_rho_0 + _stride_rho_1 *
ctr_1 + _stride_rho_1 + _stride_rho_2 *
ctr_2 + _stride_rho_2]), 0.5f) * 1.5025119784898082f;