53static FUNC_PREFIX void streamcollidesweepthermalizeddoubleprecisionavx_streamcollidesweepthermalizeddoubleprecisionavx(
double *
RESTRICT const _data_force,
double *
RESTRICT const _data_pdfs,
double *
RESTRICT _data_pdfs_tmp,
int64_t const _size_force_0,
int64_t const _size_force_1,
int64_t const _size_force_2,
int64_t const _stride_force_1,
int64_t const _stride_force_2,
int64_t const _stride_force_3,
int64_t const _stride_pdfs_1,
int64_t const _stride_pdfs_2,
int64_t const _stride_pdfs_3,
int64_t const _stride_pdfs_tmp_1,
int64_t const _stride_pdfs_tmp_2,
int64_t const _stride_pdfs_tmp_3,
uint32_t block_offset_0,
uint32_t block_offset_1,
uint32_t block_offset_2,
double kT,
double omega_bulk,
double omega_even,
double omega_odd,
double omega_shear,
uint32_t seed,
uint32_t time_step) {
58 const double xi_20 = omega_bulk * 0.5;
59 const double xi_47 = omega_shear * 0.041666666666666664;
60 const double xi_51 = omega_bulk * 0.041666666666666664;
61 const double xi_62 = omega_shear * 0.125;
62 const double xi_97 = 3.7416573867739413;
63 const double xi_100 = 5.4772255750516612;
64 const double xi_104 = 2.4494897427831779;
65 const double xi_107 = 8.3666002653407556;
66 const double xi_150 = omega_odd * 0.25;
67 const double xi_160 = omega_odd * 0.083333333333333329;
68 const double xi_173 = 1.7320508075688772;
69 const double xi_217 = omega_shear * 0.25;
70 const double xi_223 = omega_odd * 0.041666666666666664;
71 const double xi_226 = omega_odd * 0.125;
72 const double rr_0 = 0.0;
73 const double xi_45 =
rr_0 * 0.041666666666666664;
75#pragma omp for schedule(static)
85 philox_double2(time_step,
_mm256_add_epi32(
_mm256_add_epi32(
_mm256_set_epi32(7, 6, 5, 4, 3, 2, 1, 0),
_mm256_set_epi32(
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0)),
_mm256_set_epi32(((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)))), block_offset_1 +
ctr_1, block_offset_2 +
ctr_2, 7, seed,
random_7_0,
random_7_1);
91 philox_double2(time_step,
_mm256_add_epi32(
_mm256_add_epi32(
_mm256_set_epi32(7, 6, 5, 4, 3, 2, 1, 0),
_mm256_set_epi32(
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0)),
_mm256_set_epi32(((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)))), block_offset_1 +
ctr_1, block_offset_2 +
ctr_2, 6, seed,
random_6_0,
random_6_1);
97 philox_double2(time_step,
_mm256_add_epi32(
_mm256_add_epi32(
_mm256_set_epi32(7, 6, 5, 4, 3, 2, 1, 0),
_mm256_set_epi32(
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0)),
_mm256_set_epi32(((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)))), block_offset_1 +
ctr_1, block_offset_2 +
ctr_2, 5, seed,
random_5_0,
random_5_1);
103 philox_double2(time_step,
_mm256_add_epi32(
_mm256_add_epi32(
_mm256_set_epi32(7, 6, 5, 4, 3, 2, 1, 0),
_mm256_set_epi32(
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0)),
_mm256_set_epi32(((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)))), block_offset_1 +
ctr_1, block_offset_2 +
ctr_2, 4, seed,
random_4_0,
random_4_1);
109 philox_double2(time_step,
_mm256_add_epi32(
_mm256_add_epi32(
_mm256_set_epi32(7, 6, 5, 4, 3, 2, 1, 0),
_mm256_set_epi32(
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0)),
_mm256_set_epi32(((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)))), block_offset_1 +
ctr_1, block_offset_2 +
ctr_2, 3, seed,
random_3_0,
random_3_1);
115 philox_double2(time_step,
_mm256_add_epi32(
_mm256_add_epi32(
_mm256_set_epi32(7, 6, 5, 4, 3, 2, 1, 0),
_mm256_set_epi32(
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0)),
_mm256_set_epi32(((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)))), block_offset_1 +
ctr_1, block_offset_2 +
ctr_2, 2, seed,
random_2_0,
random_2_1);
121 philox_double2(time_step,
_mm256_add_epi32(
_mm256_add_epi32(
_mm256_set_epi32(7, 6, 5, 4, 3, 2, 1, 0),
_mm256_set_epi32(
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0)),
_mm256_set_epi32(((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)))), block_offset_1 +
ctr_1, block_offset_2 +
ctr_2, 1, seed,
random_1_0,
random_1_1);
127 philox_double2(time_step,
_mm256_add_epi32(
_mm256_add_epi32(
_mm256_set_epi32(7, 6, 5, 4, 3, 2, 1, 0),
_mm256_set_epi32(
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0,
ctr_0)),
_mm256_set_epi32(((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)), ((
int64_t)(block_offset_0)))), block_offset_1 +
ctr_1, block_offset_2 +
ctr_2, 0, seed,
random_0_0,
random_0_1);
157 const __m256d xi_121 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0])),
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(5.0, 5.0, 5.0, 5.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 3 * _stride_pdfs_3 +
ctr_0 + 1]))),
_mm256_mul_pd(
_mm256_set_pd(5.0, 5.0, 5.0, 5.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 4 * _stride_pdfs_3 +
ctr_0 - 1])));
177 const __m256d xi_159 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 9 * _stride_pdfs_3 +
ctr_0 + 1])),
_mm256_mul_pd(
xi_157,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_148),
xi_155),
xi_156),
xi_158),
xi_5);
186 const __m256d xi_190 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 9 * _stride_pdfs_3 +
ctr_0 + 1])),
_mm256_mul_pd(
xi_157,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_158,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_186,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_189,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_7,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
190 const __m256d xi_199 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_139,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_198,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0])));
192 const __m256d xi_201 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_124,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_125,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_126),
xi_140),
xi_198),
xi_6);
213 const __m256d xi_96 =
_mm256_sqrt_pd(
_mm256_mul_pd(
xi_95,
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_mul_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_set_pd(omega_even, omega_even, omega_even, omega_even)),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0)),
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_set_pd(omega_even, omega_even, omega_even, omega_even)),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0)))),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0))));
216 const __m256d xi_105 =
_mm256_sqrt_pd(
_mm256_mul_pd(
xi_95,
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_mul_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_set_pd(omega_bulk, omega_bulk, omega_bulk, omega_bulk)),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0)),
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_set_pd(omega_bulk, omega_bulk, omega_bulk, omega_bulk)),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0)))),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0))));
220 const __m256d xi_134 =
_mm256_sqrt_pd(
_mm256_mul_pd(
xi_95,
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_mul_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear)),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0)),
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear)),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0)))),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0))));
223 const __m256d xi_152 =
_mm256_sqrt_pd(
_mm256_mul_pd(
xi_95,
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_mul_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_set_pd(omega_odd, omega_odd, omega_odd, omega_odd)),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0)),
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_set_pd(omega_odd, omega_odd, omega_odd, omega_odd)),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0)))),
_mm256_set_pd(1.0, 1.0, 1.0, 1.0))));
253 const __m256d xi_237 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_233,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_235,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_234),
xi_236);
256 const __m256d xi_244 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_234,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_236,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_233),
xi_235);
262 const __m256d xi_258 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_254,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_256,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_255),
xi_257);
263 const __m256d xi_260 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_255,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_257,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_254),
xi_256);
266 const __m256d u_0 =
_mm256_add_pd(
_mm256_mul_pd(
xi_0,
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_11,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_8,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
vel0Term)),
_mm256_mul_pd(
xi_10,
_mm256_load_pd(&
_data_force[_stride_force_1 *
ctr_1 + _stride_force_2 *
ctr_2 +
ctr_0])));
283 const __m256d u_1 =
_mm256_add_pd(
_mm256_mul_pd(
xi_0,
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_12,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_13,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_9,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
vel1Term)),
_mm256_mul_pd(
xi_10,
_mm256_loadu_pd(&
_data_force[_stride_force_1 *
ctr_1 + _stride_force_2 *
ctr_2 + _stride_force_3 +
ctr_0])));
294 const __m256d xi_67 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_64,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_66,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_59),
xi_61);
295 const __m256d xi_69 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_59,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_61,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_64),
xi_66);
301 const __m256d xi_218 =
_mm256_mul_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 9 * _stride_pdfs_3 +
ctr_0 + 1])),
_mm256_mul_pd(
u_0,
xi_216)),
xi_12),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 7 * _stride_pdfs_3 +
ctr_0 + 1])),
_mm256_set_pd(
xi_217,
xi_217,
xi_217,
xi_217));
304 const __m256d u_2 =
_mm256_add_pd(
_mm256_mul_pd(
xi_0,
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_14,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_15,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_16,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 18 * _stride_pdfs_3 +
ctr_0 - 1]))),
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0]))),
vel2Term)),
_mm256_mul_pd(
xi_10,
_mm256_loadu_pd(&
_data_force[_stride_force_1 *
ctr_1 + _stride_force_2 *
ctr_2 + 2 * _stride_force_3 +
ctr_0])));
309 const __m256d xi_32 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_18,
_mm256_set_pd(0.33333333333333331, 0.33333333333333331, 0.33333333333333331, 0.33333333333333331)),
_mm256_mul_pd(
xi_27,
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear))),
_mm256_mul_pd(
_mm256_mul_pd(
xi_26,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear))),
xi_25),
xi_31);
311 const __m256d xi_38 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_28,
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear)),
_mm256_mul_pd(
_mm256_mul_pd(
u_0,
_mm256_set_pd(-0.33333333333333331, -0.33333333333333331, -0.33333333333333331, -0.33333333333333331)),
_mm256_load_pd(&
_data_force[_stride_force_1 *
ctr_1 + _stride_force_2 *
ctr_2 +
ctr_0]))),
xi_24),
xi_26),
xi_36),
xi_37);
312 const __m256d xi_44 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_19,
_mm256_set_pd(0.33333333333333331, 0.33333333333333331, 0.33333333333333331, 0.33333333333333331)),
_mm256_mul_pd(
xi_43,
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear))),
_mm256_mul_pd(
_mm256_mul_pd(
xi_24,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear))),
xi_31),
xi_42);
324 const __m256d xi_81 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_77,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_78,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_79),
xi_80);
326 const __m256d xi_83 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_79,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_80,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_77),
xi_78);
331 const __m256d xi_91 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_89,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_90,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_86),
xi_88);
332 const __m256d xi_92 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_86,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_88,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_89),
xi_90);
336 const __m256d xi_114 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(3.0, 3.0, 3.0, 3.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 5 * _stride_pdfs_3 +
ctr_0])),
_mm256_mul_pd(
_mm256_set_pd(3.0, 3.0, 3.0, 3.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
xi_113,
_mm256_set_pd(0.66666666666666663, 0.66666666666666663, 0.66666666666666663, 0.66666666666666663))),
xi_112);
337 const __m256d xi_115 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(3.0, 3.0, 3.0, 3.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0])),
_mm256_mul_pd(
_mm256_set_pd(3.0, 3.0, 3.0, 3.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
xi_110,
_mm256_set_pd(0.66666666666666663, 0.66666666666666663, 0.66666666666666663, 0.66666666666666663))),
_mm256_mul_pd(
_mm256_set_pd(-3.0, -3.0, -3.0, -3.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-3.0, -3.0, -3.0, -3.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-3.0, -3.0, -3.0, -3.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-3.0, -3.0, -3.0, -3.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_mul_pd(
rho,
xi_111),
_mm256_set_pd(1.6666666666666667, 1.6666666666666667, 1.6666666666666667, 1.6666666666666667))),
xi_114);
339 const __m256d xi_119 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_112,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_117,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_118,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_13,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_16,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_5,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
rho,
xi_111)),
xi_113);
341 const __m256d xi_122 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_110,
_mm256_set_pd(2.3333333333333335, 2.3333333333333335, 2.3333333333333335, 2.3333333333333335)),
_mm256_mul_pd(
_mm256_set_pd(-2.0, -2.0, -2.0, -2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-2.0, -2.0, -2.0, -2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-5.0, -5.0, -5.0, -5.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 13 * _stride_pdfs_3 +
ctr_0 + 1]))),
_mm256_mul_pd(
_mm256_set_pd(-5.0, -5.0, -5.0, -5.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1]))),
_mm256_mul_pd(
_mm256_set_pd(-5.0, -5.0, -5.0, -5.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 14 * _stride_pdfs_3 +
ctr_0 - 1]))),
_mm256_mul_pd(
_mm256_set_pd(-5.0, -5.0, -5.0, -5.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 18 * _stride_pdfs_3 +
ctr_0 - 1]))),
xi_114),
xi_121);
343 const __m256d xi_127 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_113,
_mm256_set_pd(3.0, 3.0, 3.0, 3.0)),
_mm256_mul_pd(
_mm256_set_pd(5.0, 5.0, 5.0, 5.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(5.0, 5.0, 5.0, 5.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-4.0, -4.0, -4.0, -4.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 5 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-4.0, -4.0, -4.0, -4.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(-7.0, -7.0, -7.0, -7.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 7 * _stride_pdfs_3 +
ctr_0 + 1]))),
_mm256_mul_pd(
_mm256_set_pd(-7.0, -7.0, -7.0, -7.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 9 * _stride_pdfs_3 +
ctr_0 + 1]))),
_mm256_mul_pd(
_mm256_set_pd(-7.0, -7.0, -7.0, -7.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 8 * _stride_pdfs_3 +
ctr_0 - 1]))),
_mm256_mul_pd(
_mm256_set_pd(-7.0, -7.0, -7.0, -7.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 10 * _stride_pdfs_3 +
ctr_0 - 1]))),
xi_112),
xi_121),
xi_124),
xi_125),
xi_126);
348 const __m256d xi_142 =
_mm256_mul_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_117,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_137,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_138,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_141,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_15,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_2,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_4,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0]))),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 13 * _stride_pdfs_3 +
ctr_0 + 1])),
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear));
352 const __m256d xi_170 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0])),
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
_mm256_set_pd(2.0, 2.0, 2.0, 2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0]))),
_mm256_mul_pd(
xi_110,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_118,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_129,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_141,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_147,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1]))),
_mm256_mul_pd(
_mm256_set_pd(-2.0, -2.0, -2.0, -2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 3 * _stride_pdfs_3 +
ctr_0 + 1]))),
_mm256_mul_pd(
_mm256_set_pd(-2.0, -2.0, -2.0, -2.0),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 4 * _stride_pdfs_3 +
ctr_0 - 1]))),
_mm256_mul_pd(
_mm256_mul_pd(
rho,
xi_111),
_mm256_set_pd(2.0, 2.0, 2.0, 2.0)));
360 const __m256d xi_182 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_168,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_169,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_181);
366 const __m256d xi_212 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_171,
_mm256_set_pd(0.020833333333333332, 0.020833333333333332, 0.020833333333333332, 0.020833333333333332)),
_mm256_mul_pd(
xi_175,
_mm256_set_pd(0.083333333333333329, 0.083333333333333329, 0.083333333333333329, 0.083333333333333329))),
xi_211);
368 const __m256d xi_221 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_161,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_165,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_207),
xi_208),
xi_209),
xi_210),
xi_212);
370 const __m256d xi_232 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_224,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_229,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_222),
xi_225),
xi_227),
xi_231);
374 const __m256d xi_243 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_116,
_mm256_set_pd(0.025000000000000001, 0.025000000000000001, 0.025000000000000001, 0.025000000000000001)),
_mm256_mul_pd(
xi_102,
_mm256_set_pd(0.050000000000000003, 0.050000000000000003, 0.050000000000000003, 0.050000000000000003))),
_mm256_mul_pd(
xi_238,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_239,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_181),
xi_211),
xi_242);
375 const __m256d xi_245 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
_mm256_mul_pd(
xi_115,
_mm256_set_pd(-0.025000000000000001, -0.025000000000000001, -0.025000000000000001, -0.025000000000000001)),
_mm256_set_pd(omega_even, omega_even, omega_even, omega_even)),
_mm256_mul_pd(
_mm256_mul_pd(
xi_119,
_mm256_set_pd(-0.041666666666666664, -0.041666666666666664, -0.041666666666666664, -0.041666666666666664)),
_mm256_set_pd(omega_bulk, omega_bulk, omega_bulk, omega_bulk))),
_mm256_mul_pd(
_mm256_mul_pd(
_mm256_mul_pd(
xi_101,
xi_96),
_mm256_set_pd(-0.050000000000000003, -0.050000000000000003, -0.050000000000000003, -0.050000000000000003)),
_mm256_set_pd(
xi_100,
xi_100,
xi_100,
xi_100))),
_mm256_mul_pd(
_mm256_mul_pd(
_mm256_mul_pd(
xi_103,
xi_105),
_mm256_set_pd(-0.083333333333333329, -0.083333333333333329, -0.083333333333333329, -0.083333333333333329)),
_mm256_set_pd(
xi_104,
xi_104,
xi_104,
xi_104))),
xi_177),
xi_238),
xi_239),
xi_240),
xi_241);
382 const __m256d xi_261 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_227,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_231,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_222),
xi_224),
xi_225),
xi_229);
383 const __m256d xi_262 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_202,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_204,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_212),
xi_242),
xi_246),
xi_247),
xi_248),
xi_249);
384 const __m256d forceTerm_0 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_17,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_18,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_19,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_17,
_mm256_set_pd(
xi_20,
xi_20,
xi_20,
xi_20))),
_mm256_mul_pd(
xi_18,
_mm256_set_pd(
xi_20,
xi_20,
xi_20,
xi_20))),
_mm256_mul_pd(
xi_19,
_mm256_set_pd(
xi_20,
xi_20,
xi_20,
xi_20)));
387 const __m256d forceTerm_3 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_33,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_38,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_35);
388 const __m256d forceTerm_4 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_35,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_38,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
xi_33);
391 const __m256d forceTerm_7 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_49,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_57,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_67,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
392 const __m256d forceTerm_8 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_57,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_68,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_69,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
393 const __m256d forceTerm_9 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_49,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_69,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_71,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
394 const __m256d forceTerm_10 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_67,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_68,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_71,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
395 const __m256d forceTerm_11 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_74,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_76,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_81,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
396 const __m256d forceTerm_12 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_74,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_82,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_83,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
397 const __m256d forceTerm_13 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_49,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_84,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_91,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
398 const __m256d forceTerm_14 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_68,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_84,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_92,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
399 const __m256d forceTerm_15 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_76,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_83,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_93,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
400 const __m256d forceTerm_16 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_81,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_82,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_93,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
401 const __m256d forceTerm_17 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_49,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_92,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_94,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
402 const __m256d forceTerm_18 =
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_68,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_91,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_94,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)));
403 _mm256_store_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_128,
_mm256_set_pd(0.023809523809523808, 0.023809523809523808, 0.023809523809523808, 0.023809523809523808)),
_mm256_mul_pd(
xi_99,
_mm256_set_pd(0.14285714285714285, 0.14285714285714285, 0.14285714285714285, 0.14285714285714285))),
_mm256_mul_pd(
xi_123,
_mm256_set_pd(0.042857142857142858, 0.042857142857142858, 0.042857142857142858, 0.042857142857142858))),
_mm256_mul_pd(
xi_109,
_mm256_set_pd(0.085714285714285715, 0.085714285714285715, 0.085714285714285715, 0.085714285714285715))),
_mm256_mul_pd(
xi_116,
_mm256_set_pd(0.10000000000000001, 0.10000000000000001, 0.10000000000000001, 0.10000000000000001))),
_mm256_mul_pd(
xi_102,
_mm256_set_pd(0.20000000000000001, 0.20000000000000001, 0.20000000000000001, 0.20000000000000001))),
_mm256_mul_pd(
xi_120,
_mm256_set_pd(-0.5, -0.5, -0.5, -0.5))),
_mm256_mul_pd(
xi_106,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
forceTerm_0),
_mm256_load_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 +
ctr_0])));
404 _mm256_storeu_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 + _stride_pdfs_tmp_3 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_129,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_132,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_144,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_167,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_178,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
_mm256_mul_pd(
xi_122,
_mm256_set_pd(0.014285714285714285, 0.014285714285714285, 0.014285714285714285, 0.014285714285714285)),
_mm256_set_pd(omega_even, omega_even, omega_even, omega_even))),
_mm256_mul_pd(
_mm256_mul_pd(
_mm256_mul_pd(
xi_108,
xi_96),
_mm256_set_pd(0.028571428571428571, 0.028571428571428571, 0.028571428571428571, 0.028571428571428571)),
_mm256_set_pd(
xi_107,
xi_107,
xi_107,
xi_107))),
forceTerm_1));
405 _mm256_storeu_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 + 2 * _stride_pdfs_tmp_3 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_123,
_mm256_set_pd(0.014285714285714285, 0.014285714285714285, 0.014285714285714285, 0.014285714285714285)),
_mm256_mul_pd(
xi_109,
_mm256_set_pd(0.028571428571428571, 0.028571428571428571, 0.028571428571428571, 0.028571428571428571))),
forceTerm_2),
xi_167),
xi_179),
xi_180),
xi_182),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0])));
406 _mm256_storeu_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 + 3 * _stride_pdfs_tmp_3 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_171,
_mm256_set_pd(0.083333333333333329, 0.083333333333333329, 0.083333333333333329, 0.083333333333333329)),
_mm256_mul_pd(
xi_175,
_mm256_set_pd(0.33333333333333331, 0.33333333333333331, 0.33333333333333331, 0.33333333333333331))),
_mm256_mul_pd(
xi_183,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_184,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
forceTerm_3),
xi_179),
xi_195),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 3 * _stride_pdfs_3 +
ctr_0 + 1])));
407 _mm256_store_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 + 4 * _stride_pdfs_tmp_3 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_132,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_183,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_184,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_189,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_195,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
_mm256_mul_pd(
xi_170,
_mm256_set_pd(0.083333333333333329, 0.083333333333333329, 0.083333333333333329, 0.083333333333333329)),
_mm256_set_pd(omega_shear, omega_shear, omega_shear, omega_shear))),
_mm256_mul_pd(
_mm256_mul_pd(
_mm256_mul_pd(
xi_134,
xi_174),
_mm256_set_pd(0.33333333333333331, 0.33333333333333331, 0.33333333333333331, 0.33333333333333331)),
_mm256_set_pd(
xi_173,
xi_173,
xi_173,
xi_173))),
forceTerm_4));
408 _mm256_storeu_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 + 5 * _stride_pdfs_tmp_3 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_139,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_178,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_180,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_196,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_197,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_206,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
_mm256_mul_pd(
xi_127,
_mm256_set_pd(0.015873015873015872, 0.015873015873015872, 0.015873015873015872, 0.015873015873015872)),
_mm256_set_pd(omega_even, omega_even, omega_even, omega_even))),
_mm256_mul_pd(
_mm256_mul_pd(
_mm256_mul_pd(
xi_96,
xi_98),
_mm256_set_pd(0.095238095238095233, 0.095238095238095233, 0.095238095238095233, 0.095238095238095233)),
_mm256_set_pd(
xi_97,
xi_97,
xi_97,
xi_97))),
forceTerm_5));
409 _mm256_storeu_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 + 6 * _stride_pdfs_tmp_3 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_128,
_mm256_set_pd(0.015873015873015872, 0.015873015873015872, 0.015873015873015872, 0.015873015873015872)),
_mm256_mul_pd(
xi_99,
_mm256_set_pd(0.095238095238095233, 0.095238095238095233, 0.095238095238095233, 0.095238095238095233))),
_mm256_mul_pd(
xi_196,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_197,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
forceTerm_6),
xi_144),
xi_182),
xi_206),
_mm256_loadu_pd(&_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0])));
415 _mm256_store_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 + 12 * _stride_pdfs_tmp_3 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_156,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_232,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_244,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_245,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
forceTerm_12));
418 _mm256_storeu_pd(&_data_pdfs_tmp[_stride_pdfs_tmp_1 *
ctr_1 + _stride_pdfs_tmp_2 *
ctr_2 + 15 * _stride_pdfs_tmp_3 +
ctr_0],
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_add_pd(
_mm256_mul_pd(
xi_145,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0)),
_mm256_mul_pd(
xi_237,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_245,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
_mm256_mul_pd(
xi_261,
_mm256_set_pd(-1.0, -1.0, -1.0, -1.0))),
forceTerm_15));
472 const double xi_2 = _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 10 * _stride_pdfs_3 +
ctr_0 - 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 8 * _stride_pdfs_3 +
ctr_0 - 1];
473 const double xi_3 =
xi_2 + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 18 * _stride_pdfs_3 +
ctr_0 - 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 14 * _stride_pdfs_3 +
ctr_0 - 1];
474 const double xi_4 = _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 7 * _stride_pdfs_3 +
ctr_0 + 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0];
475 const double xi_5 = _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0] + _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0];
476 const double xi_6 = _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0] + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 5 * _stride_pdfs_3 +
ctr_0];
477 const double xi_7 = _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 3 * _stride_pdfs_3 +
ctr_0 + 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1];
478 const double xi_8 =
xi_7 + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 9 * _stride_pdfs_3 +
ctr_0 + 1];
479 const double xi_9 = _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0] + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0];
480 const double xi_11 = _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 13 * _stride_pdfs_3 +
ctr_0 + 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 7 * _stride_pdfs_3 +
ctr_0 + 1];
481 const double xi_12 = _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 10 * _stride_pdfs_3 +
ctr_0 - 1] - _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 8 * _stride_pdfs_3 +
ctr_0 - 1];
482 const double xi_13 = _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 9 * _stride_pdfs_3 +
ctr_0 + 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0];
483 const double xi_14 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0];
484 const double xi_15 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 14 * _stride_pdfs_3 +
ctr_0 - 1];
485 const double xi_16 = _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0] + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1];
500 const double xi_121 = 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0] + 5.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 3 * _stride_pdfs_3 +
ctr_0 + 1] + 5.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 4 * _stride_pdfs_3 +
ctr_0 - 1];
501 const double xi_124 = 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 13 * _stride_pdfs_3 +
ctr_0 + 1];
502 const double xi_125 = 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 14 * _stride_pdfs_3 +
ctr_0 - 1];
503 const double xi_126 = 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 18 * _stride_pdfs_3 +
ctr_0 - 1];
504 const double xi_129 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0];
506 const double xi_137 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1];
507 const double xi_138 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 18 * _stride_pdfs_3 +
ctr_0 - 1];
508 const double xi_139 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 5 * _stride_pdfs_3 +
ctr_0];
509 const double xi_140 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0];
510 const double xi_145 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0];
511 const double xi_146 =
xi_14 + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0];
512 const double xi_147 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0];
513 const double xi_148 =
xi_147 + _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0];
516 const double xi_155 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0];
517 const double xi_156 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0];
518 const double xi_157 = 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 8 * _stride_pdfs_3 +
ctr_0 - 1];
519 const double xi_158 = -2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 7 * _stride_pdfs_3 +
ctr_0 + 1] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 10 * _stride_pdfs_3 +
ctr_0 - 1];
524 const double xi_185 =
xi_15 + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 13 * _stride_pdfs_3 +
ctr_0 + 1];
526 const double xi_187 =
xi_186 - _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 3 * _stride_pdfs_3 +
ctr_0 + 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 4 * _stride_pdfs_3 +
ctr_0 - 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1];
528 const double xi_189 = -_data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 4 * _stride_pdfs_3 +
ctr_0 - 1];
532 const double xi_198 =
xi_145 +
xi_155 + _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0];
533 const double xi_199 = -
xi_139 -
xi_198 - _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0] - _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0];
552 const double vel2Term =
xi_6 + _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 13 * _stride_pdfs_3 +
ctr_0 + 1];
556 const double xi_96 =
pow(
xi_95 * (1.0 - ((-omega_even + 1.0) * (-omega_even + 1.0))), 0.5);
559 const double xi_105 =
pow(
xi_95 * (1.0 - ((-omega_bulk + 1.0) * (-omega_bulk + 1.0))), 0.5);
563 const double xi_134 =
pow(
xi_95 * (1.0 - ((-omega_shear + 1.0) * (-omega_shear + 1.0))), 0.5);
566 const double xi_152 =
pow(
xi_95 * (1.0 - ((-omega_odd + 1.0) * (-omega_odd + 1.0))), 0.5);
586 const double xi_210 =
xi_99 * 0.083333333333333329;
598 const double xi_241 =
xi_99 * 0.023809523809523808;
607 const double xi_0 = ((1.0) / (
rho));
611 const double xi_28 =
xi_17 * 0.16666666666666666;
613 const double xi_30 =
xi_17 * 0.083333333333333329;
628 const double xi_26 =
xi_18 * 0.16666666666666666;
631 const double xi_43 =
xi_18 * 0.083333333333333329;
644 const double xi_218 =
xi_217 * (
u_0 *
xi_216 +
xi_12 - _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 9 * _stride_pdfs_3 +
ctr_0 + 1] + _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 7 * _stride_pdfs_3 +
ctr_0 + 1]);
649 const double xi_24 =
xi_19 * 0.16666666666666666;
651 const double xi_27 =
xi_19 * 0.083333333333333329;
679 const double xi_114 =
xi_112 +
xi_113 * 0.66666666666666663 + 3.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0] + 3.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 5 * _stride_pdfs_3 +
ctr_0];
680 const double xi_115 =
rho *
xi_111 * 1.6666666666666667 +
xi_110 * 0.66666666666666663 +
xi_114 - 3.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0] - 3.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0] - 3.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0] - 3.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0] + 3.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0] + 3.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0];
684 const double xi_122 =
xi_110 * 2.3333333333333335 +
xi_114 +
xi_121 - 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0] - 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0] - 5.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1] - 5.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 18 * _stride_pdfs_3 +
ctr_0 - 1] - 5.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 13 * _stride_pdfs_3 +
ctr_0 + 1] - 5.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 14 * _stride_pdfs_3 +
ctr_0 - 1];
686 const double xi_127 =
xi_112 +
xi_113 * 3.0 +
xi_121 +
xi_124 +
xi_125 +
xi_126 - 4.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 6 * _stride_pdfs_3 +
ctr_0] - 4.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 5 * _stride_pdfs_3 +
ctr_0] - 7.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 10 * _stride_pdfs_3 +
ctr_0 - 1] - 7.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 9 * _stride_pdfs_3 +
ctr_0 + 1] - 7.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 7 * _stride_pdfs_3 +
ctr_0 + 1] - 7.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 8 * _stride_pdfs_3 +
ctr_0 - 1] + 5.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + 2 * _stride_pdfs_3 +
ctr_0] + 5.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_3 +
ctr_0];
695 const double xi_170 =
rho *
xi_111 * 2.0 -
xi_110 -
xi_118 -
xi_129 -
xi_141 -
xi_147 - 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 3 * _stride_pdfs_3 +
ctr_0 + 1] - 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + 4 * _stride_pdfs_3 +
ctr_0 - 1] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 16 * _stride_pdfs_3 +
ctr_0] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 12 * _stride_pdfs_3 +
ctr_0] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 15 * _stride_pdfs_3 +
ctr_0] + 2.0 * _data_pdfs[_stride_pdfs_1 *
ctr_1 - _stride_pdfs_1 + _stride_pdfs_2 *
ctr_2 - _stride_pdfs_2 + 11 * _stride_pdfs_3 +
ctr_0] - _data_pdfs[_stride_pdfs_1 *
ctr_1 + _stride_pdfs_2 *
ctr_2 + _stride_pdfs_2 + 17 * _stride_pdfs_3 +
ctr_0 + 1];