在 OpenMP 中对数组进行归约
无法在 OpenMP 中直接对数组执行归约。但是,还有其他方法可以实现数组缩减并行性。
第一种方法:私有数组和关键部分
此方法为每个线程创建数组的私有副本。每个线程填充其私有数组,并使用临界区将结果合并到最终数组中。
int A[] = {84, 30, 95, 94, 36, 73, 52, 23, 2, 13}; int S[10] = {0}; #pragma omp parallel { int S_private[10] = {0}; #pragma omp for for (int n = 0; n < 10; ++n) { for (int m = 0; m <= n; ++m) { S_private[n] += A[m]; } } #pragma omp critical { for(int n = 0; n < 10; ++n) { S[n] += S_private[n]; } } }
第二种方法:数组扩展和线程无关累加
此方法创建一个跨越所有线程的扩展数组。每个线程填充数组的其部分,然后在不使用临界区的情况下合并结果。如果在多插槽系统上不小心使用,此方法可能会出现缓存问题。
int A[] = {84, 30, 95, 94, 36, 73, 52, 23, 2, 13}; int S[10] = {0}; int *S_private; #pragma omp parallel { const int nthreads = omp_get_num_threads(); const int ithread = omp_get_thread_num(); #pragma omp single { S_private = new int[10 * nthreads]; for(int i = 0; i < (10 * nthreads); i++) S_private[i] = 0; } #pragma omp for for (int n = 0; n < 10; ++n) { for (int m = 0; m <= n; ++m){ S_private[ithread * 10 + n] += A[m]; } } #pragma omp for for(int i = 0; i < 10; i++) { for(int t = 0; t < nthreads; t++) { S[i] += S_private[10 * t + i]; } } } delete[] S_private;
以上是如何在 OpenMP 中并行化数组缩减?的详细内容。更多信息请关注PHP中文网其他相关文章!