C OpenMP 병렬 For 루프: std::Vector의 대안
std::Vector는 일반적으로 병렬로 사용되는 다목적 데이터 구조입니다. OpenMP를 사용한 루프. 그러나 특히 속도를 우선시하거나 루프 중에 크기 조정 문제가 발생할 때 대안이 더 적합할 수 있는 상황이 있습니다.
공유 데이터 구조에 대한 한 가지 옵션은 OpenMP 4.0에서 사용자 정의 축소를 사용하는 것입니다. 의 #pragma omp 선언 축소입니다. 이렇게 하면 중요한 섹션의 필요성이 줄어들고 병렬 코드가 단순화됩니다.
순서를 유지하는 또 다른 대안은 정렬 스케줄링 섹션을 사용하는 것입니다. 이렇게 하면 각 스레드가 벡터의 특정 부분에 순서대로 쓰므로 나중에 병합할 필요가 없습니다.
크기 조정이 필요한 시나리오에서는 스레드 추적을 위해 포인터 배열을 사용하는 방법이 있습니다. 특정 접두사 합계를 채택할 수 있습니다. 이 접근 방식은 중요한 경로의 크기 조정으로 인한 오버헤드를 방지합니다.
다음은 이러한 대안에 대한 코드 예제입니다.
// Custom reduction #pragma omp declare reduction (merge: std::vector<int>: omp_out.insert(omp_out.end(), omp_in.begin(), omp_in.end()) std::vector<int> vec; #pragma omp parallel for reduction(merge: vec) for (int i = 0; i < 100; i++) vec.push_back(i);
// Static scheduling with ordered sections std::vector<int> vec; #pragma omp parallel { int ithread = omp_get_thread_num(); int nthreads = omp_get_num_threads(); #pragma omp single { prefix = new size_t[nthreads + 1]; prefix[0] = 0; } std::vector<int> vec_private; #pragma omp for schedule(static) nowait for (int i = 0; i < 100; i++) { vec_private.push_back(i); } prefix[ithread + 1] = vec_private.size(); #pragma omp barrier #pragma omp single { for (int i = 1; i < (nthreads + 1); i++) prefix[i] += prefix[i - 1]; vec.resize(vec.size() + prefix[nthreads]); } std::copy(vec_private.begin(), vec_private.end(), vec.begin() + prefix[ithread]); } delete[] prefix;
특정 사례에 적합한 대안을 선택하는 것은 요구 사항에 따라 다릅니다. 그리고 성능 고려 사항. 실험과 프로파일링은 가장 최적의 솔루션을 결정하는 데 도움이 될 수 있습니다.
위 내용은 C OpenMP 병렬 For 루프에서 std::Vector의 대안은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!