> 백엔드 개발 > C++ > 8192 요소를 처리할 때 루프가 느린 이유는 무엇입니까?

8192 요소를 처리할 때 루프가 느린 이유는 무엇입니까?

DDD
풀어 주다: 2024-12-10 09:51:10
원래의
707명이 탐색했습니다.

Why is My Loop Slow When Processing 8192 Elements?

8192개 요소를 반복할 때 성능이 저하되는 이유

8192개 요소를 반복할 때 프로그램 속도가 크게 느려집니다. 이는 메모리 정렬 문제로 인해 발생하며 비효율적인 루프 구조로 인해 더욱 악화됩니다.

메모리 정렬

최신 프로세서는 캐시 계층 구조를 활용하여 데이터 액세스 속도를 향상시킵니다. 데이터가 캐시 라인 크기의 배수인 주소에 저장되는 정렬된 메모리 액세스를 통해 더 빠른 데이터 검색이 가능합니다. 그러나 이 경우 SIZE 매개변수는 8192로 정의되며 이는 캐시 라인 크기(일반적으로 64바이트)의 배수가 아닙니다. 이러한 잘못된 정렬로 인해 메모리 액세스 작업 속도가 느려질 수 있습니다.

루프 순서

메모리 정렬 문제를 더욱 복잡하게 만드는 것은 루프 순서입니다. 원래 코드는 행렬을 열 단위로 반복하므로 비순차적 메모리 액세스가 발생합니다. 이로 인해 프로세서는 메모리에서 데이터를 더 느리게 무작위로 검색하게 됩니다.

해결책

두 가지 가능한 해결 방법이 있습니다.

  1. Align 메모리: SIZE를 캐시 라인 크기의 배수로 재정의합니다(예: 8192 64).
  2. 교환 루프 순서: 열 방향 반복 대신 행렬 행 방향을 반복합니다. 이를 통해 메모리 액세스를 캐시 라인 구성에 맞춰 더 빠르고 효율적으로 데이터를 검색할 수 있습니다.

코드에서 루프 순서를 교환함으로써 성능 병목 현상이 제거됩니다.

예제

다음 코드는 수정:

for(j=1;j<SIZE-1;j++) {
    for(i=1;i<SIZE-1;i++) {
        res[j][i]=0;
        res[j][i] += img[j-1][i-1];
        ...
    }
}
로그인 후 복사

성능 비교

수정 적용 후 성능이 크게 향상됩니다.

원본 코드:

SIZE = 8191: 1.499 seconds
SIZE = 8192: 2.122 seconds
SIZE = 8193: 1.582 seconds
로그인 후 복사

고정 코드:

SIZE = 8191: 0.376 seconds
SIZE = 8192: 0.357 seconds
SIZE = 8193: 0.351 seconds
로그인 후 복사

위 내용은 8192 요소를 처리할 때 루프가 느린 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿