c 허위 공유 예-C++-php.cn

? 잘못된 공유 란 무엇입니까?

? 의사 공유 샘플 코드

? 비교 : 의사 공유와 의사 공유가 없습니다

? 출력 예제 (멀티 코어 머신)

? 허위 공유를 피하는 방법?

? 요약

집

백엔드 개발

C++

c 허위 공유 예

Abigail Rose Jenkins

Aug 16, 2025 am 10:42 AM

c++

거짓 공유는 여러 스레드가 동일한 캐시 라인에서 다른 변수를 수정하여 캐시 고장 및 성능 저하를 초래할 때 발생합니다. 1. 구조 채우기를 사용하여 각 변수가 하나의 캐시 라인을 독점적으로 차지하게합니다. 2. 메모리 정렬을 위해 alignas 또는 std :: hardware_destructive_interference_size를 사용하십시오. 3. 스레드-로컬 변수를 사용하여 결과를 병합하여 의사 공유를 피하고 다중 스레드 프로그램의 성능을 향상시킵니다.

c 허위 공유 예

멀티 스레드 프로그래밍에서 False 공유는 일반적인 성능 트랩입니다. 여러 스레드가 동일한 캐시 라인에 위치한 다른 변수를 수정하여 불필요한 캐시 고장 및 성능 저하가 발생할 때 발생합니다. 개발자는 메모리 레이아웃을 직접 제어하기 때문에이 문제는 특히 C에서 발생하기 쉽습니다.

다음은 일반적인 C False 공유 예 와 수정 방법입니다.

? 잘못된 공유 란 무엇입니까?

최신 CPU는 "캐시 라인"(보통 64 바이트)의로드 데이터를 캐시합니다. 두 개의 변수가 동일한 캐시 라인에있는 경우 다른 스레드에 의해 독립적으로 액세스 되더라도 한 스레드의 쓰기로 인해 다른 스레드의 캐시 라인이 무효화되어 메모리에서 재 장전이 발생합니다. 이것은 의사 공유입니다.

? 의사 공유 샘플 코드

 #Include <streld>
#include <vector>
#include <Chrono>
#include <iostream>

Alignas (64) struct 카운터 {
    휘발성 긴 값 = 0;
};

const int num_threads = 4;
const long 반복 = 10&#39;000&#39;000;

// 여러 스레드는 배열을 공유하지만 각 스레드는 다른 요소에서 작동합니다.

void worker_bad (int tid) {
    for (long i = 0; i <반복; i) {
        counters_bad [tid] .Value;
    }
}

int main () {
    std :: vector <std :: 스레드> 스레드;

    자동 시작 = std :: Chrono :: High_resolution_clock :: now ();

    for (int i = 0; i <num_threads; i) {
        threads.emplace_back (worker_bad, i);
    }

    for (auto & t : streads) {
        t.join ();
    }

    자동 엔드 = std :: Chrono :: High_resolution_clock :: now ();
    자동 시간 = std :: chrono :: duration_cast <std :: chrono :: milliseconds> (END -Start);

    std :: cout << "bad (false sharing) :"<< duration.count () << "ms \ n";
    반환 0;
}

⚠️ 각 스레드는 counters_bad[tid] 를 작동하지만 Counter 구조는 alignas(64) 만 사용하여 개별 변수를 정렬하는 반면 std::vector 의 요소는 연속적으로 저장됩니다. Counter 충분히 채워지지 않으면 여러 Counter 동일한 캐시 라인에 압박되어 의사 공유가 발생할 수 있습니다.

그러나 위의 코드는 실제로 충분히 일반적이지 않으며 명확한 비교를 봅시다.

? 비교 : 의사 공유와 의사 공유가 없습니다

 #Include <streld>
#include <vector>
#include <Chrono>
#include <iostream>

// 메소드 1 : 잘못된 공유를 쉽게 생성 할 수 있습니다 (변수가 너무 가깝습니다)
Struct Counterfalse {
    휘발성 긴 a = 0;
    // 패딩이 없으면 다중 카운터 폴스가 캐시 라인을 공유 할 수 있습니다};

// 메소드 2 : 잘못된 공유를 피하고 수동으로 캐시 라인에 채우십시오.
    휘발성 긴 a = 0;
    숯 패딩 [64 -Sizeof (long)]; // 64 바이트로 채우십시오};

const int num_threads = 4;
const long 반복 = 10&#39;000&#39;000;

// 테스트 1 : 거짓 공유 버전 std :: vector <Counterfalse> counters_false (num_threads);
void worker_false (int tid) {
    for (long i = 0; i <반복; i) {
        COUNTERS_FALSE [TID] .A;
    }
}

// 테스트 2 : 잘못 공유 버전 없음 std :: vector <counterfixed> counters_fixed (num_threads);
void worker_fixed (int tid) {
    for (long i = 0; i <반복; i) {
        counters_fixed [tid] .a;
    }
}

int main () {
    std :: vector <std :: 스레드> 스레드;

    // 거짓 공유를 테스트합니다
    자동 시작 = std :: Chrono :: High_resolution_clock :: now ();
    for (int i = 0; i <num_threads; i) {
        threads.emplace_back (worker_false, i);
    }
    for (auto & t : streads) t.join ();
    자동 엔드 = std :: Chrono :: High_resolution_clock :: now ();
    자동 시간 = std :: chrono :: duration_cast <std :: chrono :: milliseconds> (종료 - 시작);
    std :: cout << "잘못된 공유 :"<< duration1.count () << "ms \ n";

    threads.clear ();

    // 고정 버전 테스트
    start = std :: Chrono :: High_resolution_clock :: now ();
    for (int i = 0; i <num_threads; i) {
        threads.emplace_back (worker_fixed, i);
    }
    for (auto & t : streads) t.join ();
    end = std :: Chrono :: High_resolution_clock :: now ();
    자동 duration2 = std :: chrono :: duration_cast <std :: chrono :: milliseconds> (종료 - 시작);
    std :: cout << "잘못된 공유없이 :"<< duration2.count () << "ms \ n";

    반환 0;
}

? 출력 예제 (멀티 코어 머신)

 잘못된 공유 : 850ms
허위 공유없이 : 220ms

의사 공유를 피한 후 성능 향상이 상당하다는 것을 알 수 있습니다 (약 4 회) .

? 허위 공유를 피하는 방법?

padding : 각 스레드가 변수에 액세스 할 수 있는지 확인하십시오 (일반적으로 64 바이트).
alignas(64) : 구조 또는 변수에 대한 힘 정렬.
heach 스레드는 로컬 변수를 사용하고 마지막으로 병합됩니다 . 공유 변수 액세스를 줄입니다.
표준 라이브러리가 제공하는 정렬 도구 (예 : C 11의 alignas 및 std::hardware_destructive_interference_size )

? C 17은 권장 상수 두 가지를 소개합니다.
std::hardware_destructive_interference_size : 의사 공유를 피하기위한 최소 간격 (일반적으로 캐시 라인 크기)
std::hardware_constructive_interference_size : 공유의 권장 크기

예제 (C 17) :

 struct alignas (std :: hardware_destructive_interference_size) 카운터 {
    휘발성 긴 값 = 0;
};

? 요약

허위 공유는 무해한 것처럼 보이지만 실제로는 다중 스레드 프로그램을 심각하게 느리게 만듭니다.
여러 스레드가 자주 "논리적으로 독립적이지만 물리적으로 가까운"변수를 자주 작성할 때 쉽게 트리거 할 수 있습니다.
해결 방법 : 변수가 동일한 캐시 라인에 있지 않도록 메모리 패딩 정렬 .
이 문제는 성능에 민감한 병렬 프로그램 (예 : 고주파 계산, 동시 통계)에주의를 기울여야합니다.

기본적 으로이 모든 것은 복잡하지 않지만 무시하기 쉽습니다.

위 내용은 c 허위 공유 예의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undress AI Tool

무료로 이미지를 벗다

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

PHP 튜토리얼

1600

276

Related knowledge

응용 프로그램이 정상적으로 시작할 수없는 경우 (0xc0000906) 어떻게해야합니까? 여기서 해결책을 참조하십시오 Aug 13, 2025 pm 06:42 PM

소프트웨어 나 게임을 열 때 "응용 프로그램이 정상적으로 시작될 수 없음 (0xc0000906)"이 나타나고 많은 사용자가 혼란스러워서 어디서부터 시작 해야할지 모릅니다. 실제로 이러한 오류의 대부분은 시스템 파일의 손상 또는 런타임 라이브러리 누락으로 인해 발생합니다. 시스템을 다시 설치하기 위해 서두르지 마십시오. 이 기사는 프로그램을 신속하게 복원하는 데 도움이되는 몇 가지 간단하고 효과적인 솔루션을 제공합니다. 1. 0xc0000906의 오류는 무엇입니까? 오류 코드 0xc0000906은 Windows Systems의 일반적인 시작 예외입니다. 이는 일반적으로 프로그램이 필요한 시스템 구성 요소 또는 실행중인 실행 환경을로드 할 수 없음을 의미합니다. 이 문제는 종종 큰 소프트웨어 나 게임을 실행할 때 발생합니다. 주된 이유는 다음과 같습니다. 필요한 런타임 라이브러리는 설치되거나 손상되지 않습니다. 소프트웨어 설치 패키지는 끝이 없습니다

컴퓨터에서 누락 된 msvcp71.dll을 수정하는 방법은 무엇입니까? 필요한 방법은 세 가지뿐입니다 Aug 14, 2025 pm 08:03 PM

컴퓨터는 "MSVCP71.dll이 컴퓨터에서 누락되었습니다"라는 메시지를 표시합니다. 이는 일반적으로 시스템에 중요한 실행 구성 요소가 없기 때문에 소프트웨어가 정상적으로로드되지 않기 때문입니다. 이 기사는 파일의 기능과 오류의 근본 원인을 깊이 분석하고 실행하도록 프로그램을 신속하게 복원하는 데 도움이되는 세 가지 효율적인 솔루션을 제공합니다. 1. MSVCP71.dll이란 무엇입니까? MSVCP71.dll은 Microsoft Visualc 2003의 핵심 런타임 라이브러리 파일에 속하며 DLL (Dynamic Link Library) 유형에 속합니다. 표준 기능, STL 템플릿 및 기본 데이터 처리 모듈을 호출하기 위해 C로 작성된 프로그램을 지원하는 데 주로 사용됩니다. 2000 년대 초에 개발 된 많은 응용 프로그램과 클래식 게임은이 파일에 의존하여 실행됩니다. 파일이 없거나 손상되면

C 연산자 과부하 예 Aug 15, 2025 am 10:18 AM

C에서 연산자 과부하가 발생하여 표준 연산자의 새로운 동작이 사용자 정의 유형에 할당 될 수 있습니다. 1. 멤버 기능 과부하를 통해 새 개체를 반환합니다. 2. 과부하 = 현재 객체를 수정하고 참조를 반환합니다. 3. 친구 기능 과부하

C 현의 벡터 예제 Aug 21, 2025 am 04:02 AM

std :: 벡터의 기본 사용에는 다음이 포함됩니다. 1. 선언 벡터; 2. push_back ()로 요소를 추가합니다. 3. 초기화 목록으로 초기화; 4. 범위를 가진 루프 횡단; 5. 인덱스 또는 뒷면을 통한 액세스 요소 (); 6. 요소를 수정하기위한 값의 직접 할당; 7. pop_back ()로 끝 요소를 삭제합니다. 8. Call Size ()를 통해 요소 수를 얻으십시오. Constauto를 사용하고 복사를 피하고, 예비 예비 ()를 사전 할당하여 성능을 향상시키고, 접근하기 전에 비어 있지 않은지 확인하는 것이 좋습니다. 이 데이터 구조는 스트링 목록을 처리하는 효율적이고 선호하는 방법입니다.

std :: map vs std :: unordered_map in c Aug 14, 2025 pm 06:53 PM

C에서 std :: map 및 std :: unordered_map의 선택은 특정 요구 사항에 따라 다릅니다. 1. 다른 기본 구조 : std :: 맵은 빨간색과 검은 색 나무를 기준으로 구현되며, 키가 순서대로 저장되고 기본 오름차순 순서, 검색 및 삽입의 복잡성은 O (logn)입니다. STD :: UNORDERED_MAP는 해시 테이블을 사용하지 않으며 검색 및 삽입의 평균 복잡성은 O (1)이고 최악의 상황은 O (n)입니다. 2. 삽입 성능 및 메모리 오버 헤드 : 맵 삽입은 트리 구조의 유지 보수가 필요하며 효율성이 떨어집니다. UNORDERED_MAP 삽입은 더 빠르지 만 더 많은 메모리를 소비하며 REARBER ()를 통해 최적화 할 수 있습니다. 3. 사용자 정의 비교 함수 : MAP 지원 사용자 정의 비교 함수, 변하지 않은 사람

std :: 변형과 함께 일하는 방법 c Aug 14, 2025 am 11:32 AM

STD :: Variant는 C 17에 의해 도입 된 유형 안전 조합입니다. 지정된 유형 중 하나의 값을 안전하게 보유 할 수 있습니다. std :: get, std :: holds_alternative, std :: visit 및 std :: get_if와 같은 방법을 통해 안전한 액세스 및 유형 확인을 실현할 수 있습니다. std :: monostate와 결합하여 선택적 값을 시뮬레이션 할 수 있습니다. 유형 분포를 위해 std :: 방문을 사용하고 대형 유형 목록을 피하기 위해 유지 보수 가능성을 향상시키고 궁극적으로 유형 안전 및 예외 안전을 보장하는 것이 좋습니다.

c 허위 공유 예 Aug 16, 2025 am 10:42 AM

거짓말 샤링은 여러 스레드가 동일한 캐시 라인에서 다른 변수를 수정하여 캐시 고장 및 성능 저하를 초래할 때 발생합니다. 1. 구조 채우기를 사용하여 각 변수가 하나의 캐시 라인을 독점적으로 차지하게합니다. 2. 메모리 정렬을 위해 alignas 또는 std :: hardware_destructive_interference_size를 사용하십시오. 3. 스레드-로컬 변수를 사용하여 결과를 병합하여 의사 공유를 피하고 다중 스레드 프로그램의 성능을 향상시킵니다.

간단한 TCP 클라이언트/서버를 작성하는 방법 c Aug 17, 2025 am 01:50 AM

답은 간단한 TCP 클라이언트와 서버를 작성하려면 운영 체제가 제공하는 소켓 프로그래밍 인터페이스가 필요하다는 것입니다. 서버는 소켓, 주소 바인딩, 포트 듣기, 연결 수락, 데이터 전송 및 수신으로 통신을 완료합니다. 클라이언트는 소켓을 만들고, 서버에 연결하고, 요청을 보내고, 응답을 받음으로써 상호 작용을 인식합니다. 샘플 코드는 필요한 헤더 파일, 포트 설정, 오류 처리 및 리소스 릴리스를 포함하여 Linux 또는 MacOS에서 Berkeley Socket API를 사용하는 기본 구현을 보여줍니다. 컴파일 후 서버를 먼저 실행 한 다음 클라이언트를 실행하여 양방향 통신을 달성하십시오. Windows 플랫폼은 Winsock 라이브러리를 초기화해야합니다. 이 예제는 기본 소켓 프로그래밍 학습에 적합한 차단 I/O 모델입니다.

See all articles

c 허위 공유 예

? 잘못된 공유 란 무엇입니까?

? 의사 공유 샘플 코드

? 비교 : 의사 공유와 의사 공유가 없습니다

? 출력 예제 (멀티 코어 머신)

? 허위 공유를 피하는 방법?

? 요약

핫 AI 도구

Undress AI Tool

Undresser.AI Undress

AI Clothes Remover

Clothoff.io

Video Face Swap

인기 기사

뜨거운 도구

메모장++7.3.1

SublimeText3 중국어 버전

스튜디오 13.0.1 보내기

드림위버 CS6

SublimeText3 Mac 버전

뜨거운 주제