목차
? 잘못된 공유 란 무엇입니까?
? 의사 공유 샘플 코드
? 비교 : 의사 공유와 의사 공유가 없습니다
? 출력 예제 (멀티 코어 머신)
? 허위 공유를 피하는 방법?
? 요약
백엔드 개발 C++ c 허위 공유 예

c 허위 공유 예

Aug 16, 2025 am 10:42 AM
c++

거짓 공유는 여러 스레드가 동일한 캐시 라인에서 다른 변수를 수정하여 캐시 고장 및 성능 저하를 초래할 때 발생합니다. 1. 구조 채우기를 사용하여 각 변수가 하나의 캐시 라인을 독점적으로 차지하게합니다. 2. 메모리 정렬을 위해 alignas 또는 std :: hardware_destructive_interference_size를 사용하십시오. 3. 스레드-로컬 변수를 사용하여 결과를 병합하여 의사 공유를 피하고 다중 스레드 프로그램의 성능을 향상시킵니다.

c 허위 공유 예

멀티 스레드 프로그래밍에서 False 공유는 일반적인 성능 트랩입니다. 여러 스레드가 동일한 캐시 라인에 위치한 다른 변수를 수정하여 불필요한 캐시 고장 및 성능 저하가 발생할 때 발생합니다. 개발자는 메모리 레이아웃을 직접 제어하기 때문에이 문제는 특히 C에서 발생하기 쉽습니다.

c 허위 공유 예

다음은 일반적인 C False 공유 예 와 수정 방법입니다.


? 잘못된 공유 란 무엇입니까?

최신 CPU는 "캐시 라인"(보통 64 바이트)의로드 데이터를 캐시합니다. 두 개의 변수가 동일한 캐시 라인에있는 경우 다른 스레드에 의해 독립적으로 액세스 되더라도 한 스레드의 쓰기로 인해 다른 스레드의 캐시 라인이 무효화되어 메모리에서 재 장전이 발생합니다. 이것은 의사 공유입니다.

c 허위 공유 예

? 의사 공유 샘플 코드

 #Include <streld>
#include <vector>
#include <Chrono>
#include <iostream>

Alignas (64) struct 카운터 {
    휘발성 긴 값 = 0;
};

const int num_threads = 4;
const long 반복 = 10&#39;000&#39;000;

// 여러 스레드는 배열을 공유하지만 각 스레드는 다른 요소에서 작동합니다.

void worker_bad (int tid) {
    for (long i = 0; i <반복; i) {
        counters_bad [tid] .Value;
    }
}

int main () {
    std :: vector <std :: 스레드> 스레드;

    자동 시작 = std :: Chrono :: High_resolution_clock :: now ();

    for (int i = 0; i <num_threads; i) {
        threads.emplace_back (worker_bad, i);
    }

    for (auto & t : streads) {
        t.join ();
    }

    자동 엔드 = std :: Chrono :: High_resolution_clock :: now ();
    자동 시간 = std :: chrono :: duration_cast <std :: chrono :: milliseconds> (END -Start);

    std :: cout << "bad (false sharing) :"<< duration.count () << "ms \ n";
    반환 0;
}

⚠️ 각 스레드는 counters_bad[tid] 를 작동하지만 Counter 구조는 alignas(64) 만 사용하여 개별 변수를 정렬하는 반면 std::vector 의 요소는 연속적으로 저장됩니다. Counter 충분히 채워지지 않으면 여러 Counter 동일한 캐시 라인에 압박되어 의사 공유가 발생할 수 있습니다.

그러나 위의 코드는 실제로 충분히 일반적이지 않으며 명확한 비교를 봅시다.

c 허위 공유 예

? 비교 : 의사 공유와 의사 공유가 없습니다

 #Include <streld>
#include <vector>
#include <Chrono>
#include <iostream>

// 메소드 1 : 잘못된 공유를 쉽게 생성 할 수 있습니다 (변수가 너무 가깝습니다)
Struct Counterfalse {
    휘발성 긴 a = 0;
    // 패딩이 없으면 다중 카운터 폴스가 캐시 라인을 공유 할 수 있습니다};

// 메소드 2 : 잘못된 공유를 피하고 수동으로 캐시 라인에 채우십시오.
    휘발성 긴 a = 0;
    숯 패딩 [64 -Sizeof (long)]; // 64 바이트로 채우십시오};

const int num_threads = 4;
const long 반복 = 10&#39;000&#39;000;

// 테스트 1 : 거짓 공유 버전 std :: vector <Counterfalse> counters_false (num_threads);
void worker_false (int tid) {
    for (long i = 0; i <반복; i) {
        COUNTERS_FALSE [TID] .A;
    }
}

// 테스트 2 : 잘못 공유 버전 없음 std :: vector <counterfixed> counters_fixed (num_threads);
void worker_fixed (int tid) {
    for (long i = 0; i <반복; i) {
        counters_fixed [tid] .a;
    }
}

int main () {
    std :: vector <std :: 스레드> 스레드;

    // 거짓 공유를 테스트합니다
    자동 시작 = std :: Chrono :: High_resolution_clock :: now ();
    for (int i = 0; i <num_threads; i) {
        threads.emplace_back (worker_false, i);
    }
    for (auto & t : streads) t.join ();
    자동 엔드 = std :: Chrono :: High_resolution_clock :: now ();
    자동 시간 = std :: chrono :: duration_cast <std :: chrono :: milliseconds> (종료 - 시작);
    std :: cout << "잘못된 공유 :"<< duration1.count () << "ms \ n";

    threads.clear ();

    // 고정 버전 테스트
    start = std :: Chrono :: High_resolution_clock :: now ();
    for (int i = 0; i <num_threads; i) {
        threads.emplace_back (worker_fixed, i);
    }
    for (auto & t : streads) t.join ();
    end = std :: Chrono :: High_resolution_clock :: now ();
    자동 duration2 = std :: chrono :: duration_cast <std :: chrono :: milliseconds> (종료 - 시작);
    std :: cout << "잘못된 공유없이 :"<< duration2.count () << "ms \ n";

    반환 0;
}

? 출력 예제 (멀티 코어 머신)

 잘못된 공유 : 850ms
허위 공유없이 : 220ms

의사 공유를 피한 후 성능 향상이 상당하다는 것을 알 수 있습니다 (약 4 회) .


? 허위 공유를 피하는 방법?

  • padding : 각 스레드가 변수에 액세스 할 수 있는지 확인하십시오 (일반적으로 64 바이트).
  • alignas(64) : 구조 또는 변수에 대한 힘 정렬.
  • heach 스레드는 로컬 변수를 사용하고 마지막으로 병합됩니다 . 공유 변수 액세스를 줄입니다.
  • 표준 라이브러리가 제공하는 정렬 도구 (예 : C 11의 alignasstd::hardware_destructive_interference_size )

? C 17은 권장 상수 두 가지를 소개합니다.

  • std::hardware_destructive_interference_size : 의사 공유를 피하기위한 최소 간격 (일반적으로 캐시 라인 크기)
  • std::hardware_constructive_interference_size : 공유의 권장 크기

예제 (C 17) :

 struct alignas (std :: hardware_destructive_interference_size) 카운터 {
    휘발성 긴 값 = 0;
};

? 요약

  • 허위 공유는 무해한 것처럼 보이지만 실제로는 다중 스레드 프로그램을 심각하게 느리게 만듭니다.
  • 여러 스레드가 자주 "논리적으로 독립적이지만 물리적으로 가까운"변수를 자주 작성할 때 쉽게 트리거 할 수 있습니다.
  • 해결 방법 : 변수가 동일한 캐시 라인에 있지 않도록 메모리 패딩 정렬 .
  • 이 문제는 성능에 민감한 병렬 프로그램 (예 : 고주파 계산, 동시 통계)에주의를 기울여야합니다.

기본적 으로이 모든 것은 복잡하지 않지만 무시하기 쉽습니다.

위 내용은 c 허위 공유 예의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제

PHP 튜토리얼
1600
276
응용 프로그램이 정상적으로 시작할 수없는 경우 (0xc0000906) 어떻게해야합니까? 여기서 해결책을 참조하십시오 응용 프로그램이 정상적으로 시작할 수없는 경우 (0xc0000906) 어떻게해야합니까? 여기서 해결책을 참조하십시오 Aug 13, 2025 pm 06:42 PM

소프트웨어 나 게임을 열 때 "응용 프로그램이 정상적으로 시작될 수 없음 (0xc0000906)"이 나타나고 많은 사용자가 혼란스러워서 어디서부터 시작 해야할지 모릅니다. 실제로 이러한 오류의 대부분은 시스템 파일의 손상 또는 런타임 라이브러리 누락으로 인해 발생합니다. 시스템을 다시 설치하기 위해 서두르지 마십시오. 이 기사는 프로그램을 신속하게 복원하는 데 도움이되는 몇 가지 간단하고 효과적인 솔루션을 제공합니다. 1. 0xc0000906의 오류는 무엇입니까? 오류 코드 0xc0000906은 Windows Systems의 일반적인 시작 예외입니다. 이는 일반적으로 프로그램이 필요한 시스템 구성 요소 또는 실행중인 실행 환경을로드 할 수 없음을 의미합니다. 이 문제는 종종 큰 소프트웨어 나 게임을 실행할 때 발생합니다. 주된 이유는 다음과 같습니다. 필요한 런타임 라이브러리는 설치되거나 손상되지 않습니다. 소프트웨어 설치 패키지는 끝이 없습니다

컴퓨터에서 누락 된 msvcp71.dll을 수정하는 방법은 무엇입니까? 필요한 방법은 세 가지뿐입니다 컴퓨터에서 누락 된 msvcp71.dll을 수정하는 방법은 무엇입니까? 필요한 방법은 세 가지뿐입니다 Aug 14, 2025 pm 08:03 PM

컴퓨터는 "MSVCP71.dll이 컴퓨터에서 누락되었습니다"라는 메시지를 표시합니다. 이는 일반적으로 시스템에 중요한 실행 구성 요소가 없기 때문에 소프트웨어가 정상적으로로드되지 않기 때문입니다. 이 기사는 파일의 기능과 오류의 근본 원인을 깊이 분석하고 실행하도록 프로그램을 신속하게 복원하는 데 도움이되는 세 가지 효율적인 솔루션을 제공합니다. 1. MSVCP71.dll이란 무엇입니까? MSVCP71.dll은 Microsoft Visualc 2003의 핵심 런타임 라이브러리 파일에 속하며 DLL (Dynamic Link Library) 유형에 속합니다. 표준 기능, STL 템플릿 및 기본 데이터 처리 모듈을 호출하기 위해 C로 작성된 프로그램을 지원하는 데 주로 사용됩니다. 2000 년대 초에 개발 된 많은 응용 프로그램과 클래식 게임은이 파일에 의존하여 실행됩니다. 파일이 없거나 손상되면

C 연산자 과부하 예 C 연산자 과부하 예 Aug 15, 2025 am 10:18 AM

C에서 연산자 과부하가 발생하여 표준 연산자의 새로운 동작이 사용자 정의 유형에 할당 될 수 있습니다. 1. 멤버 기능 과부하를 통해 새 개체를 반환합니다. 2. 과부하 = 현재 객체를 수정하고 참조를 반환합니다. 3. 친구 기능 과부하

C 현의 벡터 예제 C 현의 벡터 예제 Aug 21, 2025 am 04:02 AM

std :: 벡터의 기본 사용에는 다음이 포함됩니다. 1. 선언 벡터; 2. push_back ()로 요소를 추가합니다. 3. 초기화 목록으로 초기화; 4. 범위를 가진 루프 횡단; 5. 인덱스 또는 뒷면을 통한 액세스 요소 (); 6. 요소를 수정하기위한 값의 직접 할당; 7. pop_back ()로 끝 요소를 삭제합니다. 8. Call Size ()를 통해 요소 수를 얻으십시오. Constauto를 사용하고 복사를 피하고, 예비 예비 ()를 사전 할당하여 성능을 향상시키고, 접근하기 전에 비어 있지 않은지 확인하는 것이 좋습니다. 이 데이터 구조는 스트링 목록을 처리하는 효율적이고 선호하는 방법입니다.

std :: map vs std :: unordered_map in c std :: map vs std :: unordered_map in c Aug 14, 2025 pm 06:53 PM

C에서 std :: map 및 std :: unordered_map의 선택은 특정 요구 사항에 따라 다릅니다. 1. 다른 기본 구조 : std :: 맵은 빨간색과 검은 색 나무를 기준으로 구현되며, 키가 순서대로 저장되고 기본 오름차순 순서, 검색 및 삽입의 복잡성은 O (logn)입니다. STD :: UNORDERED_MAP는 해시 테이블을 사용하지 않으며 검색 및 삽입의 평균 복잡성은 O (1)이고 최악의 상황은 O (n)입니다. 2. 삽입 성능 및 메모리 오버 헤드 : 맵 삽입은 트리 구조의 유지 보수가 필요하며 효율성이 떨어집니다. UNORDERED_MAP 삽입은 더 빠르지 만 더 많은 메모리를 소비하며 REARBER ()를 통해 최적화 할 수 있습니다. 3. 사용자 정의 비교 함수 : MAP 지원 사용자 정의 비교 함수, 변하지 않은 사람

std :: 변형과 함께 일하는 방법 c std :: 변형과 함께 일하는 방법 c Aug 14, 2025 am 11:32 AM

STD :: Variant는 C 17에 의해 도입 된 유형 안전 조합입니다. 지정된 유형 중 하나의 값을 안전하게 보유 할 수 있습니다. std :: get, std :: holds_alternative, std :: visit 및 std :: get_if와 같은 방법을 통해 안전한 액세스 및 유형 확인을 실현할 수 있습니다. std :: monostate와 결합하여 선택적 값을 시뮬레이션 할 수 있습니다. 유형 분포를 위해 std :: 방문을 사용하고 대형 유형 목록을 피하기 위해 유지 보수 가능성을 향상시키고 궁극적으로 유형 안전 및 예외 안전을 보장하는 것이 좋습니다.

c 허위 공유 예 c 허위 공유 예 Aug 16, 2025 am 10:42 AM

거짓말 샤링은 여러 스레드가 동일한 캐시 라인에서 다른 변수를 수정하여 캐시 고장 및 성능 저하를 초래할 때 발생합니다. 1. 구조 채우기를 사용하여 각 변수가 하나의 캐시 라인을 독점적으로 차지하게합니다. 2. 메모리 정렬을 위해 alignas 또는 std :: hardware_destructive_interference_size를 사용하십시오. 3. 스레드-로컬 변수를 사용하여 결과를 병합하여 의사 공유를 피하고 다중 스레드 프로그램의 성능을 향상시킵니다.

간단한 TCP 클라이언트/서버를 작성하는 방법 c 간단한 TCP 클라이언트/서버를 작성하는 방법 c Aug 17, 2025 am 01:50 AM

답은 간단한 TCP 클라이언트와 서버를 작성하려면 운영 체제가 제공하는 소켓 프로그래밍 인터페이스가 필요하다는 것입니다. 서버는 소켓, 주소 바인딩, 포트 듣기, 연결 수락, 데이터 전송 및 수신으로 통신을 완료합니다. 클라이언트는 소켓을 만들고, 서버에 연결하고, 요청을 보내고, 응답을 받음으로써 상호 작용을 인식합니다. 샘플 코드는 필요한 헤더 파일, 포트 설정, 오류 처리 및 리소스 릴리스를 포함하여 Linux 또는 MacOS에서 Berkeley Socket API를 사용하는 기본 구현을 보여줍니다. 컴파일 후 서버를 먼저 실행 한 다음 클라이언트를 실행하여 양방향 통신을 달성하십시오. Windows 플랫폼은 Winsock 라이브러리를 초기화해야합니다. 이 예제는 기본 소켓 프로그래밍 학습에 적합한 차단 I/O 모델입니다.

See all articles