> 백엔드 개발 > C++ > `__gnu_mcount_nc`를 사용하는 것 외에 성능 프로파일링에서 함수 종료 시간을 어떻게 정확하게 측정할 수 있습니까?

`__gnu_mcount_nc`를 사용하는 것 외에 성능 프로파일링에서 함수 종료 시간을 어떻게 정확하게 측정할 수 있습니까?

Mary-Kate Olsen
풀어 주다: 2024-12-18 20:24:15
원래의
482명이 탐색했습니다.

How Can We Accurately Measure Function Exit Times in Performance Profiling Beyond Using `__gnu_mcount_nc`?

__gnu_mcount_nc를 사용하여 함수 종료 시간 확인

임베디드 플랫폼에서 성능 프로파일링을 수행하려는 시도에서 GCC의 - pg 플래그는 모든 함수에 진입할 때 __gnu_mcount_nc에 썽크를 삽입합니다. 쉽게 사용할 수 있는 __gnu_mcount_nc 구현은 없지만 스택 프레임과 현재 주기 수를 기록하는 사용자 정의 구현은 호출자/호출 수신자 그래프를 수집하고 자주 호출되는 함수를 식별하는 데 유용한 것으로 입증되었습니다.

그러나 내부에서 소요된 시간에 대한 정보를 캡처합니다. 기능 기관은 진입점에만 기반한 과제로 남아 있습니다. 섀도우 콜스택 유지 및 반환 주소 조작과 같은 기존 접근 방식에는 제한 사항과 오버헤드가 발생합니다.

함수 종료 시간 캡처를 가능하게 하는 대체 __gnu_mcount_nc 구현에 대한 문제를 해결하기 위해 다음에서 사용하는 실제 접근 방식을 자세히 살펴보겠습니다. gprof.

gprof의 기능 측정 방법 Time

초기 가정과 달리 gprof는 타이밍 함수 시작 또는 종료에 __gnu_mcount_nc를 사용하지 않습니다. 대신 각 루틴의 PC 샘플을 계산하여 수집한 자체 시간에 의존합니다. 그런 다음 이러한 샘플을 함수 간 호출 횟수와 함께 사용하여 호출자에게 귀속되어야 하는 자체 시간 부분을 추정합니다.

콜 카운팅 및 스택 샘플링

또 다른 접근 방식은 스택 샘플링으로, 정기적으로 스택 샘플을 캡처합니다. PC 샘플링보다 비용이 높지만 짧은 호출과 긴 호출을 구분하지 않고 I/O 또는 계측되지 않은 라이브러리 루틴의 영향을 받지 않기 때문에 더 정확한 측정을 제공합니다.

비용이 많이 드는 작업 식별

성능 병목 현상을 찾는 열쇠는 원시 스택 샘플을 분석하고 이를 소스 코드와 연결하는 데 있습니다. 콜 그래프나 핫스팟에 초점을 맞추는 것과는 달리, 개별 스택 샘플을 검사하면 특정 작업에 상당한 시간이 소요되는 구체적인 이유를 밝혀내고 가능한 최적화 방법을 제안할 수 있습니다.

멋진 시각화를 넘어서

Flame 그래프 및 트리 맵과 같은 시각화는 시각적으로 매력적일 수 있지만, 다른 위치에서 여러 번 호출되는 코드로 인해 발생하는 성능 문제를 강조하지 못하는 경우가 많습니다. 시간만을 기준으로 하지 않고 기능별로 데이터를 집계하고 정렬하면 코드 실행에 대한 보다 포괄적인 보기를 제공합니다.

결론

__gnu_mcount_nc는 함수 진입점에 대한 귀중한 정보를 제공할 수 있지만, 함수 종료 시간을 캡처하려면 스택 샘플링과 같은 대체 방법을 고려해야 합니다. 실제 스택 샘플 분석에 집중하고 시선을 사로잡는 시각화로 인한 방해를 피함으로써 개발자는 성능 병목 현상을 효과적으로 식별하고 최적화를 구현할 수 있습니다.

위 내용은 `__gnu_mcount_nc`를 사용하는 것 외에 성능 프로파일링에서 함수 종료 시간을 어떻게 정확하게 측정할 수 있습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:php.cn
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿