Python의 문자열 ID: 인터닝 및 메모리 재사용
Python에서 문자열은 변경할 수 없습니다. 그러나 초기 예제에서 설명한 것처럼 문자열 리터럴의 ID는 반복 평가 시 변경될 수 있습니다. 이 동작은 Python의 내부 문자열 처리 메커니즘과 메모리 최적화 전략의 조합에서 비롯됩니다.
CPython의 Interning
CPython 문서에 명시적으로 정의되지는 않았지만 인터프리터는 종종 문자열을 인턴합니다. 자주 사용하는 것. 여기에는 일반적으로 참조되는 문자열을 전역 테이블에 저장하고 동일한 문자열에 대해 동일한 메모리 위치를 재사용하는 작업이 포함됩니다. 따라서 두 문자열 리터럴이 동일한 코드 블록에 나타나거나 서로 다른 변수에 바인딩된 경우 인턴되면 동일한 ID를 공유할 수 있습니다.
메모리 재사용 및 가비지 수집
문자열 개체가 생성되면 메모리 위치가 영구적으로 바인딩되지 않습니다. Python의 가비지 수집기는 문자열 개체를 포함하여 사용되지 않는 개체에서 메모리를 회수할 수 있습니다. 문자열이 코드 어디에서도 더 이상 참조되지 않으면 해당 메모리 위치는 새 문자열 개체에서 재사용될 수 있습니다. 이로 인해 여러 번 평가할 때 동일한 문자열 리터럴에 대해 서로 다른 ID가 발생할 수 있습니다.
컴파일러 최적화
Python 컴파일러는 런타임 시 코드 최적화를 수행하는 경우가 많습니다. 특정 기준(예: ASCII 문자, 숫자 또는 밑줄만 포함)을 충족하는 문자열 리터럴의 경우 컴파일러는 이를 인턴하고 생성을 최적화할 수 있습니다. 이는 최적화된 코드 내에서 동일한 문자열 리터럴에 대한 후속 평가가 동일한 ID를 생성할 수 있음을 의미합니다.
동적 바인딩 및 문자열 인터닝
변수가 문자열 리터럴을 사용하면 Python은 인턴된 문자열을 참조하는 새 개체를 만듭니다. 변수 이름이 앞서 언급한 기준을 충족하면 인터닝될 수도 있으며, 결과적으로 변수 이름과 값이 동일한 ID를 공유하게 됩니다.
연결 및 인터닝
Python에서 문자열을 연결하면 결과 문자열이 컴파일러의 최적화 제한(Python 3.7의 경우 4096자)에 맞는 경우 인터닝이 발생할 수 있습니다. 따라서 연결된 두 문자열이 유효한 식별자를 생성하고 제한 내에 있는 경우 동일한 ID를 가질 수 있습니다.
위 내용은 Python은 문자열 ID를 어떻게 관리합니까: 인터닝, 메모리 재사용 및 최적화?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!