Python 프로그래밍의 문자열 인코딩 문제에 대한 간략한 소개
이 글에서는 Python 문자열 프로그래밍을 소개합니다. 우리는 이미 string도 데이터 유형이라고 언급했습니다. 그러나 string은 인코딩 문제가 있다는 점에서 특별합니다.
컴퓨터는 숫자만 처리할 수 있기 때문에 텍스트를 처리하려면 먼저 텍스트를 숫자로 변환한 후 처리해야 합니다. 최초의 컴퓨터는 8비트를 바이트로 사용하여 설계되었습니다. 따라서 바이트로 표현할 수 있는 가장 큰 정수는 255(이진수 11111111 = 십진수 255)입니다. 더 큰 정수를 표현하려면 더 많은 바이트를 사용해야 합니다. 예를 들어 2바이트로 표현할 수 있는 최대 정수는 65535이고, 4바이트로 표현할 수 있는 최대 정수는 4294967295이다.
컴퓨터는 미국인에 의해 발명되었기 때문에 처음에는 영어 대문자와 소문자, 숫자 및 일부 기호만 컴퓨터에 인코딩되었습니다. 이 인코딩 테이블을 대문자 A의 인코딩과 같이 ASCII 인코딩이라고 합니다. . 은 65이고 소문자 z의 인코딩은 122입니다.
그러나 중국어를 처리하려면 1바이트로는 충분하지 않으며 최소한 2바이트가 필요하며 ASCII 인코딩과 충돌할 수 없습니다. 따라서 중국에서는 중국어를 인코딩하기 위해 GB2312 인코딩을 공식화했습니다.
상상할 수 있는 것은 세계에는 수백 가지 언어가 있다는 것입니다. 일본은 일본어를 Shift_JIS로 인코딩하고, 한국은 한국어를 Euc-kr로 인코딩하며, 나라마다 갈등이 발생할 수밖에 없습니다. 그 결과, 다중 언어 혼합 텍스트에서 표시될 때 왜곡된 문자가 나타납니다.
그래서 유니코드가 탄생했습니다. 유니코드는 모든 언어를 일련의 인코딩으로 통합하므로 더 이상 잘못된 문자가 발생하지 않습니다.
유니코드 표준도 끊임없이 발전하고 있지만 가장 일반적으로 사용되는 표준은 2바이트를 사용하여 문자를 표현하는 것입니다(매우 희귀한 문자를 사용하려면 4바이트가 필요함). 최신 운영 체제와 대부분의 프로그래밍 언어는 유니코드를 직접 지원합니다.
이제 ASCII 인코딩과 유니코드 인코딩의 차이점을 살펴보겠습니다. ASCII 인코딩은 1바이트인 반면 유니코드 인코딩은 일반적으로 2바이트입니다.
ASCII로 인코딩된 문자 A는 10진수 65, 이진수 01000001입니다.
ASCII로 인코딩된 문자 0은 10진수 48, 이진수 00110000입니다. 문자 '0'은 정수 0과 다릅니다. ASCII 인코딩 범위가 결정됩니다. 유니코드 인코딩은 10진수로 20013이고 2진수로 01001110 00101101입니다.
ASCII로 인코딩된 A를 유니코드로 인코딩하면 앞에 0만 추가하면 된다고 짐작할 수 있습니다. 따라서 A의 유니코드 인코딩은 00000000 01000001입니다.
새로운 문제가 발생했습니다. 유니코드 인코딩으로 통합하면 문자 깨짐 문제가 사라집니다. 그러나 작성하는 텍스트가 기본적으로 모두 영어인 경우 유니코드 인코딩은 ASCII 인코딩보다 두 배의 저장 공간을 필요로 하므로 저장 및 전송 측면에서 매우 비경제적입니다.
그래서 보존의 정신으로 유니코드 인코딩을 "가변 길이 인코딩"으로 변환하는 UTF-8 인코딩이 등장했습니다. UTF-8 인코딩은 유니코드 문자를 다양한 숫자 크기에 따라 1~6바이트로 인코딩합니다. 일반적으로 사용되는 영어 문자는 1바이트로 인코딩되고, 중국어 문자는 일반적으로 3바이트로 인코딩됩니다. 4-6바이트로 인코딩됩니다. 전송하려는 텍스트에 많은 수의 영어 문자가 포함되어 있는 경우 UTF-8 인코딩을 사용하면 공간을 절약할 수 있습니다.
따라서 많은 웹 페이지의 소스 코드에 정보는 웹페이지가 UTF-8로 인코딩되었음을 나타냅니다.
위 내용은 Python 프로그래밍의 문자열 인코딩 문제에 대한 간략한 소개의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undress AI Tool
무료로 이미지를 벗다

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

Subprocess.run ()을 사용하여 쉘 명령을 안전하게 실행하고 출력을 캡처하십시오. 주입 위험을 피하기 위해 목록에 매개 변수를 전달하는 것이 좋습니다. 2. 쉘 특성이 필요한 경우, shell = true를 설정할 수 있지만 명령 주입을 조심하십시오. 3. 하위 프로세스를 사용하여 실시간 출력 처리를 실현하십시오. 4. SET Check = 명령이 실패 할 때 예외를 던지기 위해 true; 5. 간단한 시나리오에서 체인을 직접 호출하여 출력을 얻을 수 있습니다. OS.System () 또는 더 이상 사용되지 않은 모듈을 사용하지 않으려면 일상 생활에서 Subprocess.run ()에 우선 순위를 부여해야합니다. 위의 방법은 파이썬에서 쉘 명령을 실행하는 핵심 사용을 무시합니다.

Seaborn 's Loctplot을 사용하여 두 변수 간의 관계와 분포를 신속하게 시각화합니다. 2. 기본 산점도는 sns.jointPlot (data = tips, x = "total_bill", y = "tip", 종류 = "scatter")에 의해 구현됩니다. 중심은 산점도이며 히스토그램은 상단과 하단에 표시됩니다. 3. 회귀선과 밀도 정보를 친절한 = "reg"에 추가하고 marginal_kws를 결합하여 에지 플롯 스타일을 설정합니다. 4. 데이터 볼륨이 클 경우 "Hex"를 사용하는 것이 좋습니다.

문자열 목록은 ".join (Words)과 같은 join () 메소드와 병합 될 수 있습니다. 2. 숫자 목록은 결합하기 전에 MAP (str, 숫자) 또는 [str (x) forxinnumbers]가있는 문자열로 변환해야합니다. 3. 모든 유형 목록은 디버깅에 적합한 괄호와 따옴표가있는 문자열로 직접 변환 할 수 있습니다. 4. '|'.join (f "[{item}]"furiteminitems) 출력과 같은 join ()과 결합 된 생성기 표현식으로 사용자 정의 형식을 구현할 수 있습니다.

PyoDBC 설치 : PipinStallPyODBC 명령을 사용하여 라이브러리를 설치하십시오. 2. SQLSERVER 연결 : PYODBC.connect () 메소드를 통해 드라이버, 서버, 데이터베이스, UID/PWD 또는 Trusted_Connection이 포함 된 연결 문자열을 사용하고 SQL 인증 또는 Windows 인증을 각각 지원합니다. 3. 설치된 드라이버를 확인하십시오 : pyodbc.drivers ()를 실행하고 'sqlserver'가 포함 된 드라이버 이름을 필터링하여 올바른 드라이버 이름이 'sqlserver 용 Odbcdriver17과 같은 올바른 드라이버 이름을 사용하는지 확인하십시오. 4. 연결 문자열의 키 매개 변수

httpx.asyncclient를 사용하여 비동기 HTTP 요청을 효율적으로 시작하십시오. 1. 기본 GET 요청은 비동기를 통해 클라이언트를 관리하고 awaitclient.get를 사용하여 비 블로킹 요청을 시작합니다. 2. asyncio.gather를 결합하여 asyncio.gather를 결합하여 성능을 크게 향상시킬 수 있으며 총 시간은 가장 느린 요청과 같습니다. 3. 사용자 정의 헤더, 인증, Base_URL 및 시간 초과 설정을 지원합니다. 4. 사후 요청을 보내고 JSON 데이터를 전달할 수 있습니다. 5. 동기 비동기 코드를 혼합하지 않도록주의하십시오. 프록시 지원은 크롤러 또는 API 집계 및 기타 시나리오에 적합한 백엔드 호환성에주의를 기울여야합니다.

pythontanbeoptimizedformemory-boundoperations는 Headgroughgenerations, 효율적 인 데이터 구조, 및 ManagingObjectLifetimes.first, usegeneratorsinsteadoflistStoprocessLargedAtasetSoneitematime, theintintomemory.second를 피하십시오

이 기사는 sqlalchemy 초보자가 create_engine 및 그 이후의 "ResourceClosedError"연결 종료 오류를 사용할 때 발생하는 "REMOVEDIN20 WARNING"경고를 해결하는 데 도움이됩니다. 이 기사는이 경고의 원인을 자세히 설명하고 경고를 제거하고 연결 문제를 해결하여 데이터베이스를 원활하게 쿼리하고 작동 할 수 있도록 특정 단계 및 코드 예제를 제공합니다.

shutil.rmtree ()는 전체 디렉토리 트리를 재귀 적으로 삭제하는 파이썬의 함수입니다. 지정된 폴더와 모든 내용을 삭제할 수 있습니다. 1. 기본 사용법 : shutil.rmtree (Path)를 사용하여 디렉토리를 삭제하고 filenotfounderRor, AprismenterRor 및 기타 예외를 처리해야합니다. 2. 실제 응용 프로그램 : 임시 데이터 또는 캐시 디렉토리와 같은 한 번의 클릭으로 하위 디렉토리 및 파일을 포함하는 폴더를 지울 수 있습니다. 3. 참고 : 삭제 작업은 복원되지 않습니다. 경로가 존재하지 않을 때 filenotfounderror가 던져집니다. 권한이나 파일 직업으로 인해 실패 할 수 있습니다. 4. 선택적 매개 변수 : ingore_errors = true로 오류를 무시할 수 있습니다
