이 장에서는 "Python 구문 사양 및 데이터 유형"과 관련된 내용을 업데이트합니다. 주로 Python이 어떤 유형의 프로그래밍 모드를 가지고 있는지 이해하고 Python의 기본 구문을 익히고 출력 방법과 기본 사항을 알 수 있도록 하기 위한 것입니다. Python의 데이터 유형을 이해한 후에는 더 많은 관련 작업을 수행할 수 있습니다.
①Python 대화형 명령 프로그래밍.
②Python 스크립트 프로그래밍.
③중국어 인코딩 처리.
대화형 명령 프로그래밍 모드는 일반적인 라인별 읽기 실행 모드입니다.
프로그램이 한 줄 이하일 경우 이 프로그래밍 모드가 일반적인 적용 방법입니다.
아래 그림은 프로그래밍을 위해 PythonIDLE 편집기를 사용하며, 이 편집기의 프로그래밍 모드는 일반적인 대화형 명령 인코딩 기호입니다.
>>>는 대화형 명령을 입력하라는 프롬프트입니다. 입력을 완료한 후 Enter를 누를 때마다 Python 파서가 명령을 실행합니다.
더 복잡하거나 큰 코드 섹션을 작성해야 할 때 명령형 프로그래밍은 충분히 편리하지 않습니다.
따라서 Python은 스크립팅 프로그래밍 모드를 제공합니다. 접미사가 *.py인 스크립트 파일을 생성하고 파일에 많은 양의 코드를 작성할 수 있습니다. 그러면 코드 유지 관리 및 업데이트가 용이해집니다. 그런 다음 대화형 명령이나 IDE 도구를 사용하여 실행할 수 있습니다.
문자열은 데이터 유형입니다. 그러나 문자열에는 특별한 인코딩 문제가 있습니다.
컴퓨터는 숫자만 처리할 수 있기 때문에 텍스트를 처리하려면 먼저 텍스트를 숫자로 변환한 후 처리해야 합니다.
최초의 컴퓨터는 8비트를 바이트로 사용하여 설계되었습니다. 따라서 바이트로 표시할 수 있는 가장 큰 정수는 255(이진수 11111111 = 십진수 255)입니다. 더 큰 정수를 나타내려면 더 많은 바이트를 사용해야 합니다. 예를 들어 2바이트로 표현할 수 있는 최대 정수는 65535이고, 4바이트로 표현할 수 있는 최대 정수는 4294967295이다.
컴퓨터는 미국인에 의해 발명되었기 때문에 처음에는 영어 대문자와 소문자, 숫자 및 일부 기호만 컴퓨터에 인코딩되었습니다. 이 인코딩 테이블을 대문자 A의 인코딩과 같이 ASCII 인코딩이라고 합니다. . 은 65이고 소문자 z의 인코딩은 122입니다.
Python3가 중국어 왜곡 문제를 잘 해결할 수 있는 이유는 모든 문자열을 유니코드로 인코딩하기 때문입니다.
● 유니코드는 모든 언어를 하나의 코드 세트로 통합하므로 문자가 깨지는 일이 없습니다.
● 유니코드도 지속적으로 발전하고 있지만 가장 일반적으로 사용되는 것은 2바이트를 사용하여 문자를 표현하는 것입니다(매우 희귀한 문자를 만나면 4바이트가 필요합니다). 현재 우리가 보는 대부분의 운영 체제와 대부분의 프로그래밍 언어는 유니코드를 지원합니다.
ASCII 인코딩은 1바이트인 반면 유니코드 인코딩은 일반적으로 2바이트입니다.
새로운 문제 발생: 유니코드 인코딩으로 통합하면 코드 깨짐 문제가 사라집니다. 그러나 작성하는 텍스트가 기본적으로 모두 영어인 경우 유니코드 인코딩은 ASCII 인코딩보다 두 배의 저장 공간을 필요로 하므로 저장 및 전송 측면에서 매우 비경제적입니다.
솔루션의 탄생: 유니코드 인코딩을 "가변 길이 인코딩"으로 변환하는 UTF-8 인코딩이 다시 등장했습니다.
● UTF-8 인코딩은 유니코드 문자를 숫자 크기에 따라 1~6바이트로 인코딩합니다. 일반적으로 사용되는 영문자는 1바이트로, 한자는 보통 3바이트로, 매우 희귀한 문자만 4바이트로 인코딩합니다. -6바이트.
● 전송하려는 텍스트에 영어 문자가 많이 포함되어 있는 경우 UTF-8 인코딩을 사용하면 공간을 절약할 수 있습니다.
● UTF-8 인코딩에는 추가적인 이점이 있습니다. 즉, ASCII 인코딩은 실제로 UTF-8 인코딩의 일부로 간주될 수 있습니다. 따라서 ASCII 인코딩만 지원하는 다수의 기존 레거시 소프트웨어는 UTF-8에서 계속 작동할 수 있습니다. 8 인코딩 .
특별 참고 사항: 유니코드 인코딩은 컴퓨터 메모리에서 균일하게 사용됩니다.
Python3 버전에서는 문자열이 유니코드로 인코딩됩니다. 이는 Python 문자열이 여러 언어를 지원한다는 의미입니다.
단일 문자 인코딩의 경우 Python은 단일 문자의 십진 정수 표현을 얻기 위해 ord() 함수를 제공하고 chr() 함수는 인코딩을 해당 문자로 변환합니다.
>>> ord(‘A’) 65 >>> ord(‘中’) 20013 >>> chr(66) ‘B’ >>> chr(25991) ‘文’
Python 소스 코드도 텍스트 파일이므로 소스 코드에 중국어가 포함되어 있는 경우 소스 코드를 저장할 때 UTF-8 인코딩을 지정해야 합니다. Python 인터프리터가 소스 코드를 읽을 때 UTF-8 인코딩으로 읽을 수 있도록 일반적으로 파일 시작 부분에 이 줄을 씁니다.
#-*- coding:utf-8 *-
이 주석은 Python 인터프리터에게 UTF-8 인코딩에 따라 소스 코드를 읽도록 지시하는 것입니다. 그렇지 않으면 소스 코드에 작성한 중국어 출력이 깨질 수 있습니다.
위 내용은 자동화된 테스트: Python의 몇 가지 일반적인 프로그래밍 패턴의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!