UnicodeDecodeError: 'ascii' 코덱이 바이트를 디코딩할 수 없음은 일반적으로 원래 문자열의 인코딩을 지정하지 않고 ASCII가 아닌 문자가 포함된 Python 2.x 문자열을 유니코드 문자열로 변환하려고 할 때 발생합니다.
유니코드 문자열(유니코드라고도 함)은 유니코드 포인트 코드를 보유하고 전체 유니코드 포인트를 나타낼 수 있는 Python의 별도 문자열 유형입니다. 스펙트럼. 대조적으로 문자열에는 다양한 형식(예: UTF-8, UTF-16, ISO-8895-1)의 인코딩된 텍스트가 포함됩니다.
Markdown 모듈 개발자는 unicode()를 품질 게이트로 사용하여 수신을 보장할 가능성이 높습니다. 문자열은 유니코드입니다. 수신 문자열의 인코딩을 결정할 수 없으므로 Markdown에 전달하기 전에 디코딩해야 합니다.
코드에서 "u" 접두사를 사용하여 유니코드 문자열을 선언할 수 있습니다.
my_u = u'my ünicôdé strįng' print(type(my_u)) # <type 'unicode'>
유니코드 문자열은 파일, 데이터베이스 또는 네트워크 모듈에서 발생할 수도 있으며, 여기서는 인코딩.
명시적인 unicode() 호출 없이도 유니코드 변환이 발생할 수 있습니다.
# Explicit conversion without encoding unicode('€') # New-style format string into Unicode string # Python attempts to convert value string to Unicode first u"The currency is: {}".format('€') # Old-style format string into Unicode string # Python attempts to convert value string to Unicode first u'The currency is: %s' % '€' # Append string to Unicode # Python attempts to convert string to Unicode first u'The currency is: ' + '€'
다음 다이어그램에서 "café "는 단말기 종류에 따라 "UTF-8"과 "Cp1252"로 다르게 인코딩됩니다. 두 경우 모두 "caf"는 일반 ASCII로 인코딩됩니다. UTF-8은 "é"를 나타내기 위해 2바이트를 사용하는 반면, Cp1252는 유니코드 포인트 값과 일치하는 단일 바이트를 사용합니다. 이 경우 올바른 인코딩을 사용하여 decode()가 호출되고 유니코드로의 성공적인 변환이 수행됩니다.
[올바른 인코딩을 사용한 성공적인 유니코드 변환 다이어그램]
그러나 디코드하는 경우 ()가 "ascii"로 호출되는데, 이는 인코딩을 지정하지 않고 unicode()를 호출하는 것과 유사하며 UnicodeDecodeError가 발생합니다. 발생:
[잘못된 인코딩으로 실패한 유니코드 변환 다이어그램]
코드에 "유니코드 샌드위치"를 만드는 것이 가장 좋습니다.
이 접근 방식을 사용하면 전체 작업에서 문자열 인코딩에 대해 걱정할 필요가 없습니다. 코드.
파일의 경우 적절한 인코딩과 함께 io 모듈의 TextWrapper를 사용하세요.
my_u = u'my ünicôdé strįng' print(type(my_u)) # <type 'unicode'>
위 내용은 Python의 'UnicodeDecodeError: 'ascii' 코덱이 바이트를 디코딩할 수 없습니다.' 오류를 해결하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!