pandas.parser.CParserError: The Error Tokenizing Data Enigma
pandas 라이브러리를 사용하여 .csv 파일을 읽으려고 하면 사용자에게 다음과 같은 문제가 발생합니다. 수수께끼의 오류: pandas.parser.CParserError: 데이터 토큰화 오류. C 오류: 3행에 2개의 필드가 필요하고 12개를 확인했습니다. Pandas 문서를 참조했음에도 불구하고 명확한 해결 방법을 찾을 수 없습니다.
믿을 수 없을 정도로 간단한 코드 조각:
path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path)
이 문제의 희생양이 됩니다. 이해하기 어려운 오류. 질문이 생깁니다. 이 장애물을 어떻게 극복할 수 있을까요? 대체 모듈이나 프로그래밍 언어를 고려해야 합니까?
희망의 빛
동료 개발자 여러분, 두려워하지 마십시오! 해결책은 팬더 자체의 영역에 있습니다. pd.read_csv() 함수에 다음 인수를 추가하면 오류를 정상적으로 극복할 수 있습니다.
data = pd.read_csv('file1.csv', on_bad_lines='skip')
이 수정은 팬더에게 구문 분석 문제를 일으키는 모든 줄을 무시하도록 지시하여 문제를 효과적으로 회피합니다. 또한, 손상된 줄 처리를 더 강력하게 제어하려는 경우 맞춤형 응답을 제공하는 사용자 정의 콜백 함수를 정의할 수 있습니다.
1.3.0 이전 버전의 Pandas에는 다음 구문이 적용됩니다.
data = pd.read_csv("file1.csv", error_bad_lines=False)
이러한 조정을 통해 알 수 없는 오류가 사라지고 데이터 조작 요구 사항에 맞게 Pandas의 기능을 자유롭게 활용할 수 있습니다.
위 내용은 Pandas `CParserError`: '예상된 X 필드, Y를 보았습니다'를 해결하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!