JSON 라인 파일 구문 분석: 여러 JSON 개체 탐색
JSON 파일을 처리할 때 "추가 데이터"와 같은 오류가 발생하면 실망스러울 수 있습니다. 특히 문서가 조밀해 보일 때는 더욱 그렇습니다. 하지만 이 경우 문제는 파일 형식 자체에 있습니다.
파일이 JSON Lines 형식으로 되어 있으며, 줄 바꿈으로 구분된 개별 JSON 개체로 구성되어 있습니다. 이 형식은 목록이나 개체와 같은 최상위 구조가 없기 때문에 유효한 JSON 값으로 인식되지 않습니다.
JSON Lines 파일을 올바르게 구문 분석하려면 각 줄을 반복하고 각 개체를 별도로 구문 분석해야 합니다. :
import json data = [] with open('file') as f: for line in f: data.append(json.loads(line))
파일의 각 줄은 유효한 JSON 객체이며 json.loads() 메서드는 이를 Python 사전으로 변환합니다. 이 접근 방식을 사용하면 각 개체를 점진적으로 처리하여 메모리를 절약하고 잠재적인 오류를 방지할 수 있습니다.
또는 구분 기호로 구분된 개별 JSON 개체가 포함된 파일이 있는 경우 ['json'을 사용하는 방법을 참조하세요. 한 번에 하나의 JSON 객체를 읽을 수 있는 모듈이 있습니까?](link-to-documentation) 버퍼링된 메소드를 사용하여 개별적으로 구문 분석할 수 있습니다.
위 내용은 여러 JSON 개체가 포함된 JSON Lines 파일을 어떻게 구문 분석합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!