단일 파일에서 여러 JSON 개체 추출
수많은 JSON 개체가 포함된 JSON 파일을 발견할 경우 포괄적인 접근 방식을 갖는 것이 중요합니다. 특정 데이터를 추출합니다. 이 기사에서는 이러한 파일에서 "타임스탬프" 및 "유용성" 값을 추출하는 솔루션에 대해 자세히 설명합니다.
제공된 JSON 파일 구조는 스택된 JSON 개체를 나타냅니다. 원하는 데이터를 구문 분석하고 검색하려면 json.JSONDecoder.raw_decode 함수 사용을 고려하세요. 이 함수를 사용하면 메모리 제약 조건을 준수하면서 임의로 큰 JSON 문자열을 디코딩할 수 있습니다.
그러나 Python json 모듈은 앞에 공백이 붙은 문자열을 허용하지 않는다는 점에 유의하는 것이 중요합니다. 따라서 구문 분석의 시작점 역할을 하는 공백이 아닌 첫 번째 문자를 검색하기 위해 정규식을 사용합니다.
아래는 이 문제를 해결하는 수정된 솔루션입니다.
<code class="python">from json import JSONDecoder, JSONDecodeError import re NOT_WHITESPACE = re.compile(r'\S') def decode_stacked(document, pos=0, decoder=JSONDecoder()): while True: match = NOT_WHITESPACE.search(document, pos) if not match: return pos = match.start() try: obj, pos = decoder.raw_decode(document, pos) except JSONDecodeError: # do something sensible if there's some error raise yield obj</code>
수정된 코드 조각은 주어진 문서 내에 쌓인 JSON 개체를 효과적으로 구문 분석하여 각 개체가 발견될 때마다 반환합니다. 이 접근 방식은 기존 JSON 구문 분석의 한계를 피하므로 크고 잠재적으로 복잡한 JSON 파일을 처리하는 데 적합합니다.
위 내용은 단일 파일에서 여러 JSON 개체를 추출하는 방법: Pythonic 솔루션의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!