加载并解析包含多个 JSON 对象的 JSON 文件
与标准 JSON 文件不同,标准 JSON 文件将所有数据封装在单个对象或数组中,某些 JSON 格式将各个对象存储为文本文件中的单独行。当尝试在 Python 中解析此类文件时,这可能会带来挑战。
解决 ValueError
使用 Python 的 json.load() 函数加载 JSON 文件时对于多个对象,您可能会遇到“ValueError:额外数据”异常。此错误表明文件在第一个解析对象之后包含意外数据。
解决方案:逐行解析
要处理此问题,您需要处理文件中的每一行作为独立的 JSON 对象。将当前代码替换为以下内容:
import json data = [] with open('file') as f: for line in f: data.append(json.loads(line))
此代码迭代文件中的每一行,将其解析为 JSON 对象,并将其附加到列表中。
大文件的注意事项
如果 JSON 文件特别大,将所有对象附加到单个列表可能会消耗过多的内存。为了缓解这种情况,请在进入下一行之前单独处理每个对象。避免:
data = [] # List of all objects
而是根据需要处理每个对象:
for line in f: process_object(json.loads(line))
处理分隔的 JSON 对象
如果您的 JSON 文件包含单个对象由分隔符(例如逗号或换行符)分隔的对象,您可以使用以下技术来解析每个对象对象:
import json, io # Read delimited JSON objects from a file with open('file') as f: json_string = f.read() # Create a buffered reader json_buffer = io.StringIO(json_string) while True: # Read next JSON object from the buffer json_object = json.load(json_buffer) # Process JSON object if not json_object: # Reached the end of the file break
以上是如何在Python中解析包含多个JSON对象的JSON文件?的详细内容。更多信息请关注PHP中文网其他相关文章!