轻松将 XML 转换为 Pandas DataFrame
问题:
给定一个 XML 文件一个特定的结构,任务是将其转换为一个干净且有组织的 pandas DataFrame,其中包含六个列:“key”、“type”、“language”、“feature”、“web”和“data”。
解决方案:
最有效完成此转换的方法是利用 Python 的标准“xml”库。该库提供了一种解析和操作 XML 数据的简单方法。操作方法如下:
代码片段:
import pandas as pd import xml.etree.ElementTree as ET xml_data = "<author..>...</author>" # Replace with your XML string etree = ET.parse(xml_data) def iter_docs(author): for doc in author.iter('document'): doc_dict = author.attrib.copy() doc_dict.update(doc.attrib) doc_dict['data'] = doc.text yield doc_dict doc_df = pd.DataFrame(list(iter_docs(etree.getroot()))) print(doc_df)
此方法确保将 XML 数据系统且高效地转换为满足所需格式的 DataFrame。
以上是如何将 XML 文件转换为具有六个特定列的 Pandas DataFrame?的详细内容。更多信息请关注PHP中文网其他相关文章!