Ignorieren von Namespaces im Elementspeicherort von ElementTree
Bei Verwendung der findall-Methode in ElementTree zum Suchen von Elementen in einem Namespace-fähigen XML-Dokument wird dies der Fall Es ist erforderlich, für jedes Tag den Namensraum anzugeben. Dies kann zu Unannehmlichkeiten führen. In diesem Artikel wird eine Methode zum Ignorieren von Namespaces in ElementTree-Suchmethoden wie find und findall vorgestellt.
Problem:
Wie im bereitgestellten Beispielcode gezeigt, ist der Baum.findall( Der Aufruf „DEAL_LEVEL/PAID_OFF“ gibt aufgrund des ignorierten Namespace in der XML-Datei „Keine“ zurück. Das Hinzufügen von {http://www.test.com} zu jedem Tag ist eine umständliche Problemumgehung.
Lösung:
Anstatt das XML-Dokument zu ändern, ist es vorzuziehen Analysieren Sie es und bearbeiten Sie die Tags im Ergebnis. Dies ermöglicht die Handhabung mehrerer Namespaces und Namespace-Aliase.
Der folgende Python-Code bietet eine Lösung:
<code class="python">from io import StringIO # for Python 2 import from StringIO instead import xml.etree.ElementTree as ET # instead of ET.fromstring(xml) it = ET.iterparse(StringIO(xml)) for _, el in it: _, _, el.tag = el.tag.rpartition('}') # strip ns root = it.root</code>
Erklärung:
Die Lösung nutzt die Funktion ET.iterparse, die XML-Dokumente inkrementell verarbeitet. Während der Iteration wird das Tag jedes Elements el geändert, indem der Namespace mit rpartition('}') entfernt wird. Dadurch wird der Namespace effektiv von allen Tags entfernt.
Vorteile:
Dieser Ansatz ermöglicht es Ihnen, Namespace-Präfixe bei der Suche nach Elementen zu ignorieren, wodurch der Prozess vereinfacht und die Notwendigkeit entfällt Namespaces manuell angeben.
Das obige ist der detaillierte Inhalt vonWie ignoriere ich Namespaces im Elementspeicherort von ElementTree: Eine einfache Lösung?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!