Lesen von docx-Dateien
docx-Dateien bestehen eigentlich aus vielen XML-Dateien, deren Inhalt in Word/Dokument vorliegt .xml drin.
Wir suchen eine docx-Datei und öffnen sie mit einer ZIP-Datei (oder ändern den docx-Suffixnamen in zip und entpacken es dann) (empfohlenes Lernen: PHP-Video-Tutorial)
Es gibt document.xml im Word-Verzeichnis. Der Inhalt der docx-Datei ist in document.xml vorhanden.
Der Code ist wie folgt folgt:
function parseWord($file) { $content = ""; $zip = new ZipArchive ( ); if ($zip->open ($file) === TRUE ) { for($i = 0; $i < $zip->numFiles; $i ++) { $entry = $zip->getNameIndex ( $i ); if (pathinfo ($entry,PATHINFO_BASENAME) == "document.xml") { $zip->extractTo (pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ($file, PATHINFO_FILENAME ), array ( $entry ) ); $filepath = pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ( $file, PATHINFO_FILENAME ) . "/" . $entry; $content = strip_tags ( file_get_contents ( $filepath ) ); break; } } $zip->close (); return $content; } else { echo 'no'; } }
Es ist erwähnenswert:
Die erste $file-Datei darf sich nicht im selben Verzeichnis wie der aktuelle Code befinden, $file wird in einem separaten Ordner gespeichert
Das obige ist der detaillierte Inhalt vonSo erhalten Sie den Inhalt in docx mit PHP. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!