docx檔案的讀取
#docx檔案其實是由很多XML檔案組成,其中內容就存在於word/document .xml裡面。
我們找到一個docx檔,使用zip檔打開(或把docx後綴名改為zip,然後解壓縮)(推薦學習:PHP影片教學)
#在word目錄下有document.xml,docx檔案的內容就存在於document.xml裡面,我們讀取這個檔案就可以了.
程式碼如下:
function parseWord($file) { $content = ""; $zip = new ZipArchive ( ); if ($zip->open ($file) === TRUE ) { for($i = 0; $i < $zip->numFiles; $i ++) { $entry = $zip->getNameIndex ( $i ); if (pathinfo ($entry,PATHINFO_BASENAME) == "document.xml") { $zip->extractTo (pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ($file, PATHINFO_FILENAME ), array ( $entry ) ); $filepath = pathinfo ($file, PATHINFO_DIRNAME ) . "/" . pathinfo ( $file, PATHINFO_FILENAME ) . "/" . $entry; $content = strip_tags ( file_get_contents ( $filepath ) ); break; } } $zip->close (); return $content; } else { echo 'no'; } }
值得注意的是:
第一個$file檔案不能與目前程式碼在同一目錄檔案下,$file存放在單獨的資料夾
以上是PHP怎麼取得docx裡面內容的詳細內容。更多資訊請關注PHP中文網其他相關文章!