java - 如何读取ppt等office文档中的数据结构
巴扎黑
巴扎黑 2017-04-18 10:23:35
0
2
543

请问一下,如果想读取一个ppt等office文件中的所有数据,比如说转场动画,照片及其大小定位等信息。有没有什么好的推荐?

自己搜索了几天,就发现了3个相关的。

  1. OpenOffice(LibreOffice)

  2. office官方开发(不过需要在.net 上开发)

  3. PHPPresentation。

但是office官网的应该是只支持做扩展应用,不符合我的需求。
PHPPresentation支持下却不是很强,读取的接口很多不支持。
所以就剩下了OpenOffice,这个选项,请问OpenOffice是否通过java编程对ppt里的内容进行读取?
或者还有什么好的建议?

巴扎黑
巴扎黑

全員に返信(2)
Ty80

公式ドキュメントはこちら
リンク

よく考えたら、このリンクの方が役立つかもしれません。 。 。
https://blogs.msdn.microsoft....
結局のところ、xmlベースなので、読み込み部分は技術的には難しくありませんが、実際に行うと少し面倒です

いいねを押す +0
阿神

2003 バージョンの PPT 形式はバイナリ形式であり、詳細は完全には公開されていませんが、ほとんどのサードパーティ メーカーはそれを推測して分析するために一方向のエンジニアリング手法を使用しています。 WPS はより良い仕事をしますが、唯一のオープン ソース サービスは LibreOffice (旧 OpenOffice) であり、仕事は非常に貧弱です。
2007 バージョン以降の PPTX 形式は、OOXML オープン ドキュメント仕様に基づいており、本質的には XML ドキュメントと関連リソースを圧縮する ZIP パッケージです。 OOXML自体はISO規格となって公開されています。
でも。 Office ドキュメントの機能は非常に複雑で、100 万行を超えるコードが含まれています。 OOXML を真に完全に実装しているのは Microsoft Office だけであり、Office はクローズド ソースです。したがって、OOXML を自分で解析したい場合、それは非常に困難です。 LibreOffice 独自のドキュメント仕様セットと OOXML は競合他社であるため、相互サポートは不十分です。
唯一実現可能な方法は、COM を使用して Office プログラミング インターフェイスを呼び出すことです。これは、Office がインストールされているシステムでのみ使用できます。C++ と Microsoft Office SDK を使用するには、Visual Studio を使用する必要があります。基本的には元のデータ構造を取得することはできず、API インターフェースを 1 つずつ呼び出して内容を 1 つずつ列挙し、属性などを取得することしかできません。これは、Adobe Acrobat が Word を PDF に変換する方法です。

いいねを押す +0
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!