#みなさんこんにちは、私は新人です。今日は非常に実践的な Python プログラムを紹介したいと思います。
混乱が発生しました学校でも職場でも、多くの友人が、PPT からテキストを抽出して Word に保存するという問題に遭遇するでしょう。 , これにより、テキストを読んだり印刷したりすることが容易になります。 しかし、多くの場合、友人はコピーして貼り付けることによって PPT 内のテキストを 1 つずつ抽出することしかできません。この操作方法は間違いなく非常に非効率です。今日、Brother Rookie は、プログラムを使用して PPT からテキストをバッチで抽出し、Word 文書に保存する新しい方法を紹介します。見てみましょう。 .
#1. 適切なシナリオたとえば、大量のテキストと、私はテキスト、特に多くのテキストを抽出して分析する必要がある重要な学術報告書の論文や ppt に興味があります。簡単な PPT ページの例を示します。
ご覧のとおり、上記の PPT にはテキストと画像のコンテンツ情報が含まれていますが、テキストを抽出したいだけです。実際、これは Python を使用して簡単に実行できます。最終的な効果を見てください:
効果は次のとおりです。悪くはありません。実際には非常に簡単です。はい、その方法を見てみましょう。
2. プログラム設計主に python-pptx ライブラリと python-docx ライブラリ を使用します。 PPT ファイルと Word ファイルをそれぞれ処理するために使用されます。 pip3 を使用して直接インストールできます。プログラム全体は非常に短く簡潔です。コア コードに必要なコードは 6 行だけです。プログラムは次のとおりです:
#プログラムでは、合計 3 レベルのループを使用して処理します。
1). 第 1 レベルの for ループ は、各ページのスライドを循環するために使用されます;
2 ) 2 番目のループでは、 がスライド内の各図形を決定し、ページにテキスト ボックスが含まれるかどうかを決定します。テキスト ボックスがある場合は、テキスト ボックスを取得し、text_frame という名前を付けます。
3). 3 番目の for ループ は、テキスト ボックス内のすべての段落コンテンツを走査し、テキストを抽出して Word に保存します。 。
PPT ファイル全体を調べた後、抽出されたすべてのテキスト情報をローカルの Word ドキュメントに保存します。効果は以下のとおりです。
上の図の PPT ファイルには、テキストを含む 4 つのスライドが含まれています。プログラムを実行すると、テキスト抽出結果が次の図に示されます。
上記は、Rookie が今日提供した自動化のケース共有です。わずか数行のコードで、全員の作業を大幅に改善できます。効率性を高めるために、誰もがこのプログラムを使用して迅速に抽出する必要があります。
以上がPPT テキストを抽出して Word に転送するのは簡単で、必要な Python コードは 20 行だけです。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。