Office: Text aus Bildern extrahieren
Microsoft verfügt unter den Toolkomponenten in Microsoft Office 2003 über ein Komponentenpaket namens „Microsoft Office Document Imaging“. Diese Komponente enthält eine sehr nützliche Funktion, die direkt eine optische Zeichenerkennung (OCR) durchführt. Mit dieser Funktion können Benutzer Text aus Bildern extrahieren. Im Folgenden stelle ich Ihnen vor, wie Sie die neue OCR-Funktion in Office 2003 zur Textextraktion nutzen.
Schritt 1: Wir müssen die Komponenten von „Microsoft Office Document Imaging“ installieren, auf „Start → Programme“ klicken und in „Microsoft Office Tools“ auf „Microsoft Office Document Imaging“ klicken, um es zu installieren und auszuführen (wie in Abbildung 1 dargestellt).
Schritt 2: Öffnen Sie ein Bild oder E-Book mit Text, suchen Sie die Seite, die Sie extrahieren möchten, und drücken Sie die Taste „Bildschirm drucken“ (PrintScreen) auf der Tastatur, um einen Screenshot zu machen.
Der dritte Schritt besteht darin, Microsoft Office Word 2003 zu öffnen und den Screenshot einzufügen. Klicken Sie im Menü „Datei“ auf „Drucken“. Nach der Installation der Microsoft Office Document Imaging-Komponente installiert das System automatisch eine Software namens „Microsoft Office Document“. Imaging". Drucker des Schriftstellers. Wie in Abbildung 2 gezeigt, wählen Sie im Dropdown-Listenfeld „Drucker“ den Drucker „Microsoft Office Document Imaging Writer“ aus. Für andere Optionen sind keine weiteren Einstellungen erforderlich. Legen Sie den Dateiausgabepfad fest Dateiname (Standard) Unter Verwendung des Quelldateinamens kann in Kürze automatisch ein Dokument im MDI-Format generiert werden.
Bild 2 Drucker auswählen
Öffnen Sie die gerade gespeicherte MDI-Typdatei (wie in Abbildung 3 gezeigt), wählen Sie mit der Maus den Textinhalt entsprechend Ihren Anforderungen aus (der ausgewählte Inhalt befindet sich im roten Feld), klicken Sie dann mit der rechten Maustaste und wählen Sie aus Das Popup-Kontextmenü „Text an Word senden“ wandelt den Bildinhalt automatisch in ein neues Word-Dokument um und Sie können ihn dann im Word-Dokument nach Ihren Wünschen bearbeiten.
Abbildung 3 Text an Word senden
Tipps: Wenn Sie den konvertierten Inhalt nicht in ein neues Word-Dokument eingeben, sondern in ein bereits geöffnetes Word-Dokument einfügen möchten, klicken Sie im obigen Vorgang einfach im Rechtsklick-Menü auf „Kopieren“ und gehen Sie dann los Zum Angeben fügen Sie es einfach in das Dokument ein.
Die Methode ist wie folgt:
1. Öffnen Sie zunächst das Medientool „Notepad“, kopieren Sie die zu importierenden Daten aus der Word-Datei und speichern Sie sie dann als TXT-Datei. Benennen Sie die TXT-Datei in diesem Beispiel „1.txt“. .
2. Öffnen Sie die Excel-Tabelle, klicken Sie auf die Registerkarte „Daten“ und suchen Sie unter „Externe Daten abrufen“ nach „Selbsttext“.
3. Klicken Sie auf „Aus Text“. Das nächste Fenster wird angezeigt. Wählen Sie die gerade gespeicherte TXT-Datei mit dem Namen 1 aus und klicken Sie auf „Importieren“. Da für den Datenimport im „Selbsttext“-Modus nur die drei Dateitypen txt, csv und prn zur Verfügung stehen, müssen Sie vorab Word in txt konvertieren.
4. Das Dialogfeld zum Importieren von Texten wird angezeigt und Sie wählen die standardmäßige feste Breite aus, was bedeutet, dass die Daten eins zu eins den Zellen entsprechen. Wenn Sie das Trennzeichen auswählen, befinden sich alle importierten Daten in einer Zelle. Klicken Sie dann auf Weiter.
5. Durch das Festlegen von Verzweigungslinien wird die Anzahl der importierten Datenspalten gesteuert. Sie können Verzweigungslinien an jeder Position hinzufügen, indem Sie mit der Maus klicken. Doppelklicken Sie auf eine Zweiglinie, um sie zu löschen. Klicken Sie nach Abschluss der Einstellungen auf Weiter.
6. Legen Sie das Format der Ausgabedaten fest. Im Allgemeinen sind keine Einstellungen erforderlich.
7. Der Import ist abgeschlossen.
Das obige ist der detaillierte Inhalt vonSo exportieren Sie Text in Fotos. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!