In diesem Artikel stellen wir Ihnen ein praktisches Python-Büroautomatisierungsskript vor „Verwenden Sie Python, um englische Word-Dokumente stapelweise zu übersetzen und das Format beizubehalten“. Software! Werfen wir zunächst einen Blick auf die konkreten Arbeitsinhalte.
1. Beschreibung der Anforderungen
Ich habe eine große Anzahl fremdsprachiger Dokumente zur Hand (in diesem Fall nehmen wir 5 Dokumente als Beispiel, benannt test1.docxtest2.docx usw.), von denen eines wie folgt lautet :
Grundlegende Anforderungen : „Alle Inhalte dieser Dokumente stapelweise ins Chinesische übersetzen und in neue Dateien übertragen“ , der Effekt ist wie folgt:
Erweiterte Anforderungen : Während die Grundbedürfnisse erfüllt sind Wenn die Anforderung „Format der Originaldokumente beibehalten“ erfüllt ist, ist der Effekt wie folgt:
2. Logische Sortierung
1. Übersetzungs-API
Der Kern dieser Anforderung ist Übersetzung, die Strategie besteht darin, die Übersetzungs-API des Netzwerks zu verwenden, hier empfehlen wir die Baidu Translation Open Platform. Wenn Sie die Anzahl gleichzeitiger Benutzer nicht berücksichtigen, können Sie die Standardversion verwenden, die kostenlos ist und keine Zeichenbeschränkung hat !
“
Baidu Translation Open Platform: http: //api.fanyi.baidu.com/api/trans/product/indexhttp://api.fanyi.baidu.com/api/trans/product/index
”
在使用百度的通用翻译 API 之前需要完成以下工作:
使用百度账号登录百度翻译开放平台(http://api.fanyi.baidu.com);
注册成为开发者,获得APPID;
进行开发者认证(如仅需标准版可跳过);
开通通用翻译API服务:开通链接
参考技术文档和Demo编写代码
完成后在个人页面在即可看到 ID 和密钥,这个很重要!下面给出整理好的通用翻译 API 的 demo,已经对输出做简单修改,代码拿走就能用!
可以看到,测试内容准确的被翻译出来,注意如果需要多次访问 API,免费版有并发数和时间限制,可以用 time
”
Die folgenden Arbeiten müssen abgeschlossen werden, bevor Baidus universelle Übersetzungs-API verwendet werden kann:Verwenden Sie das Baidu-Konto, um sich bei der Baidu Translation Open Platform anzumelden ( http://api.fanyi.baidu.com code>) ;
Als Entwickler registrieren, APPID erhalten;
Entwicklerzertifizierung durchführen (Sie können diese überspringen, wenn Sie nur die Standardversion möchten);
Offener universeller Übersetzungs-API-Dienst: open link
Informationen zum Schreiben von Code finden Sie in der technischen Dokumentation und in der Demo
Nach Abschluss können Sie die ID und den Schlüssel auf der persönlichen Seite sehen. Das ist sehr wichtig! Die Demo der kompilierten universellen Übersetzungs-API ist unten aufgeführt. Die Ausgabe wurde einfach geändert und der Code kann verwendet werden!
Sie können sehen, dass der Testinhalt korrekt übersetzt wurde. Beachten Sie, dass die kostenlose Version Parallelität und Zeitlimits hat, wenn Sie mehrmals auf die API zugreifen müssen , können Sie
🎜2. Formatänderung🎜🎜🎜Die Schwierigkeit bei erweiterten Anforderungen besteht darin, das Format beizubehalten. Einfach ausgedrückt: Was ist das Seitenformat und das Absatzformat des Originaldokuments und was ist der entsprechende Teil nach der Übersetzung? 🎜🎜🎜Basierend auf der oben genannten logischen Beziehung müssen Sie nur den entsprechenden Inhalt des Originaldokuments abrufen und ihn dem neu übersetzten Dokument zuordnen. (Derzeit kann nur die Vereinheitlichung von Seiteneinstellungen und Absatzeinstellungen erreicht werden. Für die Formatänderung bestimmter Wörter in einem Absatz ist zur Gewährleistung der Genauigkeit die Verarbeitung natürlicher Sprache (NLP) erforderlich, die in diesem Artikel nicht behandelt wird.) 🎜
2.1 Seitenstil
Der Seitenstil muss nur Ränder, Richtung, Höhe, Breite usw. enthalten. Wie Sie dem Originaldokument entnehmen können, werden schmale Ränder übernommen. Aber wir müssen nicht wissen, wie man die vier Richtungen schmaler Ränder festlegt. Wir müssen nur die variable Übertragung der alten und neuen Dokumente im Code wie folgt darstellen
2.2 Absatzstil
Der Absatzstil umfasst Ausrichtung, Einzug, Abstände usw. werden nach Absätzen im Originaldokument eingerückt und der Titel wird zentriert. Diese Einstellungen lassen sich gut in der Variablenübergabe vornehmen. Wenn der Variablenwert, der im Originaldokument nicht festgelegt ist, None
2.3 Änderung des Textblockstils
Für Stilanpassungen wie Schriftgröße, Fettschrift, Kursivschrift, Farbe usw. gilt folgende Strategie Erstellen Sie eine leere Liste und durchlaufen Sie das Originaldokument. Für jeden Textblock in jedem Absatz werden die entsprechenden Attribute abgerufen und in die jeweiligen Listen eingefügt. Für denselben Absatz wird die Option mit den meisten Textblockattributen dem entsprechenden Absatz zugewiesen des übersetzten Dokuments (z. B. der gesamte oder der größte Teil eines Absatzes). Wenn der Text fett gedruckt ist, werden nach der Übersetzung alle Textblöcke des entsprechenden Absatzes fett dargestellt.)
Leser, die sich für NLP interessieren, können versuchen, die Stiländerungen bestimmter spezifischer Wörter in englischen Dokumenten weitgehend wiederherzustellen und sie in den übersetzten Dokumenten widerzuspiegeln
Der obige Code enthält keine Schriftarteinstellungen, da keine Änderungen erforderlich sind Die englische Schriftart wird an das chinesische Dokument übergeben. Die Einstellung chinesischer Schriftarten wurde im vorherigen Artikel erwähnt. Bitte sehen Sie sich den Code direkt an:
3. In Anbetracht dessen ist jeder Teil des Vorgangs abgeschlossen Es gibt viele Dokumente, die übersetzt werden müssen, daher lautet die gesamte Logik wie folgt:
Das obige ist der detaillierte Inhalt vonIst das in Python geschriebene Dokument-Batch-Übersetzungstool besser als kostenpflichtige Software?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Führen Sie Pipinstall-Rrequirements.txt aus, um das Abhängigkeitspaket zu installieren. Es wird empfohlen, zunächst die virtuelle Umgebung zu erstellen und zu aktivieren, um Konflikte zu vermeiden, sicherzustellen, dass der Dateipfad korrekt ist und dass die PIP aktualisiert wurde, und Optionen wie-No-Deps oder -User, um das Installationsverhalten bei Bedarf anzupassen.
Python ist ein einfaches und leistungsstarkes Testwerkzeug in Python. Nach der Installation werden Testdateien automatisch gemäß den Namensregeln ermittelt. Schreiben Sie eine Funktion, die mit Test_ für Assertionstests beginnt, verwenden Sie @PyTest.Fixure, um wiederverwendbare Testdaten zu erstellen, die Ausnahmen über pyTest.raises zu überprüfen, unterstützt die laufenden Tests und mehrere Befehlszeilenoptionen und verbessert die Testeneffizienz.
Inhaltsverzeichnis Was ist Bitcoin Improvement Vorschlag (BIP)? Warum ist BIP so wichtig? Wie funktioniert der historische BIP -Prozess für Bitcoin Improvement Vorschlag (BIP)? Was ist ein BIP -Typ -Signal und wie sendet ein Bergmann es? Taproot und Cons of Quick Trial of BIP -Schlussfolgerung - seit 2011 wurden Verbesserungen an Bitcoin durch ein System namens Bitcoin Improvement Vorschlag oder „BIP“ vorgenommen. Bitcoin Improvement Vorschlag (BIP) enthält Richtlinien dafür, wie sich Bitcoin im Allgemeinen entwickeln kann. Es gibt drei mögliche BIP -Arten, von denen zwei mit den technologischen Veränderungen in Bitcoin zusammenhängen. Jede BIP beginnt mit informellen Diskussionen zwischen Bitcoin -Entwicklern, die sich überall versammeln können, einschließlich TWI
Für Anfänger in der Datenwissenschaft ist der Kern des Sprungs von "Unerfahrenheit" zum "Branchenexperten" eine kontinuierliche Praxis. Die Grundlage der Praxis sind die reichen und vielfältigen Datensätze. Glücklicherweise gibt es eine große Anzahl von Websites im Internet, die kostenlose öffentliche Datensätze anbieten, die wertvolle Ressourcen sind, um die Fähigkeiten zu verbessern und Ihre Fähigkeiten zu verbessern.
Die Big-Data-Analyse muss sich auf Multi-Core-CPU, Speicher mit großer Kapazität und abgestufter Speicher konzentrieren. Multi-Core-Prozessoren wie Amdepyc oder Ryzenthreadripper werden unter Berücksichtigung der Anzahl der Kerne und einer Single-Core-Leistung bevorzugt. Der Speicher wird empfohlen, um mit 64 GB zu beginnen, und der ECC -Speicher wird bevorzugt, um die Datenintegrität zu gewährleisten. Der Speicher verwendet NVMESSD (System- und Heißdaten), Satassd (gemeinsame Daten) und HDD (Kaltdaten), um die Gesamtverarbeitungseffizienz zu verbessern.