Heim > Technologie-Peripheriegeräte > KI > Das Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-Wettbewerb

Das Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-Wettbewerb

PHPz
Freigeben: 2023-10-20 18:45:04
nach vorne
1165 Leute haben es durchsucht

Bei der ICDAR 2023, der Top-Veranstaltung im Bereich der globalen Texterkennung (OCR), gewann das OCR-Team von Tencent vier Meisterschaften auf Basis selbst entwickelter Algorithmen. Dies ist das vierte Mal in Folge, dass es an der Konferenz teilnahm und seit 2017 gute Ergebnisse erzielte. 2019 und 2021. Es hat insgesamt 18 offizielle Zertifizierungsmeisterschaften gewonnen und damit das Weltklasseniveau der OCR-Technologie von Tencent unter Beweis gestellt.

Die ICDAR-Konferenz ist eine anerkannte, maßgebliche akademische Konferenz im Bereich der globalen Dokumentbildanalyse und -erkennung. Die Veranstaltung lockt fast 8.000 Teams aus mehr als 100 Ländern zur Teilnahme an. Der ICDAR-Wettbewerb ist im In- und Ausland für seinen extrem hohen technischen Schwierigkeitsgrad und seine hohe Praktikabilität bekannt. Im Gegensatz zu informellen Ranglisten nach dem Spiel verwendet der offizielle, von ICDAR offiziell zertifizierte Wettbewerb einen neuen Datensatz sowie die Informationen und Informationen der teilnehmenden Teams Die Ergebnisse werden nicht während des Wettbewerbs bekannt gegeben, obwohl die Zeit und die Anzahl der Ergebniseinreichungen begrenzt sind, ist es ein äußerst schwieriges „Blindtippen“.

In diesem Jahr besteht das Tencent OCR-Team gemeinsam aus der Tencent Data Platform-Abteilung und der WeChat Technology Architecture-Abteilung. Es konzentriert sich auf die Teilnahme an den beiden großen Wettbewerben DSText (Dense Small Text Video Text Recognition) und SVRD (Structured Information Extraction). und erreichte 4 A-Streckenmeisterschaften.

DSText-Track, Tencent hat alle beiden Meisterschaften gewonnen

DSText-Wettbewerb (Dense Small Text Video Text Recognition) stellte zwei Aufgaben auf: Videotext-Tracking und Videotext-End-to-End-Erkennung. Da der Text sehr dicht und sehr klein ist, gepaart mit Umgebungsinterferenzen (Kameraverwacklungen, Bewegungsunschärfe, Lichtveränderungen usw.) und Nachbearbeitung (Bildschirmschnitte mit mehreren Objektiven, künstliche Hintergründe, Wechsel der Spieloberfläche usw.), ist er ist aus Videobildern schwer genau zu erkennen und zu verfolgen. Das Erkennen von Text erfordert eine hohe Robustheit des Algorithmus und ist äußerst anspruchsvoll. Nachfolgend sind einige Videobilder des Wettbewerbs aufgeführt:

Das Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-Wettbewerb

Schematische Bilder des ICDAR-DSText-Wettbewerbs

In allen beiden Aufgaben des DSText-Wettbewerbs gewann das Tencent OCR-Team die Meisterschaft mit einem absoluten Vorsprung.

Dabei zielt Aufgabe 1 darauf ab, alle Textströme im Video zu verfolgen und die Erkennungsbilder, die zu derselben Textinstanz gehören, zwischen den Videobildern zusammenzufassen. Der Bewertungsindikator liegt mit 12,04 % an zweiter Stelle.

Videotextverfolgung: Meisterschaftszertifikat

Das Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-WettbewerbIn Aufgabe 2, die darauf ausgelegt ist, die End-to-End-Leistung der Videotexterkennung zu bewerten, erfordert die Aufgabe eine korrekte Texterkennung in jedem Bild, eine korrekte Verfolgung in Videobildern und eine korrekte Sequenzebene identifiziert, der Bewertungsindex ist OCR-MOTA, und Tencent gewann die Meisterschaft, wobei

mit 11,93 % auf dem zweiten Platz lag

.

Videotext End-to-End-Anerkennung: Meisterschaftszertifikat

Das Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-WettbewerbSVRD-Strecke, Tencent gewann zwei Meisterschaften mit absolutem Vorteil

SVRD

Der Wettbewerb „Structured Information Extraction“ umfasst zwei große Strecken, HUST-CELL und BAIDU-FEST . 4 Aufgaben: Extraktion komplexer Dokumententitätsbeziehungen (E2E Complex Entity Linking), komplexe Extraktion der Dokumententitätssemantik (E2E Complex Entity Labeling), Extraktion strukturierter Informationen ohne Schuss (E2E Zero-shot Structured Text Extraction) und Extraktion strukturierter Informationen mit kleinen Stichproben ( Extraktion von strukturiertem Text mit wenigen Schüssen). Aufgrund des komplexen Layouts und der vielfältigen Struktur von Dokumentenbildern, der unregelmäßigen Sammlung natürlicher Szenenbilder, komplexer Hintergründe, Brüchen, Biegungen, Verformungen und anderen Problemen ist der Wettbewerb ziemlich herausfordernd. Nachfolgend sind einige Wettbewerbsbilder aufgeführt:

Das Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-WettbewerbICDAR-SVRD Structured Information Extraction Competition Sample

Im SVRD-Wettbewerb gewann das Tencent OCR-Team insgesamt zwei Meisterschaften.

Unter anderem zielt Aufgabe 2 (E2E Complex Entity Labeling) darauf ab, semantische Entitäten auf komplexen Dokumentbildern zu extrahieren, wie z. B. Titel, Organisationsnamen, Daten, Beträge, Zahlen, Produktnamen, Personennamen usw. Tencent hat einen großen Vorteil darin Diese Aufgabe hat die Meisterschaft gewonnen

Das Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-WettbewerbE2E Complex Entity Labeling: Meisterschaftszertifikat

Aufgabe 4 (E2E Few-Shot Structured Text Extraction) Die Wettbewerbsfrage erfordert die Extraktion von Bildern in 10 verschiedenen Szenarien unter der Prämisse, ein sehr kleines bereitzustellen Bei der Menge an Trainingsdaten wie Bankkarten, Geschäftslizenzen, Taxirechnungen, Einkaufsbelegen, Transportrechnungen, Festbetragsrechnungen, Papieren usw. gewann Tencent ebenfalls die Meisterschaft.

Das Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-WettbewerbE2E Few-shot Structured Text Extraction: Champion-Zertifikat

Berichten zufolge ist das Tencent OCR-Team ein professionelles Team innerhalb von Tencent, das sich der Erforschung und Entwicklung von OCR-Technologie widmet. Das Team hat unabhängig hochpräzise und hochstabile Technologien entwickelt Technologie Die einzigartige Technologie zur Texterkennung und -erkennung unterstützt Hunderte von Geschäftsszenarien innerhalb von Tencent, wie z. B. Tencent-Werbung, WeChat, QQ, Tencent Cloud, Tencent Video und Tencent-Informationsflussprodukte.

Das obige ist der detaillierte Inhalt vonDas Tencent OCR-Team gewinnt vier Meisterschaften im ICDAR-Wettbewerb. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:jiqizhixin.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage