Am 16. August veröffentlichte die China Academy of Information and Communications Technology die erste Runde der Bewertungsergebnisse der intelligenten Dokumentenverarbeitung auf dem Trustworthy AI Summit. Die Document-Intelligence-Plattform der Alibaba Damo Academy schnitt gut ab und wurde zum ersten Stapel von Dokumenten im Land um KI-Produkte mit der Bezeichnung „Trusted AI Certification“ zu erhalten. Dokumenten-KI kann verschiedene komplexe Dokumente wie Rechnungen, Verträge, Formulare usw. identifizieren und verstehen. Sie gilt als eine der äußerst schwierigen Technologien in der Branche. Die Alibaba DAMO Academy hat einen vollständigen Technologie-Stack aufgebaut und ist weiterhin führend in der Branche.
Die China Academy of Information and Communications Technology begann 2018 mit dem Aufbau eines „Trusted AI“-Bewertungssystems und hat sich nach und nach zu einem maßgeblichen inländischen Bewertungssystem für künstliche Intelligenz entwickelt, das drei Kategorien abdeckt: Produktservicefähigkeiten, Anwendungsreife und glaubwürdige Risiken. In diesem Jahr startete die China Academy of Information and Communications Technology zum ersten Mal eine Bewertung für Intelligent Document Processing (IDP). Durch eine umfassende Bewertung von mehr als 100 Schlüsselindikatoren erhielt Damo Academy Document AI die höchste technische Bewertung der Stufe 5 Fähigkeiten, Produktfähigkeiten und Anwendungsfähigkeiten, hervorragende Leistung. Die Akademie für Informations- und Kommunikationstechnologie wies darauf hin, dass die Dokumenten-KI der Damo Academy über vollständige Funktionen, umfangreiche Szenarien, eine breite Branchenabdeckung, hohe Genauigkeit und allgemein hohe Akzeptanz verfügt.
Berichten zufolge ist Document AI ein weiteres Upgrade der OCR-Technologie (Optical Character Recognition). Herkömmliche OCR zielt hauptsächlich auf die Texterkennung in festen Formaten ab und ist in komplexen Situationen nur schwer zu bewältigen. Document AI kann verschiedene zufällige Layouts analysieren, hierarchische und strukturelle Beziehungen in Dokumenten identifizieren und sogar komplexe Tabellen verstehen ... Aufgrund der Komplexität und Vielfalt der Aufgaben erfordert Document AI eine tiefe Integration von natürlicher Sprachverarbeitung und Computer Vision und hat dies schon immer getan gilt als eine der schwierigsten Technologien der Branche.
Die Alibaba DAMO Academy übernahm bereits 2019 die Führung beim Vorschlag einer multimodalen Lösung zur Extraktion von Dokumentinformationen auf Basis von Diagrammmodellen und leitete damit die Entwicklungsrichtung der Branche ein hat nun einen kompletten Dokumenten-KI-Technologie-Stack aufgebaut, der neben der Kerntechnologie für die Dokumentenverarbeitung auch zugrunde liegende elektronische Dokumentenanalyse-, OCR- und selbstlernende Plattformen umfasst. Gleichzeitig erforscht die DAMO Academy auch die nächste Generation der Document-Intelligence-Technologie und hat das multimodale Dokumentverständnismodell Bi-VLDoc vorgeschlagen. Es hat erstmals eine bidirektionale Vision-Sprache durch übergreifende Überwachung verschiedener Systeme erreicht Modale Signale und erzwungene gemischte Aufmerksamkeit verschiedener Modalitäten, wodurch die beste Modellleistung (SOTA) in vier repräsentativen Dokumentenverständnis-Datensätzen der Branche erreicht wird.
DAMO Academy hat ein neues SOTA für vier repräsentative Datensätze erstellt
#🎜🎜 #Es ist verstanden dass Damo Academy Document AI die automatische Identifizierung, Extraktion, Klassifizierung, Integration und Überprüfung verschiedener Dokumentinhalte wie Verträge, Rechnungen, Kontoauszüge usw. unterstützt. Es wird häufig in der Zoll-, Rechts-, Medizin-, Finanz- und anderen Industriezweigen eingesetzt und ist es auch ein wichtiges Werkzeug für die Unternehmensdigitalisierung. Nehmen wir als Beispiel das Zolldeklarationsgeschäft, das in fünf großen Hafengebieten, darunter Shanghai und Ningbo, implementiert wurde, sodass das Zolldeklarationspersonal von Unternehmen komplizierte manuelle Eingaben vermeiden kann. Das entsprechende System ist seit mehr als zwei Jahren in Betrieb und hat mehr als zwei Millionen Zollanmeldungen verarbeitet, was die Effizienz für Zollanmeldungsunternehmen um das 3,5-fache steigert. Darüber hinaus wird die Dokumenten-KI der DAMO Academy auch bei der Braille-Erkennung eingesetzt, um Braille in chinesische Schriftzeichen und Zahlen zu übersetzen. Sie wurde in Blindenschulen in der Provinz Zhejiang implementiert, um eine integrative Bildung zu ermöglichen.KI generiert automatisch Zollanmeldung
# 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜#AI Übersetzter Braille Mathematikpapier#🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜 🎜#
Berichten zufolge konzentriert sich Alibaba weiterhin auf Spitzenforschung im Bereich der künstlichen Intelligenz, einschließlich Dokumenten-KI. Der neueste „Cloud AI Developer Service Key Capabilities Report“ von Gartner, einer renommierten internationalen Forschungsorganisation, zeigt, dass Alibaba im Bereich Sprach-KI weltweit an zweiter Stelle steht und damit einen Rekord für die besten Ergebnisse unter chinesischen Unternehmen aufstellt.Das obige ist der detaillierte Inhalt vonDie erste Charge der Alibaba Damo Academy Document AI des Landes hat die maßgebliche Bewertung der Academy of Information and Communications Technology bestanden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!