Am 22. August 2023 fand in Shanghai die DingTalk Ecological Conference „Ride on the Back of AI“ statt. Auf dem speziellen Unterforum für digitale Mitarbeiter hielt Zhao Jiayu, Vizepräsident von DingTalk und Leiter der Audio- und Video-Geschäftseinheit, eine Grundsatzrede, in der er die Fortschritte und Anwendungen von DingTalk-Audio und -Video in der Intelligenz sowie das Video vorstellte Konferenzbereich basierend auf DingTalk AI PaaS Offene Aussichten für die Zukunft
Zhao Jiayu erwähnte, dass DingTalk im April angekündigt hatte, große Modelle vollständig zu integrieren, um die intelligente Rekonstruktion abzuschließen. Da die Integration von künstlicher Intelligenz sowie Audio und Video immer tiefgreifender wird, hat DingTalk Conference auch viele innovative Anwendungen realisiert. Zusätzlich zur bisherigen Echtzeitübersetzung, Untertiteltranskription und intelligenten Zusammenfassung wurden dieses Mal drei neue Funktionen eingeführt: digitaler Avatar statt Teilnahme an Besprechungen, natürliche Sprachsteuerung des Besprechungsbetriebs und virtueller Vincent-Hintergrund. Unter anderem kann der digitale Klon den Benutzer ersetzen, um an der Besprechung teilzunehmen, wenn die Besprechungszeit in Konflikt steht, und er kann relevante Besprechungsinformationen und Schlussfolgerungen in Echtzeit synchronisieren
Er sagte, dass DingTalk Audio and Video in Zukunft hofft, mehr Bereiche für ökologische Partner zu öffnen, um gemeinsam umfangreiche und wertvolle Anwendungen zu entwickeln, um die Benutzererfahrung und Effizienz zu verbessern. Gleichzeitig plant DingTalk auch, das Audio- und Video-SDK in die Anwendungen ökologischer Partner einzubetten, um gemeinsam hochwertige, benutzerfreundliche Audio- und Videolösungen zu entwickeln, die den Anforderungen verschiedener Branchen und Szenarien gerecht werden.
Das Folgende ist der vollständige Text der Rede von Zhao Jiayu:
Im vergangenen Jahr waren Erfahrung und Intelligenz die Schlüsselwörter der DingTalk Audio- und Videoabteilung.
Letztes Jahr haben wir ein engagiertes Team zur umfassenden Optimierung von DingTalk-Meetings zusammengestellt und sowohl intern als auch extern viele Verbesserungen vorgenommen. Jetzt ist die Schnittstelleninteraktion von DingTalk Meeting schöner, bequemer und immersiver. Gleichzeitig haben wir im Hinblick auf die zugrunde liegende technische Architektur die Sammlung, Wiedergabe, Kodierung und Dekodierung, Netzwerk und Server umfassend optimiert. Insbesondere in Bezug auf Audio und Video besteht unsere grundlegendste Anforderung darin, ein reibungsloses Meeting abzuhalten und die Stimme des anderen Teilnehmers zu hören. Deshalb haben wir den Audioalgorithmus und die Aspekte zum Schutz vor schwachen Netzwerken verbessert. Ich hoffe, Sie können unsere DingTalk-Treffen häufiger nutzen
Was die Intelligenz betrifft, war der Bereich der Videokonferenzen vor dieser großen Verbesserung sehr eng mit der künstlichen Intelligenz verknüpft. Die Technologie der künstlichen Intelligenz wurde in Audioalgorithmen und Videoalgorithmen integriert. Zu den Anwendungen der künstlichen Intelligenz im Zusammenhang mit Videoalgorithmen gehören beispielsweise Verschönerung und virtuelle Hintergründe, die sehr bekannte Szenenanwendungen sind. Durch die Kombination künstlicher Intelligenz erzielt der Audioalgorithmus außerdem bessere Rauschunterdrückungseffekte. Derzeit unterstützt DingTalk Meeting die Eliminierung von mehr als 300 gängigen Geräuschen, wie z. B. Autohupen und Tastaturklopfen, sodass Benutzer Meetings konzentrierter durchführen können
Eine weitere häufige Anforderung, die wir bei Besprechungen stellen, sind Untertitel, bei denen es sich im Wesentlichen um die Fähigkeit künstlicher Intelligenz handelt. Jetzt ist DingTalk Conference vollständig in Alibaba Tongyi Listening integriert, unterstützt die Übersetzung zwischen Chinesisch, Englisch und Japanisch und ermöglicht Transkription und Übersetzung in Echtzeit. Darüber hinaus gibt es auch eine intelligente Navigationsfunktion. Wenn während einer Besprechung in einem Konferenzraum Online-Kollegen an der Diskussion teilnehmen, sitzen Sie möglicherweise zu weit weg, um klar zu hören, oder der andere Teilnehmer kann Sie möglicherweise nicht hören. Unser Hummingbird Audio Lab kombiniert künstliche Intelligenz und originale Differential-Array-Technologie, um eine Tonaufnahme in einer Entfernung von bis zu 10 Metern von einem einzelnen Konferenzgerät zu erreichen. Wenn der Sprecher spricht, unterstützt es die präzise Positionierung der Tonquelle, Echtzeitverfolgung und das Vergrößern seines Avatars, wodurch jeder Sprecher im Mittelpunkt steht und ein besseres Gesprächserlebnis entsteht
Mit Beginn der Ära der großen Modelle haben wir relevante Untersuchungen durchgeführt und hoffen, große Modelle verwenden zu können, um DingTalk-Meetings nachzubilden. Heute hat DingTalk eine neue intelligente KI-PaaS-Basis eingeführt und diese für Ökosystempartner geöffnet. Im DingTalk-Meeting haben wir AI PaaS genutzt, um viele interessante Funktionen umzusetzen
Umgeschriebener Inhalt: Erstens ist es eine neue Möglichkeit, Besprechungen durch digitale Avatare zu ersetzen. Am Arbeitsplatz sind die Menschen oft mit einer großen Anzahl an Besprechungen konfrontiert, und jetzt nutzen wir intelligente Dokumente, um jedem bei der Lösung dieses Problems zu helfen. Wir haben auch einige Methoden ausprobiert, um Benutzern die Möglichkeit digitaler Avatare zu bieten. Wenn Sie einen Besprechungskonflikt haben oder für eine bestimmte Besprechung nicht sehr relevant sind, können Sie Ihren digitalen Doppelgänger bitten, an Ihrer Stelle an der Besprechung teilzunehmen. Während des Meetings können Sie über das Dialogfeld von DingTalk Magic Wand aktiv einige Aufgaben festlegen, beispielsweise die Fokussierung auf bestimmte Themen. Wenn jemand dieses Thema bespricht, benachrichtigt Sie die KI automatisch und teilt Ihnen relevante Inhalte mit. Sie können den digitalen Avatar auch so einstellen, dass er Ihnen alle paar Minuten eine Besprechungszusammenfassung sendet, und Sie können auch aktiv mit dem digitalen Avatar sprechen, um verschiedene Informationen zu erfahren, z. B. wer an der Besprechung teilnimmt und ob es Streitigkeiten gibt. Nach dem Meeting sendet Ihnen der digitale Klon automatisch die Besprechungszusammenfassung
Der neu geschriebene Inhalt lautet wie folgt: Zweitens können wir natürliche Sprache zur intelligenten Steuerung von Besprechungen verwenden. Viele Nutzer bemängelten in der Vergangenheit, dass DingTalk zu viele Funktionen habe und der Eingang schwer zu finden sei. Auch DingTalk Conference steht vor diesem Problem. Obwohl wir viele Vereinfachungen vorgenommen haben, ist die Hemmschwelle für die Nutzung für einige Benutzer immer noch etwas hoch. Heute haben wir die Funktionsabläufe durch den intelligenten Assistenten im DingTalk Magic Wand vereinfacht. Sie brauchen nur in natürlicher Sprache zu fragen, und die künstliche Intelligenz erkennt automatisch die Absicht und hilft Ihnen, den Vorgang abzuschließen. Wenn beispielsweise zu viele Personen in einer Besprechung sind und jemand versehentlich das Mikrofon einschaltet, kann es für Sie schwierig sein, diese Person zu finden und sie stummzuschalten, aber jetzt können Sie die KI anweisen, die sprechende Person stummzuschalten . Wenn Sie außerdem Personen zur Teilnahme an der Besprechung einladen müssen, können Sie die Einladung auch direkt eingeben, ohne sich Gedanken darüber machen zu müssen, wo sich der Eingang befindet. Mit diesen Funktionen erleichtern wir die Durchführung und Verwaltung von Meetings
Der Inhalt, der neu geschrieben werden muss, ist: Der dritte Punkt betrifft Vincents virtuellen Hintergrund. Virtuelle Hintergründe waren bei den Nutzern schon immer beliebt, vor allem in den letzten Jahren hatten wir jungen Leute viel Spaß, manchmal nahmen wir an Kursen im „Weltraumklassenzimmer“ und manchmal an Kursen in der „Prärie“ teil. Wir verwenden in unserer täglichen Arbeit auch virtuelle Hintergründe, wodurch die Peinlichkeit überladener Hintergründe wirksam vermieden werden kann. Früher mussten wir zusätzlich zu den vorhandenen Vorlagenbildern auch die Bilder selbst suchen und herunterladen, aber das ist nicht mehr notwendig. Wir können durch Wensheng-Bilder automatisch virtuelle Hintergründe generieren und so unserer Fantasie völlig freien Lauf lassen
DingTalk Conference wird nach und nach Anwendungen über AI PaaS öffnen, um Partner bei der Aktualisierung ihrer Szenarien zu unterstützen. Zukünftig werden mehr ökologische Produkte in DingTalk-Meetings eingebettet, etwa Interviews, Whiteboards und andere Anwendungen. Wir arbeiten mit Recruiting-Partnern zusammen, um einen Interviewassistenten zu entwickeln, der Sie mit Lebenslaufinhalten und Kommunikationsinformationen in Echtzeit beim Interviewprozess unterstützen kann. Wir hoffen, eine gute Erfahrung und Offenheit bieten zu können und arbeiten mit ökologischen Partnern zusammen, um Benutzern im intelligenten Zeitalter interessantere und wertvollere Szenarioanwendungen anzubieten
Das obige ist der detaillierte Inhalt vonDie DingTalk-Konferenz führt KI-Funktionen ein: digitale Avatare, virtuelle Hintergründe zur Konversationsgenerierung und andere neu aktualisierte Funktionen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!