5. Juli 2024, Shanghai – SenseTime, ein strategischer Partner der 2024 World Artificial Intelligence Conference und High-Level Conference on Artificial Intelligence Global Governance (WAIC 2024), veranstaltete das Artificial Intelligence Forum „Love Without Boundaries·Xiang Xinli“ und veröffentlichte es Das erste inländische A-WYSIWYG-Modell ist „jeden Tag 5o neu“, und das interaktive Erlebnis wird mit GPT-4o verglichen, wodurch ein neues KI-Interaktionsmodell realisiert wird. Durch die Integration modalübergreifender Informationen, die auf verschiedenen Formen wie Ton, Text, Bild und Video basieren, bringt das erste WYSIWYG-Modell des Landes „Ririxin 5o“ ein neues KI-Interaktionsmodell, d. h. Echtzeit-Streaming multimodaler Interaktion. Dieses innovative Interaktionsmodell wurde auch allen am Tatort vorgeführt – das Personal begrüßte zunächst nur „RiRiXin5o“, dann erkannte es automatisch die Worte auf dem Abzeichenband, das das Personal trug, und urteilte, dass es sich bei der Szene um den Veranstaltungsort der Welt handelte Künstliche Intelligenz Konferenz, und sagte, dass man an diesem Ort „gut lernen“ kann.
Dann brachten die Mitarbeiter eine süße Welpenpuppe mit. „RiRiXin5o“ beschrieb genau das Aussehen, den Ausdruck und die wichtige Kleidung des Welpen – einer trug einen weißen Hut mit dem aufgedruckten SenseTime-Logo, sehr süß. Das Heimpublikum stellte sich in einer Reihe auf. Schwieriger: Öffnen Sie einfach eine beliebige Seite eines Buches. „RiRiXin5o“ kann sie automatisch einführen. Es handelt sich nicht um eine einfache OCR-Erkennung von Text, sondern um eine leicht verständliche Zusammenfassung von Bildern und Texten kann im Handumdrehen abgeschlossen werden, wodurch wirklich eine Echtzeit-Interaktion erreicht wird. Die Mitarbeiter zeigten auch sofort ihre „Zeichenfähigkeiten“ und zeichneten ein einfaches kleines Häschen, das „RiRiXin5o“ sagte, es sei süß, und dann beruhigte sich das Lächeln Gesichtsausdruck, und das Personal nahm eine weitere Änderung vor, um den Mund zu vergrößern und eine Zunge hinzuzufügen. Nachdem „RiRiXin5o“ es gesehen hatte, sagte er sofort, dass der Gesichtsausdruck viel glücklicher sei.Sie können zuhören, lesen und Themen finden, genau wie eine echte Person, die chattet. Dieser Interaktionsmodus eignet sich besonders für Anwendungen wie Echtzeitdialog und Spracherkennung. Er verfügt über eine starke Anpassungsfähigkeit an mehrere Aufgaben und kann auf natürliche Weise mehrere Aufgaben bewältigen Die Fähigkeit, ein mit GPT-4o vergleichbares interaktives Erlebnis zu erreichen, ist auf die umfassende Verbesserung der Fähigkeiten des Basismodells „RiRiXin 5.5“ zurückzuführen.
Das im April dieses Jahres veröffentlichte „RiRiXin 5.0“ ist das erste inländische Großmodell, das den GPT-4 Turbo testet. In etwas mehr als zwei Monaten hat das neue „RiRiXin 5.5“-System zahlreiche Verbesserungen erfahren um durchschnittlich 30 % im Vergleich zu „Ririxin 5.0“, und das mathematische Denken, die Englischkenntnisse und die Befehlsfolgefähigkeiten werden deutlich verbessert. Der interaktive Effekt und mehrere Kernindikatoren haben den Benchmark GPT-4o erreicht.
„Ririxin 5.5“ verwendet eine hybride Expertenarchitektur für die Zusammenarbeit zwischen Gerät und Cloud, um die Zusammenarbeit zwischen Cloud-Edge und Gerät zu maximieren und die Argumentationskosten zu senken. Das Modelltraining basiert auf mehr als 10 TB Token hochwertiger Trainingsdaten, darunter eine große Menge Synthetische Denkkettendaten, um die Denkfähigkeit zu verbessern. Um mehr Unternehmensbenutzern den Zugriff und die Nutzung der leistungsstarken Funktionen des „RiRiXin“-Großmodellsystems zu einem niedrigen Schwellenwert zu ermöglichen, hat SenseTime kürzlich den „Large Model 0 Yuan Go“-Plan gestartet.Das obige ist der detaillierte Inhalt vonDer Erste im Land! SenseTime veröffentlicht „Ririxin 5o', multimodales Echtzeit-Streaming-Interaktions-Benchmarking GPT-4o. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!