As large model manufacturers such as Meta and OpenAI are making intensive efforts, Google has also announced a major update -
From now on, the Gemini chat robot will be driven by Gemini 1.5 Flash.
Compared with the previous version, the window length has been increased to 4 times, and the response speed is also faster.
According to Google’s introduction, the 1.5 Flash model behind the new version of the chatbot focuses on lightweighting and speed improvement.
Of course, the quality of model reply has also been improved, and the context window has been increased from the original (based on 1.0 Pro) 8k to 32k.
In addition, the new version of the chatbot also adds a "fact checking" function, which can detect whether the generated content is true with one click, reducing the adverse effects of model illusions.
Some netizens lamented that Google’s performance was really strong today, first, and then Gemini also released an update.
Some people have turned on the wishing mode and look forward to adding AI functions to Google Scholar academic search.
Longer context window and faster speed
The main content of this update is to change the model behind the free version from 1.0Pro to 1.5 Flash.
Gemini 1.5 Flash was first unveiled at the Google I/O developer conference in May.
Through the "distillation" of training data, Gemini 1.5 Flash achieves higher generation quality with a lighter size.
And the small size also makes the model faster and more efficient, and it also supports multi-modal reasoning.
Google introduced that after this model change, the chatbot will become faster, and the context window of the old version of 8k will be expanded to 32k.
However, 1.5 Flash itself supports 1 million contexts. This reduction is indeed not small, but it is a free version after all.
In addition to the model upgrade, another important update is the fact-checking function.
In the latest Gemini chatbot, you can use this function to check the output content with one click.
The system will search and compare the content in the output on Google, and then mark the matches and discrepancies.
Some netizens commented that when they saw OpenAI launching GPT-4o mini, they felt that it was only a matter of time before Google launched the new version.
Indeed, not only OpenAI and Google, but also Meta, Mistral and other manufacturers that are making large models have been making frequent moves recently.
As for the performance of the model, this netizen also said that he has tried 1.0 Pro and 1.5 Flash. The performance of the two is almost the same, and the 1.5 Flash is faster.
So, this wave of operations by Google is also adapted to the recent trend of "model lightweighting" to a certain extent.
So, how is the performance of the Gemini chatbot after replacing 1.5 Flash?
Check model output with one click
Qubit performed a simple test on the new version of the chatbot.
First, let’s take a look at the fact-checking function of this update. The first step is to ask a question just like a normal conversation, and Gemini will answer it normally.
You can see that there is a Google logo under the answer. This is the button for the fact-checking function.
After clicking, the system will automatically search on Google and then compare it with its own output.
Nachdem der Vergleich abgeschlossen ist, kann die Quelle durchsucht werden und der passende Inhalt wird grün hervorgehoben. Bei Abweichungen von den Suchergebnissen wird dieser mit einem hellroten Hintergrund markiert.
Klicken Sie auf die markierte Stelle, um den Inhaltslink anzuzeigen, den Gemini zum Vergleich verwendet.
Es ist zu beachten, dass eine solche Anmerkung nicht bedeutet, dass der Ausgabeinhalt falsch ist. In den hier zitierten Vergleichsdaten ist beispielsweise Tom Cruises Mutter Marry Lee South.
Aufgrund von Textkonflikten wurde dieser Teil der Antwort vom System markiert, tatsächlich handelt es sich jedoch um korrekte Antworten.
Da dieser Faktencheck auf Internetrecherchen beruht, ist auch die Qualität der Vergleichsinformationen uneinheitlich und möglicherweise nicht 100 % genau.
Zum Beispiel gab Gemini in Bezug auf den klassischen Witz „Lin Daiyu entwurzelt eine Trauerweide“ eindeutig die richtige Antwort, wurde aber rot markiert.
Wenn man sich die zitierten Vergleichsinformationen noch einmal ansieht, ist es tatsächlich etwas schwierig, sie zu dehnen.
Die Funktion dieser Funktion besteht also hauptsächlich darin, eine bequemere Überprüfungsmethode bereitzustellen. Wie diese jedoch akzeptiert wird, hängt von der Überprüfung durch mehrere Parteien und dem eigenen Urteil des Benutzers ab.
Außerdem haben wir in Bezug auf das Modell selbst auch einige in letzter Zeit populäre Probleme getestet, die oft dazu führen, dass große Modelle an die Wand stoßen.
Zum Beispiel hat Gemini sogar zwei Zahlen in Geld umgewandelt, aber nach einer Operation war das Endergebnis ... falsch.
Seit diese Frage entdeckt wurde, ob dies die zweitwitzigste Antwort ist, traut sich kein Model mehr, den ersten Platz zu beanspruchen.
Auch ich habe am Anfang eine falsche Antwort gegeben, diese aber später im Analyseprozess korrigiert.
Aber wenn Sie Fragen auf Englisch stellen, besteht immer noch Hoffnung, dass Sie die richtige Antwort bekommen.
Noch eine Frage, diese Antwort kann tatsächlich die Buchstaben aus dem Chinesischen zählen ... Es verwirrt die Leute auch und liegt überhaupt nicht im Rahmen der Vorhersage.
Was schließlich die in diesem Update erwähnte Geschwindigkeitsverbesserung betrifft, haben Tests ergeben, dass Gemini 1.5 Flash weniger Zeit für die Ausgabe des ersten Wortes benötigt als Claude 3 Haiku. Der Unterschied in den nachfolgenden Geschwindigkeiten ist mit bloßem Auge nicht sehr offensichtlich.
Das Obige ist die Leistung von Gemini 1.5 Flash in Chatbots. Interessierte Leser können es selbst ausprobieren.
Referenzlink:
[ 1 ] https://blog.google/products/gemini/google-gemini-new-features-july-2024/
[ 2 ] https://x.com/GeminiApp/status /1816512086232731696
Das obige ist der detaillierte Inhalt vonGroße Modellhersteller haben sich intensiv darum gekümmert, und auch Google hat ein „Band' eröffnet: Der Gemini-Chat-Roboter wurde durch ein neues Modell ersetzt und kann den ausgegebenen Inhalt auch mit einem Klick überprüfen.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!