Der mit Spannung erwartete Gegenangriff von Google steht bevor.
Jetzt fügt die Google-Suche endlich die KI-Konversationsfunktion hinzu und der Warteschlangenkanal ist geöffnet.
Natürlich ist das nur der erste Schritt.
Das Große kommt noch:
Das neue große Sprachmodell PaLM 2 wird offiziell vorgestellt und Google behauptet, dass es GPT-4 in einigen Aufgaben übertrifft.
Die Fähigkeiten von Bard wurden umfassend aktualisiert, Sie müssen nicht in der Schlange stehen und neue Sprachen werden unterstützt.
Die Google-Version des AI Office Assistant wurde ebenfalls veröffentlicht und wird die erste sein, die in Gmail erscheint.
Google Cloud hat außerdem mehrere grundlegende Großmodelle auf den Markt gebracht, um weitere generative KI-Dienste für die Branche bereitzustellen ...
Auf der letzten I/O-Entwicklerkonferenz war Googles große Ankündigung wirklich schockierend.
Einige Internetnutzer sagten direkt:
Der KI-Krieg ist in vollem Gange.
Einige Leute sagten sogar:
Jetzt bereue ich es, für ChatGPT bezahlt zu haben.
Nach einer Pressekonferenz stieg der Aktienkurs von Google um mehr als 4 %.
Es besteht kein Zweifel, dass PaLM 2 die höchste Priorität der diesjährigen I/O-Konferenz hat, und Pichai selbst hat es vorgestellt.
Das aktuelle Bard und mehr als 25 Google AI-Produkte und -Funktionen werden jetzt von PaLM 2 als zugrunde liegende Technologie unterstützt.
Als derzeit fortschrittlichstes großes Modell von Google basiert PaLM 2 auf der Pathways-Architektur und ist eine aktualisierte Version von PaLM, die auf TPU v4 über JAX basiert.
Berichten zufolge wurde PaLM 2 in mehr als 100 Sprachen geschult, wodurch es besser im Sprachverständnis, in der Generierung und Übersetzung von Sprachen ist und besser im gesunden Menschenverstand und in der mathematischen Logikanalyse ist.
Der Datensatz von PaLM 2 enthält eine große Anzahl von Artikeln und Webseiten, die viele mathematische Ausdrücke abdecken, sagte Google. Nach dem Training anhand dieser Daten kann PaLM 2 problemlos mathematische Probleme lösen und sogar Diagramme erstellen.
In Bezug auf die Programmierung unterstützt PaLM 2 jetzt 20 Programmiersprachen, wie Python, JavaScript und andere gängige Sprachen sowie Prolog, Fortran und Verilog.
Dieses Mal hat Google PaLM 2 in vier verschiedenen Größen herausgebracht.
Sie verwenden verschiedene Tiere, um die Skala darzustellen. Der kleinste ist der „Gecko“ und der größte ist das „Einhorn“.
Die „Gecko“-Version ist sehr leichtgewichtig und kann schnell auf Mobilgeräten ausgeführt werden, auch offline kann sie 20 Token pro Sekunde verarbeiten.
DeepMind-Vizepräsident sagte auf der Pressekonferenz vor der I/O-Konferenz:
Wir haben festgestellt, dass größere Modelle nicht immer besser sind, weshalb wir uns entschieden haben, eine Reihe von Modellen unterschiedlicher Größe anzubieten.
Das bedeutet, dass die Feinabstimmung von PaLM 2 einfacher wird, sodass es mehr Produkte und Anwendungen unterstützen kann.
Auf der I/O-Konferenz gab Google bekannt, dass mittlerweile mehr als 25 Produkte und Anwendungen die Funktionen von PaLM 2 nutzen.
Die spezifische Ausdrucksform ist Duet AI.
Es kann als Benchmark-Produkt von Microsoft 365 Copilot verstanden werden, einem KI-Assistenten, der in verschiedene Bürosoftware eingebettet werden kann.
Google hat auf der Pressekonferenz die Fähigkeiten von Duet AI in Gmail, Google Docs und Google Sheets demonstriert.
Einschließlich der Ergänzung von E-Mail-Inhalten nach Aufforderungen, der Erstellung von PPT, der Erstellung von Bildmaterialien nach Aufforderungen, der Erstellung von Formularen mit einem Klick usw.
Ebenso kann dieser KI-Assistent auch Programmierhilfe leisten. Basierend auf Google Cloud kann es Codeblöcke in Echtzeit empfehlen und korrigieren sowie Programmierfragen im Dialog beantworten. Derzeit werden Go, JavaScript, Python und SQL unterstützt.
Darüber hinaus hat Google auf Basis von PaLM 2 auch einige große Modelle im professionellen Bereich auf den Markt gebracht.
Das Gesundheitsteam von Google hat Med-PaLM 2 entwickelt. Es soll das erste groß angelegte Sprachmodell sein, das bei der US-amerikanischen medizinischen Zulassungsprüfung das Expertenniveau erreicht hat, und es kann eine Vielzahl medizinischer Fragen beantworten.
Google versucht derzeit, seine multimodalen Fähigkeiten zu erweitern, etwa durch die autonome Untersuchung von Röntgenbildern und die Erstellung von Diagnosen. Dieses Modell wird später in diesem Sommer einer kleinen Gruppe von Google Cloud-Nutzern zur Verfügung stehen.
Ein weiteres professionelles Großmodell ist Sec-PaLM 2.
Dies ist ein umfangreiches Modell zur Aufrechterhaltung der Netzwerksicherheit. Es kann potenzielle bösartige Skripte analysieren und interpretieren und die Gefahren von Skripten erkennen.
Nachdem wir die herausragenden Fähigkeiten von PaLM 2 demonstriert haben, ist es an der Zeit, darüber zu sprechen, wie man es für den Einsatz öffnet.
Google sagte, dass PaLM 2 jetzt über die PaLM API-Schnittstelle, Firebase und Colab verfügbar ist.
Bard, das mit ChatGPT verglichen wird, hat endlich die Testwarteschlange abgeschafft und ist in über 180 Ländern und Regionen auf der ganzen Welt vollständig geöffnet.
Neuer Dunkelmodus, von Programmierern hoch gelobt: (manueller Hundekopf)
Bard hat die Funktion der direkten Konversation auf Japanisch und Koreanisch hinzugefügt und den Zugriffsbereich über Englisch hinaus erweitert. Google kündigte an, bald 40 Sprachversionen hinzuzufügen, darunter auch Chinesisch.
Da Bard ab heute vollständig mit PaLM 2 verbunden sein wird, wurden auch seine Programmier- und Argumentationsfunktionen erheblich verbessert und die Codegenerierung, das Debuggen und die Interpretation sind professioneller (von Programmierern anerkannt).
Wenn Sie es bitten, mit Python einen Schachkameradzug zu schreiben, der auf andere Codes verweist, werden Ihnen relevante Links angezeigt.
Sie können weitere Fragen zu einer Funktion stellen, deren Code Sie nicht verstehen, sie fragen, ob sie verbessert werden kann, oder sie bitten, alles in einem Codeblock zusammenzuführen.
Das Überraschendste ist jedoch die Hinzufügung einer Ein-Klick-Importfunktion als Reaktion auf Anfragen von Entwicklern.
Jetzt können Sie von Bard generierten Code direkt nach Colab exportieren.
Zusätzlich zum Code können alle Inhalte, die Sie mit Bard generieren, wie E-Mail-Entwürfe, Formulare usw., auch direkt in Gmail, Docs und Sheets gezogen werden.
Übrigens unterstützt Bard jetzt auch Bilder in seinen Antworten. Das Bequemste, was man nach Reiseführern fragen kann:
Zusätzlich zur Antwort mit Bildern können Sie ihm auch direkt Bilder zusenden, z. B. ein Foto von zwei Hunden hochladen, und sich von ihm einige interessante Geschichten ausdenken lassen:
Diese Funktion wird von Google Lens unterstützt (einer KI-Anwendung, mit der Maschinen lernen können, „durch das Betrachten von Bildern zu sprechen“).
Neben Google Lens sind auch viele Google-eigene Anwendungsfunktionen wie Docs, Drive, Gmail und Maps in Bard integriert.
In Bards Antwort können Sie beispielsweise direkt Google Maps verwenden, um die geografischen Standorte mehrerer Universitäten zu überprüfen:
Es fühlt sich so an, als ob Sie jetzt verschiedene Google-Produkte verwenden müssen und nur die Verwendung von Bard ausreicht.
Zusätzlich zu seiner eigenen Anwendung hat Bard dieses Mal auch Adobe Firefly verschoben, und verschiedene urheberrechtlich geschützte kreative Bilder können durch Dialoge „an Ihren Fingerspitzen“ verfügbar sein:
Tausende Anrufe, Google-Suche Die Fähigkeit Der KI-Dialog ist endlich möglich.
„Ist es für eine Familie mit einem Kind unter 3 Jahren und einem Hund besser, in den Bryce Canyon oder den Arches-Nationalpark zu gehen?“
Diese Frage müssen Sie möglicherweise für sich selbst beiseite legen. Teilen Sie sie in verschiedene Teile auf Stellen Sie kleine Fragen und nutzen Sie Suchmaschinen, um eine große Menge an Informationen zu sortieren, um schließlich die Antwort zu finden.
Jetzt ermöglicht Ihnen Google, dies in einem Schritt zu tun.
Wie im Bild gezeigt, hat die Google-Suche die gefundenen Antworten nicht einfach verschoben, sondern die beiden Faktoren Kinder und Hunde berücksichtigt, um eine kompilierte Antwort zu geben:
Es gibt zwei Bryce Canyons Der Hund -Friendly Loop ist auch sehr kinderwagenfreundlich; Haustiere sind auf den meisten Abschnitten des Weges nicht erlaubt.
Jeder Satz verfügt über einen spezifischen Basislink zum Anzeigen:
Darüber hinaus werden auch Strategielinks angezeigt, die von Internetnutzern auf verschiedenen Websites gepostet wurden.
Das Wichtigste ist, dass Sie weitere Konversationsfragen zu den Antworten stellen können, indem Sie auf die Schaltfläche „Nachfrage stellen“ klicken.
Auch das Einkaufen mit der neuen Google-Suche macht viel Spaß, da sie angeblich dabei hilft, schnell rationale Kaufentscheidungen zu treffen.
Wenn Sie beispielsweise ein „Fahrrad für eine 5-Meilen-Bergfahrt“ suchen, werden Ihnen zunächst die wichtigen Faktoren angezeigt, die Sie vor der Auswahl berücksichtigen sollten, wie zum Beispiel:
Schauen Sie sich das Design an: Elektrofahrrad, Rennrad, Hybridfahrrad Fahrrad usw. Geeignet zum Pendeln;
Zweitens, schauen Sie sich den Motor und die Batterie an, und drittens, schauen Sie sich die Federung an, um Stöße zu absorbieren. Das Pendeln auf bergigen Straßen erfordert den Umgang mit den Auswirkungen von Rissen und Unebenheiten.
Dann empfehlen wir Ihnen ein passendes Auto. Bei der Empfehlung stellen wir Ihnen auch umfassende Informationen wie konkrete Produktbeschreibungen, aktuelle Bewertungen, Preise und Bilder zur Verfügung.
Sie können auch weitere Fragen stellen, z. B. nur ein rotes Elektrofahrrad, und die Antwort wird dadurch weiter optimiert.
Diese Funktion wird von Googles Einkaufsvergleichsprodukt Shopping Graph unterstützt, das Produktlisten aus aller Welt sammelt und kontinuierlich aktualisiert.
Es ist erwähnenswert, dass Google unverblümt erklärt hat, dass die aktualisierte KI-Suchoberfläche weiterhin Anzeigen einbetten wird, aber keine Sorge: Diese werden nur in speziellen Werbeflächen angezeigt und nicht in Ihre Suchergebnisse eingemischt.
Schließlich kann diese neue Funktion nur zum Testen in Google Search Labs angewendet werden und ist auf Nutzer in den USA beschränkt.
Auf der diesjährigen I/O-Konferenz sind auch die Inhalte von Google Cloud ein Hingucker.
Nach der Aktualisierung einer Vielzahl von KI-Funktionen hat Google drei neue große Modelle für seine Cloud-Plattform für maschinelles Lernen Vertex AI auf den Markt gebracht:
Codey: Text-to-Code, um Programmierern beim Schreiben von Code zu helfen
Imagen: Text-to-Image , hochwertige Bilder erzeugen
Chirp: Sprache-zu-Text, Kommunikation erleichtern
Die Fähigkeiten dieser drei Modelle wurden tatsächlich auf der heutigen Pressekonferenz demonstriert, wie z. B. Codegenerierung, Google Photo Intelligence Editor usw.
Auf Vertex AI sind derzeit auch die eingebetteten Text- und Bild-APIs verfügbar. Durch die Umwandlung von Text- und Bilddaten in mehrdimensionale numerische Vektoren und die Abbildung semantischer Beziehungen ermöglicht dieses Tool Entwicklern die Erstellung interessanterer Anwendungen.
Google behauptet, dass sie die ersten sind, die RLHF-Funktionen in eine End-to-End-Plattform für maschinelles Lernen in einem verwalteten Dienst integrieren. Der Vorteil besteht darin, dass Unternehmen Belohnungsmodelle schnell mit RLHF trainieren können, um Basismodelle zu verfeinern, was für die Verbesserung der Genauigkeit großer Modelle in Industrieanwendungen von entscheidender Bedeutung ist.
Zusätzlich zu den Modellen hat Google Cloud auch den A3-GPU-Supercomputer der nächsten Generation für Schulungen auf den Markt gebracht. Durch die Kombination virtueller A3-Maschinen mit Nvidia H100 kann Google Cloud einen höheren Rechendurchsatz und eine höhere Bandbreite bieten, sodass Unternehmen Modelle für maschinelles Lernen schneller entwickeln können.
Darüber hinaus brachte Google auch neue Hardwareprodukte auf den Markt, wie das erste Telefon mit Klappbildschirm zum Preis von 1.799 US-Dollar (ca. 12.000 RMB) sowie das Android 14-System mit KI-Funktionen (z. B. Vorschläge für die Beantwortung von Nachrichten). ), wir werden sie hier nicht einzeln zeigen.
Im Allgemeinen hat Google Ihnen als 15. I/O-Konferenz dieses Mal wirklich viele nützliche Informationen gebracht.
Erwähnenswert ist, dass der auf der Bühne vorgestellte Gastredner dieses Mal nicht mehr Jeff Dean ist. Er hat erst vor ein paar Tagen seinen Rang geändert.
Als repräsentativster Manager, der sich in der Vergangenheit zu Google AI geäußert hat, wo wird er in der AI 2.0-Welle stehen?
Ob Google im Bereich der großen Modelle und der KI-Suche noch aufholen kann, darf ebenfalls gespannt sein.
Sind Sie dieses Mal mit Googles Gegenangriff zufrieden?
Das obige ist der detaillierte Inhalt vonGoogle startet einen umfassenden Gegenangriff! Offiziell angekündigt, dass KI die Suche rekonstruiert, das neue Modell mit GPT-4 vergleichbar ist und Microsoft auf ChatGPT abzielt. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!