Pengeluar model besar sedang membuat usaha intensif, dan Google juga telah membuka 'volume': Robot sembang Gemini telah digantikan dengan model baharu, dan ia juga boleh menyemak kandungan output dengan satu klik.

王林
Lepaskan: 2024-07-29 20:38:41
asal
372 orang telah melayarinya

Memandangkan pengeluar model besar seperti Meta dan OpenAI sedang melakukan usaha intensif, Google juga telah mengumumkan kemas kini utama -

Mulai sekarang, robot sembang Gemini akan dipandu oleh Gemini 1.5 Flash.

Berbanding dengan versi sebelumnya, panjang tetingkap telah meningkat kepada 4 kali ganda, dan kelajuan tindak balas juga lebih pantas.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Menurut pengenalan Google, model 1.5 Flash di sebalik versi baharu chatbot memfokuskan pada pemberat ringan dan peningkatan kelajuan.

Sudah tentu, kualiti balasan model juga telah dipertingkatkan, dan tetingkap konteks telah ditingkatkan daripada asal (berdasarkan 1.0 Pro) 8k kepada 32k.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Selain itu, versi baharu chatbot juga menambah fungsi "semakan fakta", yang boleh mengesan sama ada kandungan yang dijana adalah benar dengan satu klik, mengurangkan kesan buruk ilusi model.

Sesetengah netizen mengeluh bahawa prestasi Google benar-benar kukuh hari ini, pertama, dan kemudian Gemini juga mengeluarkan kemas kini.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Sesetengah orang telah menghidupkan mod hajat dan tidak sabar-sabar untuk menambahkan fungsi AI pada carian akademik Google Scholar.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Tetingkap konteks yang lebih panjang dan kelajuan yang lebih pantas

Kandungan utama kemas kini ini adalah untuk menukar model di belakang versi percuma daripada 1.0Pro kepada 1.5 Flash.

Gemini 1.5 Flash pertama kali diperkenalkan pada persidangan pembangun Google I/O pada bulan Mei.

Melalui "penyulingan" data latihan, Gemini 1.5 Flash mencapai kualiti penjanaan yang lebih tinggi dengan saiz yang lebih ringan.

Dan saiz yang kecil juga menjadikan model lebih pantas dan cekap, dan ia juga menyokong penaakulan pelbagai mod.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Google memperkenalkan bahawa selepas perubahan model ini, chatbot akan menjadi lebih pantas, dan tetingkap konteks versi lama 8k akan dikembangkan kepada 32k.

Walau bagaimanapun, 1.5 Flash itu sendiri menyokong 1 juta konteks Pengurangan ini sememangnya bukan kecil, tetapi ia adalah versi percuma.

Selain peningkatan model, satu lagi kemas kini penting ialah fungsi semakan fakta.

Dalam chatbot Gemini terkini, anda boleh menggunakan fungsi ini untuk menyemak kandungan output dengan satu klik.

Sistem akan mencari dan membandingkan kandungan dalam output di Google, dan kemudian menandakan padanan dan percanggahan.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Sesetengah netizen mengulas bahawa apabila mereka melihat OpenAI melancarkan GPT-4o mini, mereka merasakan bahawa hanya menunggu masa sebelum Google melancarkan versi baharu.

Sememangnya, bukan sahaja OpenAI dan Google, tetapi juga Meta, Mistral dan pengeluar lain yang membuat model besar telah membuat pergerakan yang kerap baru-baru ini.

Mengenai prestasi model, netizen ini juga mengatakan bahawa dia telah mencuba 1.0 Pro dan 1.5 Flash Prestasi kedua-duanya hampir sama, dan 1.5 Flash lebih pantas.

Jadi, gelombang operasi oleh Google ini juga disesuaikan dengan trend terkini "model lightweighting" pada tahap tertentu.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Jadi, bagaimanakah prestasi chatbot Gemini selepas menggantikan 1.5 Flash?

Semak output model dengan satu klik

Qubit melakukan ujian mudah pada versi baharu chatbot.

Mula-mula, mari kita lihat fungsi semakan fakta kemas kini ini Langkah pertama ialah bertanya soalan seperti perbualan biasa, dan Gemini akan menjawabnya secara normal.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Anda boleh melihat bahawa terdapat logo Google di bawah jawapan Ini adalah butang untuk fungsi semakan fakta.

Selepas mengklik, sistem akan mencari secara automatik di Google dan kemudian membandingkannya dengan outputnya sendiri.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Selepas perbandingan selesai, sumber boleh dicari dan kandungan yang sepadan akan diserlahkan dalam warna hijau Jika terdapat sebarang percanggahan dengan hasil carian, ia akan ditanda dengan latar belakang merah muda.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Klik pada lokasi yang ditanda untuk melihat pautan kandungan yang Gemini gunakan sebagai perbandingan.

Perlu diambil perhatian bahawa anotasi sedemikian tidak bermakna kandungan output adalah salah Contohnya, dalam data perbandingan yang dipetik di sini, ibu Tom Cruise ialah Marry Lee South.

Disebabkan ketidakpadanan teks, bahagian jawapan ini ditandakan oleh sistem, tetapi sebenarnya kedua-duanya adalah jawapan yang betul.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Memandangkan semakan fakta ini bergantung pada carian Internet, kualiti maklumat perbandingan juga tidak sekata dan mungkin tidak 100% tepat.

Sebagai contoh, mengenai jenaka klasik "Lin Daiyu mencabut pohon willow yang menangis", Gemini jelas memberikan jawapan yang betul, tetapi ditandakan merah.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Melihat kepada maklumat perbandingan yang dipetik semula, memang agak sukar untuk dipanjangkan.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Jadi fungsi fungsi ini adalah untuk menyediakan kaedah pengesahan yang lebih mudah, tetapi cara menerimanya bergantung pada pengesahan berbilang pihak dan pertimbangan pengguna sendiri.

Selain itu, mengenai model itu sendiri, kami juga menguji beberapa masalah popular baru-baru ini yang sering menyebabkan model besar melanggar dinding.

Sebagai contoh, Gemini walaupun menukar dua nombor kepada wang, tetapi selepas satu operasi, keputusan akhir adalah ... salah.

Sejak soalan ini ditemui, jika ini jawapan kedua paling kelakar, tiada model yang berani menuntut tempat pertama.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Saya juga pernah memberi jawapan yang salah pada awalnya, tetapi saya membetulkannya kemudian semasa proses analisis.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Tetapi jika anda bertanya soalan dalam bahasa Inggeris, masih ada harapan bahawa anda boleh mendapat jawapan yang betul.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Satu lagi soalan, jawapan ini sebenarnya boleh mengira huruf dari bahasa Cina... Ia juga membuat orang keliru, dan ia tidak dalam jangkaan sama sekali.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Akhirnya, mengenai peningkatan kelajuan yang dinyatakan dalam kemas kini ini, ujian mendapati Gemini 1.5 Flash mengambil masa yang lebih singkat untuk mengeluarkan perkataan pertama daripada Claude 3 Haiku Perbezaan dalam kelajuan berikutnya tidak begitu ketara dengan mata kasar.

大模型厂商密集发力,谷歌也开“卷”了:Gemini 聊天机器人换上新模型,还能一键核查输出内容

Di atas adalah prestasi Gemini 1.5 Flash dalam chatbots. Pembaca yang berminat boleh mencubanya sendiri.

Pautan rujukan:

[ 1 ] https://blog.google/products/gemini/google-gemini-new-features-july-2024/

[ 2 ] https://x.com/GeminiApp/status /1816512086232731696

Atas ialah kandungan terperinci Pengeluar model besar sedang membuat usaha intensif, dan Google juga telah membuka 'volume': Robot sembang Gemini telah digantikan dengan model baharu, dan ia juga boleh menyemak kandungan output dengan satu klik.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:myzaker.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!