Memandangkan pengeluar model besar seperti Meta dan OpenAI sedang melakukan usaha intensif, Google juga telah mengumumkan kemas kini utama -
Mulai sekarang, robot sembang Gemini akan dipandu oleh Gemini 1.5 Flash.
Berbanding dengan versi sebelumnya, panjang tetingkap telah meningkat kepada 4 kali ganda, dan kelajuan tindak balas juga lebih pantas.
Menurut pengenalan Google, model 1.5 Flash di sebalik versi baharu chatbot memfokuskan pada pemberat ringan dan peningkatan kelajuan.
Sudah tentu, kualiti balasan model juga telah dipertingkatkan, dan tetingkap konteks telah ditingkatkan daripada asal (berdasarkan 1.0 Pro) 8k kepada 32k.
Selain itu, versi baharu chatbot juga menambah fungsi "semakan fakta", yang boleh mengesan sama ada kandungan yang dijana adalah benar dengan satu klik, mengurangkan kesan buruk ilusi model.
Sesetengah netizen mengeluh bahawa prestasi Google benar-benar kukuh hari ini, pertama, dan kemudian Gemini juga mengeluarkan kemas kini.
Sesetengah orang telah menghidupkan mod hajat dan tidak sabar-sabar untuk menambahkan fungsi AI pada carian akademik Google Scholar.
Tetingkap konteks yang lebih panjang dan kelajuan yang lebih pantas
Kandungan utama kemas kini ini adalah untuk menukar model di belakang versi percuma daripada 1.0Pro kepada 1.5 Flash.
Gemini 1.5 Flash pertama kali diperkenalkan pada persidangan pembangun Google I/O pada bulan Mei.
Melalui "penyulingan" data latihan, Gemini 1.5 Flash mencapai kualiti penjanaan yang lebih tinggi dengan saiz yang lebih ringan.
Dan saiz yang kecil juga menjadikan model lebih pantas dan cekap, dan ia juga menyokong penaakulan pelbagai mod.
Google memperkenalkan bahawa selepas perubahan model ini, chatbot akan menjadi lebih pantas, dan tetingkap konteks versi lama 8k akan dikembangkan kepada 32k.
Walau bagaimanapun, 1.5 Flash itu sendiri menyokong 1 juta konteks Pengurangan ini sememangnya bukan kecil, tetapi ia adalah versi percuma.
Selain peningkatan model, satu lagi kemas kini penting ialah fungsi semakan fakta.
Dalam chatbot Gemini terkini, anda boleh menggunakan fungsi ini untuk menyemak kandungan output dengan satu klik.
Sistem akan mencari dan membandingkan kandungan dalam output di Google, dan kemudian menandakan padanan dan percanggahan.
Sesetengah netizen mengulas bahawa apabila mereka melihat OpenAI melancarkan GPT-4o mini, mereka merasakan bahawa hanya menunggu masa sebelum Google melancarkan versi baharu.
Sememangnya, bukan sahaja OpenAI dan Google, tetapi juga Meta, Mistral dan pengeluar lain yang membuat model besar telah membuat pergerakan yang kerap baru-baru ini.
Mengenai prestasi model, netizen ini juga mengatakan bahawa dia telah mencuba 1.0 Pro dan 1.5 Flash Prestasi kedua-duanya hampir sama, dan 1.5 Flash lebih pantas.
Jadi, gelombang operasi oleh Google ini juga disesuaikan dengan trend terkini "model lightweighting" pada tahap tertentu.
Jadi, bagaimanakah prestasi chatbot Gemini selepas menggantikan 1.5 Flash?
Semak output model dengan satu klik
Qubit melakukan ujian mudah pada versi baharu chatbot.
Mula-mula, mari kita lihat fungsi semakan fakta kemas kini ini Langkah pertama ialah bertanya soalan seperti perbualan biasa, dan Gemini akan menjawabnya secara normal.
Anda boleh melihat bahawa terdapat logo Google di bawah jawapan Ini adalah butang untuk fungsi semakan fakta.
Selepas mengklik, sistem akan mencari secara automatik di Google dan kemudian membandingkannya dengan outputnya sendiri.
Selepas perbandingan selesai, sumber boleh dicari dan kandungan yang sepadan akan diserlahkan dalam warna hijau Jika terdapat sebarang percanggahan dengan hasil carian, ia akan ditanda dengan latar belakang merah muda.
Klik pada lokasi yang ditanda untuk melihat pautan kandungan yang Gemini gunakan sebagai perbandingan.
Perlu diambil perhatian bahawa anotasi sedemikian tidak bermakna kandungan output adalah salah Contohnya, dalam data perbandingan yang dipetik di sini, ibu Tom Cruise ialah Marry Lee South.
Disebabkan ketidakpadanan teks, bahagian jawapan ini ditandakan oleh sistem, tetapi sebenarnya kedua-duanya adalah jawapan yang betul.
Memandangkan semakan fakta ini bergantung pada carian Internet, kualiti maklumat perbandingan juga tidak sekata dan mungkin tidak 100% tepat.
Sebagai contoh, mengenai jenaka klasik "Lin Daiyu mencabut pohon willow yang menangis", Gemini jelas memberikan jawapan yang betul, tetapi ditandakan merah.
Melihat kepada maklumat perbandingan yang dipetik semula, memang agak sukar untuk dipanjangkan.
Jadi fungsi fungsi ini adalah untuk menyediakan kaedah pengesahan yang lebih mudah, tetapi cara menerimanya bergantung pada pengesahan berbilang pihak dan pertimbangan pengguna sendiri.
Selain itu, mengenai model itu sendiri, kami juga menguji beberapa masalah popular baru-baru ini yang sering menyebabkan model besar melanggar dinding.
Sebagai contoh, Gemini walaupun menukar dua nombor kepada wang, tetapi selepas satu operasi, keputusan akhir adalah ... salah.
Sejak soalan ini ditemui, jika ini jawapan kedua paling kelakar, tiada model yang berani menuntut tempat pertama.
Saya juga pernah memberi jawapan yang salah pada awalnya, tetapi saya membetulkannya kemudian semasa proses analisis.
Tetapi jika anda bertanya soalan dalam bahasa Inggeris, masih ada harapan bahawa anda boleh mendapat jawapan yang betul.
Satu lagi soalan, jawapan ini sebenarnya boleh mengira huruf dari bahasa Cina... Ia juga membuat orang keliru, dan ia tidak dalam jangkaan sama sekali.
Akhirnya, mengenai peningkatan kelajuan yang dinyatakan dalam kemas kini ini, ujian mendapati Gemini 1.5 Flash mengambil masa yang lebih singkat untuk mengeluarkan perkataan pertama daripada Claude 3 Haiku Perbezaan dalam kelajuan berikutnya tidak begitu ketara dengan mata kasar.
Di atas adalah prestasi Gemini 1.5 Flash dalam chatbots. Pembaca yang berminat boleh mencubanya sendiri.
Pautan rujukan:
[ 1 ] https://blog.google/products/gemini/google-gemini-new-features-july-2024/
[ 2 ] https://x.com/GeminiApp/status /1816512086232731696
Atas ialah kandungan terperinci Pengeluar model besar sedang membuat usaha intensif, dan Google juga telah membuka 'volume': Robot sembang Gemini telah digantikan dengan model baharu, dan ia juga boleh menyemak kandungan output dengan satu klik.. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!