GPT 5 vs GPT 4O: Mana yang lebih baik?
Pembebasan terbaru GPT-5 telah mengambil dunia dengan ribut. Model perdana terbaru Terbuka telah menerima ulasan bercampur - sementara beberapa memuji keupayaannya, yang lain menyerlahkan kekurangannya. Ini membuat saya tertanya-tanya: Adakah GPT-5 benar-benar lebih tinggi daripada kegemaran asal, GPT-4O?
Secara peribadi, GPT-4O adalah llm saya untuk segala-galanya dari ringkasan teks kepada penjanaan imej dan analisis data. Sekarang bahawa OpenAI telah menggantikannya dengan GPT-5, saya memutuskan untuk meletakkan kedua-dua model untuk ujian. Adakah peningkatan ini benar -benar evolusi, atau langkah bergegas yang mungkin mengurangkan rayuan Chatgpt?
Biarkan pertempuran GPTs bermula!
Jadual Kandungan
- GPT 5 dan GPT 4O: Peringatan cepat
- GPT 5 vs GPT 4O: Perbandingan Ciri
- GPT 5 vs GPT 4O: Perbandingan tugas
- Tugas 1: Penciptaan Kandungan
- Tugas 2: Generasi Imej
- Tugas 3: Pengekodan
- Tugas 4: Analisis Imej
- Tugas 5: Penalaran
- GPT-5 vs GPT-4O: Keputusan Akhir
- Kesimpulan
GPT 5 dan GPT 4O: Peringatan cepat
Mari kita dengan cepat menyelam ke dalam butiran mengenai dua model chatgpt yang akan kami uji di blog ini: GPT-5 dan GPT 4O
GPT-5
Dikeluarkan minggu lepas, GPT-5 kini berdiri sebagai model paling maju ChatGPT. LLM multimodal terbaru OpenAI memperkenalkan keupayaan agentik dan 'sistem bersatu' untuk penilaian tugas. Sistem ini secara automatik menentukan sama ada pertanyaan memerlukan penalaran yang mendalam atau pemprosesan asas. Tidak seperti model terdahulu, GPT-5 mengikuti pendekatan 'belajar demi tindakan'. Ia menunjukkan peningkatan empati sementara kurang menyenangkan daripada pendahulunya. Bersama dengan GPT-5 ini dilengkapi dengan kuasa pengekodan, penulisan dan getaran yang dipertingkatkan
Cari lebih banyak dalam artikel saya sebelumnya mengenai GPT-5.
GPT-4O
Dikeluarkan tahun lepas, GPT-4O (di mana "O" bermaksud "Omni") adalah model pertama. Thismultimodalchanged cara orang menggunakanChatgpt. ModelCamewith meningkatkan keupayaan pengekodan dan analisis visual.GPT-4Ocame dengan ciri-ciri pengiktirafan dan analisis pertuturan juga. Model ini datang dengan peningkatan kelajuan pemprosesan dan mengurangkan latensi tindak balas. Openai's GPT-4O menjana tindak balas yang lebih semula jadi dan masuk akal, dan dapat mengakses alat dan memberikan maklumat masa nyata.
Untuk mengetahui lebih lanjut, periksa artikel ini di GPT 4O.
GPT 5 vs GPT 4O: Perbandingan Ciri
Ciri | GPT-4O | GPT-5 |
Tarikh Siaran | Mei 2024 | Aug 2025 |
Modaliti | Teks, imej, audio | Teks, gambar, audio, video |
Tetingkap konteks (chatgpt) | ~ 128k token | Token 256K |
Tetingkap konteks (API) | ~ 128k token | Token 400k |
Mod penalaran | Model tunggal | Dual-Mode: Penalaran mendalam yang cepat |
Kadar halusinasi | Rendah | Paling rendah namun di kalangan model terbuka |
Pemperibadian | Tiada | Kawalan Nada Preset Keperibadian |
Integrasi Alat | Terhad | Gmail, kalendar, alat kod, lebih banyak |
Penyelesaian selamat | Tidak | Ya - Jawapan yang Beratur, Berguna |
SWE-Bench disahkan | 30.8% ketepatan | 74.9% ketepatan |
AIME 2025 (Matematik) | 71% | 94.6% (tanpa alat) |
Videommmu | 58.8% | 81.1% |
Healthbench | 31.6% | 46.2% |
Kes penggunaan sasaran | Interaksi masa nyata, tugas kreatif | Aliran Kerja Penalaran Kompleks, Perusahaan |
GPT 5 vs GPT 4O: Perbandingan tugas
Sekarang, mari kita letakkan kedua -dua model ke ujian dengan menilai prestasi mereka pada tugas -tugas berikut:
- Penciptaan Kandungan
- Generasi imej
- Pengekodan
- Analisis imej
- Penalaran
Biarkan pertempuran GPT-5 vs GPT-4O bermula!
Tugas 1: Penciptaan Kandungan
Baca artikel athttps: //www.analyticsvidhya.com/blog/2024/07/building-agentic-rag-systems-with-langgraph/to memahami proses membuat pangkalan data vektor untuk data wikipedia. Kemudian, berikan ringkasan ringkas langkah -langkah utama. "
Respons GPT-5:
Respons GPT-4O:
Pemerhatian:
Sambutan yang dihasilkan oleh GPT-5 adalah ringkasan ringkas yang diketahui oleh orang yang dikehendaki. Langkah -langkah semuanya disenaraikan dalam urutan yang betul dan datang dengan konteks yang cukup. Sebaliknya, respons GPT-4O adalah ringkasan semua langkah yang disebutkan dalam blog. Ia menyenaraikan langkah -langkah yang diliputi dalam blog dengan cara yang sama seperti yang dibincangkan. Perbezaan dalam pendekatan kedua-dua model: GPT-5 menggabungkan mata untuk menghasilkan ringkasan ringkas keseluruhan proses, sedangkan GPT-4O mencipta ringkasan ringkas semua langkah yang diliputi dalam blog.
Tugas 2: Generasi Imej
Imej itu berfungsi dengan ejen suara. Ia mempunyai 3 bahagian utama
Ucapan-ke-Teks (STT): Menangkap dan Menukar Kata-kata Lisan anda ke dalam Teks.
Logik Agentik: Ini adalah kod anda (atau ejen anda), yang memaparkan tindak balas yang sesuai
Teks-ke-ucapan (TTS): Menukar teks ejen kembali ke audio yang dituturkan dengan kuat.
Tukar imej asas ini ke dalam imej yang bersemangat.
Respons GPT-5 :
Respons GPT-4O:
Pemerhatian:
Tugas itu mudah, dan kedua -duamodelsexecuted itu dengan baik. Bermula dengan GPT-5, ia mencipta imej yang bersemangat dengan warna. Imej yang dihasilkannya mempunyai teks dan ikon; Walau bagaimanapun, terdapat kesilapan kecil - anak panah kecil yang menghubungkan ikon mic dengan kotak TTS. Bagi imej yang dihasilkan oleh GPT-4O, ia menggunakan warna-warna kolid, menjadikannya kurang bersemangat. Imej GPT-4O yang paling tinggi adalah sumber input dan output audio yang dimasukkan.
Tugas 3: Pengekodan
Kod HTML Asas untuk laman web pengiraan perkataan.
Respons GPT-5:
Respons GPT-4O:
Pemerhatian:
GPT-5 mengambil sedikit masa untuk menjana kod untuk pertanyaan ini, khususnya untuk laman web kaunter Word. Walau bagaimanapun, output akhir agak mengagumkan. UI/UX dan ciri-ciri datang bersama-sama untuk membuat laman web pengiraan perkataan yang berfungsi sepenuhnya. Sebaliknya, output GPT-4O berasa kurang bersemangat berbanding. UI/UX adalah asas, hanya menawarkan ciri-ciri pengiraan kata teras tanpa penambahbaikan tambahan. Reka bentuknya juga kelihatan agak ketinggalan zaman
Tugas 4: Analisis Imej
Kirakan output gambarajah litar ini.
Respons GPT-5:
Respons GPT-4O:
Pemerhatian:
GPT-5 menjawab soalan ini dengan cepat, menganalisis kedua-dua imej dan komponennya dengan cekap. Ia dengan betul mengenal pasti penerus separuh gelombang, membaca nilai yang ditandakan pada rajah, dan menggunakan logik yang betul untuk mengira nilai arus dan voltan output. Sebaliknya, GPT-4O bergelut dengan tugas ini. Walaupun ia mengiktiraf bentuk gelombang output, ia gagal memproses faktor kritikal yang lain. Terutama, GPT-4O tidak dapat mengekstrak nilai yang diperlukan dari imej untuk melakukan apa-apa pengiraan.
Tugas 5: Penalaran
Selesaikan Sudoku berikut dan berikan penyelesaian akhir sebagai imej.
Respons GPT-5:
Respons GPT-4O:
Pemerhatian:
GPT-5 pada mulanya berjuang dengan tafsiran imej, mengambil masa lebih dari tiga minit untuk memproses input. Daripada menyelesaikan teka -teki secara bebas, ia meminta pengesahan pelbagai nilai dalam imej. Selepas saya secara manual memberikan semua nilai baris, model berjaya diproses dan menyelesaikan teka -teki, menghasilkan penyelesaian yang betul, walaupun memerlukan bantuan pengguna yang penting.
Sebaliknya, GPT-4O gagal menyelesaikan teka-teki sepenuhnya. Ia hanya menampung semua nilai yang hilang dengan sifar dan membentangkan ini sebagai penyelesaian outputnya.
GPT-5 vs GPT-4O: Keputusan Akhir
Memilih pemenang yang jelas tidak pernah menjadi lebih mencabar. Begini bagaimana kedua -dua LLM dilakukan dalam pelbagai tugas:
Tugas | GPT-5 | GPT-4O |
---|---|---|
Penciptaan Kandungan | Lebih ringkas | Lebih baik diringkaskan |
Generasi imej | Lebih bersemangat | Lebih kreatif |
Pengekodan | Hebat | Keupayaan terhad |
Analisis imej | Purata | Purata |
Penalaran | Cemerlang | Keupayaan asas |
Adakah terdapat pemenang yang jelas antara keduanya? Jawapannya tidak. Prestasi berbeza -beza mengikut tugas:
- GPT-5 menguasai dalam pengekodan dan penalaran
- GPT-4O memegang sendiri dalam penciptaan kandungan dan penjanaan imej/analisis
- Kelajuan vs kedalaman : GPT-4O memberikan respons yang lebih cepat, sementara GPT-5 kadang-kadang ragu-ragu antara analisis menyeluruh dan generasi cepat
Perkara Konteks : Ingatlah bahawa GPT-4O adalah tahun yang lebih tua. Walaupun GPT-5 mendapat manfaat daripada data latihan yang lebih baru dan pengoptimuman agensi, adakah ia benar-benar pecah tanah berbanding pendahulunya? Tidak betul -betul.
Kesimpulan
Memandangkan dunia menuntut kemunculan semula GPT-4O, saya dengan sepenuh hati bersetuju.
Walaupun GPT-5 telah bertambah baik sejak hari 1 (kini mengatasi hasil hari ke-3), pelancarannya yang bergegas meninggalkan pengguna yang berjuang untuk menyesuaikan diri. Sebenarnya, GPT-5 hanya sedikit melampaui GPT-4O pada tugas-tugas tertentu, menjadikannya sukar untuk meninggalkan GPT-4O yang dikasihi untuk sesuatu yang merasakan hanya "anak lelaki yang lebih baik." Mungkin Openai memerlukan lebih banyak ujian yang ketat sebelum dibebaskan. Tetapi sekarang ia hidup, kita hanya dapat menonton evolusinya.
Hari ini, saya akan menandatangani sebarang petisyen untuk membawa kembali GPT-4O. Chatgpt telah berubah, dan bukan untuk lebih baik. Beritahu saya pemikiran anda di bahagian komen.
PS: Saya mengambil output GPT 4O dari blog kami yang terdahulu:
- Gemini 2.0 vs GPT-4O
- Penjanaan imej GPT-4O
- O1 vs GPT-4O
Atas ialah kandungan terperinci GPT 5 vs GPT 4O: Mana yang lebih baik?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Stock Market GPT
Penyelidikan pelaburan dikuasakan AI untuk keputusan yang lebih bijak

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Openai menggulung kawalan ibu bapa untuk chatgptarents kini boleh berhubung dengan akaun remaja mereka, had ciri, dan mendapatkan makluman jika tekanan emosi dikesan perbualan berisiko akan dikendalikan oleh model khas yang dilatih untuk menyokong penggunaan

NotebookLM oleh Google Now mempunyai format gambaran audio baru: penambahan ringkas, kritikan, dan debatethese membawa interaksi yang lebih baik dan perbincangan berstruktur untuk memuat naik kandungan yang ditingkatkan mendorong alat lebih dekat ke interaktif, gaya podcast AI

Microsoft telah mengeluarkan amaran mengenai latensi rangkaian yang lebih tinggi yang mempengaruhi perkhidmatan Azure kerana gangguan di bawah kabel bawah laut yang terletak di Laut Merah, memaksa syarikat itu mengalihkan trafik melalui laluan alternatif. "Walaupun sambungan rangkaian

Pembebasan terbaru GPT-5 telah mengambil dunia dengan ribut. Model perdana terbaru Openai telah menerima ulasan bercampur - sementara beberapa memuji keupayaannya, yang lain menyerlahkan kekurangannya. Ini membuat saya tertanya-tanya: Adakah GPT-

FBI telah mengeluarkan amaran keselamatan kritikal, memberi amaran bahawa kolektif penggodaman terkenal yang dikenali sebagai Taufan Salt semakin menggiatkan operasi sibernya di seluruh dunia. Menurut agensi, kumpulan yang disokong oleh negara ini telah menjalankan secara meluas

AI memotong masa yang diperlukan untuk mengesan dan bertindak balas terhadap laporan data yang dibebaskan oleh pemohon AI menjimatkan sehingga £ 600,000 setiap pelanggaran berbanding dengan bukan pengguna 33% organisasi UK telah melaksanakan AI dalam strategi keselamatan mereka dari IBM dalam

Sekiranya anda memberitahu bilik yang penuh dengan eksekutif insurans yang tidak berisiko lima tahun yang lalu bahawa hampir separuh daripada pengguna UK akan segera mengalu-alukan nasihat kesihatan dari AI, anda akan bertemu dengan keraguan yang serius, jika tidak ketawa.

Pada tahun 2025, beberapa pembantu pengaturcaraan AI yang boleh diakses terus dari terminal akan dikeluarkan satu demi satu. Codex CLI, Gemini CLI, dan Kod Claude adalah beberapa alat popular yang membenamkan model bahasa besar ke dalam alur kerja baris arahan. Alat pengaturcaraan ini mampu menghasilkan dan membaiki kod melalui arahan bahasa semulajadi, dan sangat kuat. Kami mengkaji prestasi ketiga -tiga alat ini dalam tugas yang berbeza untuk menentukan yang mana lebih praktikal. Setiap pembantu didasarkan pada model AI canggih seperti O4-Mini, Gemini 2.5 Pro atau Claude Sonnet 4, yang direka untuk meningkatkan kecekapan pembangunan. Kami meletakkan tiga dalam persekitaran yang sama dan menggunakan metrik tertentu
