AI 模型系列的最新成員 Gemini 1.5 Flash-8B 現已全面投入生產使用。
Google 推出了更小、更快的 Gemini 1.5 Flash AI 模型,該模型已在 Google I/O 上發布,現已普遍用於生產使用。較小的模型稱為 Gemini 1.5 Flash-8B,由於其速度快和推理延遲極低,因此可以更有效率地產生輸出。
根據 Google 的說法,Flash-8B AI 模型的每項智慧成本是所有 Gemini 模型中最低的。該公司早些時候將 Gemini 1.5 Flash AI 模型提煉為更小的 Gemini 1.5 Flash-8B,旨在實現更快的處理速度和更有效率的輸出產生。現在,Google透露,這個較小版本的人工智慧模型是由Google DeepMind 幾個月前開發的。
儘管尺寸較小,但這家科技巨頭表示,新模型在多個基準測試中幾乎與 1.5 Flash 模型相匹配,從簡單的聊天到轉錄和長上下文語言翻譯。
人工智慧模型的主要優點是其成本效率。谷歌指出,Gemini 1.5 Flash-8B 將具有 Gemini 系列中最低的代幣價格。開發者將被收取每100 萬個輸出代幣0.15 美元(約12.5 盧比)的費用,每100 萬個輸入代幣0.0375 美元(約3 盧比)的費用,以及每100 萬個緩存提示代幣0.01 美元(約0.8 盧比)的費用。
此外,Google 也將 1.5 Flash-8B AI 模型的速率限制提高了一倍。使用此模型時,開發人員現在每分鐘最多可以發送 4,000 個請求 (RPM)。據這家科技巨頭稱,該模型非常適合簡單、大批量的任務。開發者可以透過 Google AI Studio 和 Gemini API 免費試用模型。
以上是Gemini 1.5 Flash-8B AI模型現已上市的詳細內容。更多資訊請關注PHP中文網其他相關文章!