Le modèle AI Gemini 1.5 Flash-8B est désormais généralement disponible-web3.0-php.cn

Le modèle AI Gemini 1.5 Flash-8B est désormais généralement disponible

DDD

Libérer： 2024-10-05 12:26:19

original

769 Les gens l'ont consulté

Le dernier ajout à la famille des modèles d'IA, Gemini 1.5 Flash-8B, est désormais généralement disponible pour une utilisation en production.

Le modèle AI Gemini 1.5 Flash-8B est désormais généralement disponible

Google a mis à disposition une version plus petite et plus rapide du modèle Gemini 1.5 Flash AI, qui a été annoncé lors de Google I/O et qui est désormais généralement disponible pour une utilisation en production. Le modèle plus petit, appelé Gemini 1.5 Flash-8B, est conçu pour être plus efficace dans la génération de sortie, grâce à sa vitesse rapide et à son inférence à très faible latence.

Selon Google, le modèle d'IA Flash-8B offre le coût par intelligence le plus bas de tous les modèles Gemini. La société avait auparavant distillé le modèle Gemini 1.5 Flash AI dans le plus petit Gemini 1.5 Flash-8B, qui visait un traitement plus rapide et une génération de sortie plus efficace. Maintenant, Google révèle que cette version plus petite du modèle d'IA a été développée par Google DeepMind il y a quelques mois.

Bien qu'il soit de plus petite taille, le géant de la technologie affirme que le nouveau modèle correspond presque au modèle Flash 1.5 sur plusieurs critères, allant du simple chat à la transcription et à la traduction en langage contextuel long.

Le principal avantage du modèle d’IA est sa rentabilité. Google note que le Gemini 1.5 Flash-8B aura le prix symbolique le plus bas de la famille Gemini. Les développeurs seront facturés 0,15 $ (environ 12,5 Rs) pour un million de jetons de sortie, 0,0375 $ (environ 3 Rs) pour un million de jetons d'entrée et 0,01 $ (environ 0,8 Rs) pour chaque million de jetons dans les invites mises en cache.

De plus, Google double les limites de débit pour le modèle AI 1,5 Flash-8B. Les développeurs peuvent désormais envoyer jusqu'à 4 000 requêtes par minute (RPM) en utilisant ce modèle. Selon le géant de la technologie, le modèle est idéal pour les tâches simples et volumineuses. Les développeurs peuvent essayer le modèle gratuitement via Google AI Studio et l'API Gemini.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!