Heim > häufiges Problem > Die Verfügbarkeit des Azure OpenAI-Dienstes wird erweitert, wie Microsoft gestern angekündigt hat

Die Verfügbarkeit des Azure OpenAI-Dienstes wird erweitert, wie Microsoft gestern angekündigt hat

PHPz
Freigeben: 2023-08-12 11:45:13
nach vorne
1161 Leute haben es durchsucht

Microsoft hat gestern die erweiterte Verfügbarkeit des Azure OpenAI-Dienstes angekündigt. Mit dieser Erweiterung können Kunden in Australien Ost, Kanada Ost, USA Ost 2, Japan Ost und Großbritannien Süd auf die beliebten OpenAI-Modelle GPT-4 und GPT-35-Turbo zugreifen. Vor dieser Erweiterung war der Azure OpenAI-Dienst in den Regionen USA Ost, Frankreich-Mitte, USA Süd-Zentral und Westeuropa verfügbar. Während seiner jüngsten Telefonkonferenz zu den Ergebnissen gab Microsoft bekannt, dass der Azure OpenAI-Dienst mittlerweile mehr als 11.000 Kunden bedient und durchschnittlich 100 neue Kunden pro Tag anzieht.

Microsoft kündigte außerdem die offizielle Veröffentlichung der Azure ND H100 v5 Virtual Machine (VM)-Serie an, die über die neueste NVIDIA H100 Tensor Core GPU und NVIDIA Quantum-2 InfiniBand-Netzwerke verfügt. Diese neue VM-Serie ist für KI-Workloads konzipiert und jetzt in den Azure-Regionen USA Ost und USA Süd-Mitte verfügbar. Auch wenn eine VM offiziell freigegeben wird, müssen Kunden ihr Interesse am Zugriff auf die neue VM anmelden.

ND H100 v5 VMs umfassen die folgenden Funktionen:

  • Ausgestattet mit acht NVIDIA H100 Tensor Core GPUs versprechen diese VMs eine schnellere KI-Modellleistung als frühere Generationen.
  • Skalierbare Intel Xeon-Prozessoren der 4. Generation bilden die Grundlage dieser virtuellen Maschinen und sorgen für optimale Verarbeitungsgeschwindigkeiten.
  • NVIDIA Quantum-2 ConnectX-7 InfiniBand 400 Gbit/s pro GPU und 3,2 Tbit/s knotenübergreifende Bandbreite pro virtuelle Maschine sorgen für nahtlose Leistung über alle GPUs hinweg und entsprechen den Fähigkeiten der weltbesten Supercomputer.
  • Da PCIe Gen5 eine Bandbreite von 64 GB/s pro GPU bereitstellt, ermöglicht Azure erhebliche Leistungsvorteile zwischen CPUs und GPUs.
  • DDR5-Speicher ist das Herzstück dieser virtuellen Maschinen und sorgt für höhere Datenübertragungsgeschwindigkeiten und Effizienz, was ihn ideal für Workloads mit größeren Datenmengen macht.
  • Matrixmultiplikationsoperationen werden bei Verwendung des neuen 8-Bit-Gleitkomma-Datentyps FP16 im Vergleich zu FP8 in früheren Generationen um den Faktor sechs beschleunigt.
  • Bei großen Sprachmodellen wie der End-to-End-Modellinferenz von BLOOM 175B wurde eine zweifache Geschwindigkeitssteigerung erreicht, was deren Potenzial zur weiteren Optimierung von KI-Anwendungen demonstriert.

Das obige ist der detaillierte Inhalt vonDie Verfügbarkeit des Azure OpenAI-Dienstes wird erweitert, wie Microsoft gestern angekündigt hat. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:yundongfang.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage