Am 4. Juli veröffentlichte Tencent Cloud offiziell die AI-native (AI Native) Vektordatenbank Tencent Cloud VectorDB. Diese Datenbank kann in großem Umfang in Szenarien wie Training großer Modelle, Inferenz und Wissensdatenbankergänzung eingesetzt werden. Sie ist die erste Vektordatenbank in China, die den gesamten Lebenszyklus von KI von der Zugriffsschicht über die Rechenschicht bis zur Speicherschicht bietet.
Vektordatenbanken werden in der Branche als „Hippocampus“ großer Modelle bezeichnet und sind speziell für die Speicherung und Abfrage von Vektordaten konzipiert. Berichten zufolge unterstützt die Vektordatenbank von Tencent Cloud eine Vektorabrufskala von bis zu 1 Milliarde, wobei die Latenz auf Millisekundenebene kontrolliert wird. Im Vergleich zu herkömmlichen eigenständigen Plug-in-Datenbanken ist die Abrufskala um das Zehnfache erhöht und verfügt außerdem über eine Spitzenabfragekapazität von einer Million Ebenen pro Sekunde (QPS).
Tencent Cloud definiert AI Native Vektordatenbank
Mit Beginn der Ära der großen Modelle ist die Einführung großer Modelle für Unternehmen zu einer Notwendigkeit geworden.
Vektordatenbanken können durch die Vektorisierung von Daten die Effizienz erheblich verbessern und Kosten senken. Es kann die Probleme hoher Vorschulungskosten für große Modelle, fehlendes „Langzeitgedächtnis“, unzureichende Wissensaktualisierungen und komplexes Prompt-Word-Engineering lösen, die zeitlichen und räumlichen Beschränkungen großer Modelle durchbrechen und die Implementierung großer Modelle beschleunigen Modelle in Branchenszenarien.
Statistiken zeigen, dass durch die Verwendung der Tencent Cloud Vector Database zur Klassifizierung, Deduplizierung und Bereinigung großer Modelldaten vor dem Training eine zehnfache Effizienzsteigerung im Vergleich zu herkömmlichen Methoden erzielt werden kann. Es kann die Kosten um 2–4 Größenordnungen senken.
Es ist erwähnenswert, dass Tencent Cloud das Entwicklungsparadigma von AI Native neu definiert und eine umfassende KI-Lösung für die Zugriffsschicht, die Rechenschicht und die Speicherschicht bereitgestellt hat, die es Benutzern ermöglicht, sie auf den gesamten Lebenszyklus der Verwendung von Vektordatenbanken anzuwenden Fähigkeiten.
Insbesondere auf der Zugriffsebene unterstützt die Tencent Cloud Vector Database die Eingabe von Text in natürlicher Sprache, übernimmt die Abfragemethode „Skalar + Vektor“, unterstützt die vollständige Speicherindizierung und unterstützt bis zu eine Million Abfragen pro Sekunde (QPS). Auf der Datenverarbeitungsebene kann das AI-Native-Entwicklungsparadigma umfassende Daten-KI-Berechnungen realisieren und Probleme wie Textsegmentierung (Segmentierung) und Vektorisierung (Einbettung) aus einer Hand lösen, wenn Unternehmen private Domänenwissensdatenbanken auf der Speicherebene aufbauen Cloud Vector Die Datenbank unterstützt die intelligente Speicherverteilung von Daten und hilft Unternehmen, die Speicherkosten um 50 % zu senken.
Früher dauerte es etwa einen Monat, bis Unternehmen auf ein großes Modell zugreifen konnten. Nach der Verwendung der Tencent Cloud Vector Database kann die Fertigstellung in drei Tagen erfolgen, was die Zugriffskosten des Unternehmens erheblich senkt.
Es versteht sich, dass die Vektorisierungsfähigkeit (Einbettung) der Tencent Cloud Vector Database mehrfach von renommierten Organisationen anerkannt wurde. Im Jahr 2021 stand sie ganz oben auf der MS MARCO-Liste und entsprechende Ergebnisse wurden im NLP Summit ACL veröffentlicht.
Luo Yun, stellvertretender General Manager von Tencent Cloud Database, sagte, dass die Ära von AI Native angebrochen sei. „Vektordatenbank + großes Modell + Daten“ würden einen „Schwungradeffekt“ erzeugen und Unternehmen gemeinsam dabei helfen, in die AI Native-Ära einzutreten. )Epoche.
Die Vektordatenbank von Tencent Cloud trägt dazu bei, die Effizienz des Datenzugriffs um das Zehnfache zu verbessern
Tencent Cloud Vector Database basiert auf der Vektor-Engine (OLAMA) der Tencent Group, die täglich Hunderte Milliarden Suchanfragen verarbeitet. Nach der Übung in Tencents internen Massenszenarien ist die Effizienz des Datenzugriffs auf KI ebenfalls zehnmal höher als bei herkömmlichen Lösungen Die Betriebsstabilität beträgt bis zu 99,99 % und wurde in mehr als 30 nationalen Produkten wie Tencent Video, QQ Browser und QQ Music verwendet.
Die Vektordatenbank von Tencent Cloud kann Produkten effektiv dabei helfen, die Betriebseffizienz zu verbessern. Daten zeigen, dass nach Verwendung der Tencent Cloud Vector Database die Pro-Kopf-Hörzeit von QQ Music um 3,2 % gestiegen ist, die effektive Pro-Kopf-Belichtungszeit von Tencent Video um 1,74 % gestiegen ist und die Kosten von QQ Browser um 37,9 % gesunken sind.
Nehmen Sie die Anwendung von Tencent Video als Beispiel. Bilder, Audio, Titeltext und andere Inhalte in der Videobibliothek nutzen die Tencent Cloud-Vektordatenbank. Das durchschnittliche monatliche Abruf- und Berechnungsvolumen erreicht 20 Milliarden Mal, was den Anforderungen des Urheberrechts effektiv entspricht Schutz, ursprüngliche Identifikation, Ähnlichkeit usw.
Große modellbeschleunigte Vektordatenbanken befinden sich in einer Phase rasanter Entwicklung. Laut Northeast Securities wird der weltweite Markt für Vektordatenbanken bis 2030 voraussichtlich 50 Milliarden US-Dollar erreichen, und der inländische Markt für Vektordatenbanken wird voraussichtlich 60 Milliarden RMB überschreiten.
Vektordatenbanken können Unternehmen dabei helfen, große Modelle effizienter und bequemer zu nutzen und den Wert von Daten zu maximieren. Mit der kontinuierlichen Entwicklung und Verbreitung großer Modelle wird die AI Native-Vektordatenbank zum Standard für die Datenverarbeitung in Unternehmen.
Das obige ist der detaillierte Inhalt vonDer „goldene Partner' der großen Models ist da! Tencent Cloud veröffentlicht offiziell eine native KI-Vektordatenbank, die Vektorabruffunktionen auf 1-Milliarden-Ebene bietet. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!