Am 11. März kündigte Lingyiwu den Start einer neuen Vektordatenbank „Descartes“ auf Basis vollständiger Navigationsdiagramme an, die in 6 Datensatzauswertungen der maßgeblichen Liste ANN-Benchmarks den ersten Platz belegt hat. Vektordatenbank, im KI-Zeitalter auch als Information-Retrieval-Technologie bekannt, ist eine der Kerntechnologien der Retrieval-Augmented Generation (RAG). Für Entwickler großer Modellanwendungen ist die Vektordatenbank eine sehr wichtige Infrastruktur, die sich in gewissem Maße auf die Leistung großer Modelle auswirkt. Im Offline-Test der international maßgeblichen Bewertungsplattform ANN-Benchmarks belegte die Vektordatenbank Zero One Descartes den ersten Platz bei der Auswertung von 6 Datensätzen, was besser ist als der erste Platz in der Branche auf der vorherigen Liste . Deutliche Leistungsverbesserung, die Leistungsverbesserung bei einigen Datensätzen übersteigt sogar das Zweifache. Zero One Everything bedeutet, dass die kartesische Vektordatenbank in KI-Produkten verwendet wird, die in naher Zukunft offiziell eingeführt werden, und in Zukunft auch Entwicklern in Kombination mit Tools zur Verfügung gestellt wird. Vektordatenbank wird zur AI 2.0-InfrastrukturDie Gunst des Kapitalmarktes gewonnenMit dem Aufkommen der KI 2.0-Ära, dargestellt durch große Modelle, multimodale Informationen wie Bilder, Videos und natürliche Sprachen Die Menge unstrukturierter Daten hat stark zugenommen, was sich von herkömmlichen Datenbanken zur Verarbeitung strukturierter Daten unterscheidet. Die Vektordatenbank wird speziell zum Speichern, Verwalten, Abfragen und Abrufen vektorisierter unstrukturierter Daten verwendet. Sie ähnelt einer externen Speicherplatte, die von großen Modellen jederzeit aufgerufen werden kann, um einen „Langzeitspeicher“ zu bilden, der auch als „großer Modellspeicher“ bezeichnet wird. Hippocampus". Große Modelle haben natürlich vier Mängel: Vektordatenbanken sind wie maßgeschneiderte „Spezialmedizin“, die jeden Schmerzpunkt genau lösen kann.
- Echtzeitinformationen: Das Training großer Modelle dauert lange, wird langsam aktualisiert, kann nicht die neuesten Informationen widerspiegeln und sein Wissen steht vor der Herausforderung der „Frist“. Die Vektordatenbank verfügt über einen einfachen Aktualisierungsmechanismus, der die neuesten Informationen schnell ergänzen kann.
- Datenschutz: Die sicheren und privaten Daten der Benutzer sollten nicht direkt an große Modellschulungen weitergegeben werden, da sonst die Gefahr eines Verlusts besteht. Vektordaten lösen die Schwierigkeit des Datenschutzes, indem sie als Zwischenträger für die Informationsübertragung fungieren die Inferenzphase.
- Illusionskorrektur: Inferenzverzerrungen oder Halluzinationsphänomene, die häufig bei großen Modellen auftreten, können durch die umfassende Wissensreferenz der Vektordatenbank effektiv korrigiert und gemildert werden.
- Inferenzeffizienz: Die Kosten für große Modellinferenzen sind hoch, und die Vektordatenbank kann als Caching-Mechanismus verwendet werden, um zu vermeiden, dass für jede Abfrageanforderung komplexe Inferenzberechnungen erneut ausgeführt werden müssen, wodurch Rechenressourcen erheblich gespart werden.
Die durch KI 2.0 eingeleiteten technologischen Veränderungen und Plattformänderungen haben die Rolle von Vektordatenbanken weiter gestärkt. Verwandte Produkte von großen Herstellern wie Google, Microsoft und Meta sind nacheinander auf den Markt gekommen, aber auch Startups wie Zilliz, Pinecone, Weaviate und Qdrant sind entstanden. Im Jahr 2023 schloss OpenAIs Vektordatenbankpartner Pinecone eine Serie-B-Finanzierung in Höhe von 138 Millionen US-Dollar ab, und das inländische Start-up-Unternehmen Fabarta ArcNeural schloss ebenfalls eine Pre-A-Finanzierungsrunde über Hunderte Millionen Yuan ab. Fordern Sie die maßgebliche Liste heraus Algorithmen in verschiedenen realen Situationen auf die Leistung des Datensatzes. Die folgenden 6 Bewertungsdatensätze umfassen Handschuh-25-Angular, Handschuh-100-Angular, Sift-128-Euklidisch, Nytimes-256-Angular, Mode-Mnist-784-Euklidisch, Gist-960-Euklidisch Sechs Bei den wichtigsten Datensätzen stellt die Abszisse den Abruf und die Ordinate die QPS (Anzahl der pro Sekunde verarbeiteten Anforderungen) dar. Je näher die Kurvenposition an der oberen rechten Ecke liegt, desto besser ist die Leistung des Algorithmus in 6 Datensätzen liegen in der Auswertung auf dem höchsten Niveau.
„Durchsatz-QPS“ ist ein Maß für den Informationsabruf. Ein wichtiger Indikator für die Abfrageverarbeitungsfähigkeiten eines Systems (z. B. einer Suchmaschine oder Datenbank). Basierend auf den TOP1 der ursprünglichen Liste hat die kartesische Vektordatenbank „Zero-One Thousand Things“ erhebliche Leistungsverbesserungen erzielt. Die Leistungsverbesserung beträgt bei einigen Datensätzen mehr als das Zweifache vor dem ursprünglichen TOP1 der Liste.卡 0 Millionen Sheccart-Vektordatenbank und die Originalliste TOP1 QPS-Leistungsvergleich Technische Geheimnisse
Wie lässt sich verraten, wie Descartes die oben genannte hervorragende Leistung erzielt? Wie wir alle wissen, ist RAG eine Technologie, die das Abrufen und Generieren kombiniert. Sie verbessert die Generierungsfähigkeiten von Sprachmodellen durch das Abrufen abgefragter Informationen aus riesigen Datenmengen. Ähnlich wie bei herkömmlichen Abrufmethoden löst die RAG-Vektorabfrage im Wesentlichen zwei Hauptprobleme:
1 Reduzieren Sie den Kandidatensatz für die Abrufinspektion, indem Sie eine bestimmte Indexstruktur festlegen.
2 Die Komplexität.
Zero One Thousand Cartesian Vector Database bietet erhebliche komparative Vorteile gegenüber der Branche bei der Verarbeitung komplexer Abfragen, der Verbesserung der Abrufeffizienz und der Optimierung der Datenspeicherung. Was die erste Frage betrifft, so hat das Team von Zero One World zwei große Killer:
- Führende vollständige Navigationskartentechnologie. Die aktuelle Situation in der Branche ist hauptsächlich auf Hashing, KD-Tree, VP-Tree und andere Methoden zurückzuführen. Der Navigationseffekt ist nicht genau genug und die Beschneidungsstärke reicht nicht aus. Die von Zero One entwickelte globale Multi-Layer-Thumbnail-Navigationstechnologie Wanwu und die Koordinatensystemnavigation auf der Karte können sowohl Genauigkeit gewährleisten als auch eine große Anzahl irrelevanter Vektoren ausschneiden.
- Die erste adaptive Nachbarschaftsauswahlstrategie, die die Lücke in der Branche schließt. Die selbst entwickelte adaptive Nachbarauswahlstrategie von 01Wuxing durchbricht die Einschränkungen, die in der Vergangenheit nur auf echte Topk- oder feste Kantenauswahlstrategien zurückzuführen waren. Die neue Strategie ermöglicht es jedem Knoten, die besten Nachbarkanten basierend auf seinen eigenen Verteilungseigenschaften dynamisch auszuwählen und seine Nachbarn nähern sich schneller dem Zielvektor an, wodurch die Leistung beim RAG-Vektorabruf um 15–30 % verbessert wird.
Für die zweite Frage verwendet Zero One Wish ein zweistufiges Quantisierungsschemaerweitertes RAG. Zero One Thousand nutzt die zweistufige Quantisierung, um die Rechenkomplexität zu reduzieren. Gleichzeitig nutzt der Spaltenspeicher die Parallelitätsfähigkeiten von SIMD vollständig aus, um die Hardwarefunktionen weiter zu nutzen, und zwar um das Zwei- bis Dreifache . Darüber hinaus verfügt Zero One Wish auch über Full-Stack-Vektortechnologielösungen wie Indexstrukturoptimierung und Konnektivitätsgarantie, um die Leistung kartesischer Vektordatenbanken zu verbessern. Full-Stack-Vektortechnologie: höhere Genauigkeit und stärkere LeistungMit dem Segen der oben genannten Full-Stack-Vektortechnologie belegte Zero One Thousand Cartesian Vector Database nicht nur den ersten Platz in der maßgeblichen ANN-Liste 6 Benchmarks-Rezensionen. Darüber hinaus bietet es wesentliche Vorteile wie eine höhere Genauigkeit und eine stärkere Leistung in praktischen Anwendungsszenarien. Zero One Everything Cartesian Vector Database konzentriert sich derzeit auf leistungsstarke Vektordatenbanken. Hochleistungs-Vektordatenbanken beziehen sich normalerweise auf Vektordatensätze mit Skalen von mehreren zehn Millionen oder weniger (z. B. 20 Millionen 128-dimensionale Gleitkomma-Vektoren). Im Allgemeinen können Hochleistungs-Vektordatenbanken problemlos 80 bis 90 Prozent der täglichen Daten verarbeiten Beispielsweise hilft es Unternehmenskunden beim Aufbau privater Wissensdatenbanken und intelligenter Kundendienstsysteme im Bereich des autonomen Fahrens. Durch den Einsatz leistungsstarker Vektordatenbanken kann das Training autonomer Fahrmodelle beschleunigt werden. Zero One Thousand High-Performance Vector Database bietet die folgenden Vorteile:
- Ultrahohe Genauigkeit: Basierend auf mehrschichtigen Miniaturansichten und Koordinatensystemen, Navigation zwischen den Schichten und auf der Karte Die Orientierungsnavigation wird realisiert, die Konnektivität ist gewährleistet und die Genauigkeit liegt bei über 99 %. Bei gleicher Leistung liegt die Genauigkeit deutlich über dem Branchenniveau.
- Superhohe Leistung: Effiziente Kantenauswahl- und Zuschneidetechnologie, zig Millionen Datenbank-MS-Antworten.
Nehmen Sie als Beispiel das E-Commerce-Empfehlungsszenario. Die Anzahl der Produkte in den Regalen kann mehrere zehn Millionen betragen, und jedes Produkt kann durch einen Vektor ausgedrückt werden. Selbst wenn die Anzahl der Vektoren in der Bibliothek nicht sehr groß ist, kann sie Hunderttausende oder sogar Millionen QPS erreichen, wenn die E-Commerce-Benutzerbasis sehr groß ist und die Anzahl der Benutzeranfragen pro Sekunde zu Spitzenzeiten sehr groß ist . Durch den Einsatz leistungsstarker Vektordatenbanken kann die Empfehlungswirkung von Such- und Werbediensten im E-Commerce-Szenario effektiv verbessert werden, sodass jeder nicht mehr anders kann, als weiter zu kaufen. Zero One Everything Representation, eine kartesische Vektordatenbank, ist der erste auf RAG basierende Versuch des Teams und wird effektiv in KI-Produktivitätsprodukten eingesetzt, die in naher Zukunft veröffentlicht werden. In Zukunft, nachdem jedes Hauptmodell bis zu einem gewissen Grad optimiert wurde, können die Fähigkeiten der Vektordatenbank die Obergrenze jedes Hauptmodells bestimmen. Zero One Wish wird sich auch in Zukunft auf Forschung und Entwicklung sowie den Austausch konzentrieren, um den Benutzern bessere Technologie und Erfahrung zu bieten. Das obige ist der detaillierte Inhalt von01Wangs selbstentwickelte vollständige Navigationskarten-Vektordatenbank belegte sechs erste Plätze auf der maßgeblichen Liste. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!