Heim > Technologie-Peripheriegeräte > KI > Wiederaufnahme der Augmented -Generation in SQLite

Wiederaufnahme der Augmented -Generation in SQLite

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
Freigeben: 2025-02-26 02:49:09
Original
562 Leute haben es durchsucht

Diese zweiteilige Serie untersucht die Verwendung von SQLite für maschinelles Lernen. Der vorherige Artikel erläuterte die wachsende Rolle von SQLite bei produktionsbereiten Webanwendungen. Dieser Artikel konzentriert sich auf die Implementierung der Abruf-Generation (RAG) mit SQLite.

Für benutzerdefinierte Webanwendungen mit generativer KI besuchen Sie LosangelesaiApps.com

Der Code ist verfügbar hier .

traditionelle Lag -Implementierung beinhaltet häufig:

  1. Auf der Suche nach Tutorials auf Rag.
  2. Auswählen eines beliebten Rahmens (Langchain, llamaindex).
  3. Auswählen einer Cloud -Vektor -Datenbank (Pnecone, Waaviate).
  4. integrieren Sie diese Komponenten.

Obwohl wir effektiv sind, kann dieser Ansatz insbesondere für Anfänger zu komplex sein. Dieser Artikel zeigt eine einfachere Methode mit SQLite mit der Erweiterung sqlite-vec und der OpenAI -API. Teil 1 dieser Serie bietet einen detaillierten Überblick über die Funktionen von SQLite. Für diesen Artikel reicht es aus, die Einfachheit von SQLite als Einzelfilmatenbank zu verstehen.

Dieser Ansatz beseitigt die Notwendigkeit von Cloud -Vektor -Datenbanken und sperrigen Frameworks.

Die Stärke von sqlite liegt in seiner Erweiterbarkeit. Erweiterungen, ähnlich wie in Python-Bibliotheken, fügen Sie die in C geschriebene Funktionalität hinzu. Ein Hauptbeispiel ist die FTS-Erweiterung (Full-Text-Search).

fügt Vektorsuchfunktionen hinzu und ermöglicht das semantische Verständnis über die Keyword -Übereinstimmung hinaus. Die Suche nach "Pferden" könnte "Equestrian" oder "Pony" zurückkehren.

sqlite-vec

verwendet virtuelle Tabellen und bietet an:

sqlite-vec

    benutzerdefinierte Datenquellen:
  • Daten können außerhalb der Datenbankdatei (z. B. CSV, API). liegen.
  • Flexible Funktionalität: unterstützt spezielle Indizierung und komplexe Datentypen.
  • nahtlose Integration: Integriert in die Standard -SQLite -Abfrage -Syntax.
  • Module: Die Backend -Logik wird in einem separaten Modul implementiert.
virtuelle Tabellen werden mit:

erstellt

CREATE VIRTUAL TABLE my_table USING my_extension_module();
Nach dem Login kopieren
Nach dem Login kopieren

Gibt das Modul an (hier my_extension_module() aus vec0). sqlite-vec

Code -Walkthrough

Der Code (

repo link ) verwendet Dateien als Beispieldaten (meist physikalisch bezogen). .txt ist die SQLite -Datenbankdatei. my_docs.db

  1. Installation: listet die erforderlichen Bibliotheken (requirements.txt, sqlite-vec, openai) auf. Erstellen Sie eine virtuelle Umgebung und führen Sie python-dotenv. pip install -r requirements.txt aus

  2. OpenAI -API -Schlüssel: Erhalten Sie einen OpenAI -API -Schlüssel.

  3. Laden der Erweiterung: Der Python -Code lädt die Erweiterung sqlite-vec und erstellt eine virtuelle Tabelle:

CREATE VIRTUAL TABLE my_table USING my_extension_module();
Nach dem Login kopieren
Nach dem Login kopieren

Die Tabelle documents speichert Emetten (embedding), Dateinamen (file_name) und Inhalt (content). bezeichnet Hilfsfelder.

  1. Einbettung und Einfügen: Die Code iteriert .txt Dateien, generiert Einbetten mithilfe der OpenAI -API und fügt sie in die Datenbank ein:
db.enable_load_extension(True)
sqlite_vec.load(db)
db.enable_load_extension(False)

db.execute('''
    CREATE VIRTUAL TABLE documents USING vec0(
        embedding float[1536],
        +file_name TEXT,
        +content TEXT
    )
''')
Nach dem Login kopieren
  1. RAG -Abfrage: Eine KNN -Abfrage ruft ähnliche Dokumente basierend auf der Einbettung der Ähnlichkeit ab:
# ... (OpenAI embedding function) ...

for file_name in os.listdir("data"):
    # ... (Open file, get content, get embedding) ...
    db.execute(
        'INSERT INTO documents (embedding, file_name, content) VALUES (?, ?, ?)',
        (serialize_float32(embedding), file_name, content)
    )
db.commit()
Nach dem Login kopieren

Die Ergebnisse werden dann als Kontext für eine OpenAI -Chat -Fertigstellung verwendet, um die Abfrage zu beantworten.

Schlussfolgerung

sqlite-vec vereinfacht Lag erheblich. Es beseitigt die Notwendigkeit komplexer Frameworks und Cloud-Dienste, so dass es kostengünstig und leicht zu iterieren ist. Während die Skalierung möglicherweise eine robustere Datenbank erfordern, bietet sqlite-vec eine überzeugende Lösung für kleinere Projekte. Die Erweiterung unterstützt mehrere Programmiersprachen.

Retrieval Augmented Generation in SQLite

Das obige ist der detaillierte Inhalt vonWiederaufnahme der Augmented -Generation in SQLite. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage