前のブログでは、APOC と Graph Data Science Library - GDS という 2 つのプラグインを使用して neo4j をローカルにインストールしてセットアップする方法を説明しました。このブログでは、おもちゃのデータセット (電子商取引 Web サイトの製品) を取得し、それを Neo4j に保存します。
Neo4j に十分なメモリを割り当てる
ユースケースで巨大なデータがある場合は、データのロードを開始する前に、十分な量のメモリが neo4j に割り当てられていることを確認してください。そのためには:
neo4j.conf
neo4j.conf で
heap
を検索し、行 77、78 のコメントを解除して、
- 256mを2048mに変更します。これにより、neo4j のデータ ストレージに 2048MB が割り当てられるようになります。
ノードの作成
グラフには 2 つの主要なコンポーネントのノードと関係があります。最初にノードを作成し、後で関係を確立しましょう。
- 私が使用しているデータはここにあります - data
- ここにあるrequirements.txtを使用してPython仮想環境を作成します -requirements.txt
- データをプッシュするためのさまざまな関数を定義しましょう。
- 必要なライブラリをインポートする
リーリー
openai を使用して埋め込みを生成します
リーリー
データセットに従って、2 つの一意のノード ラベルを持つことができます。
Category
: 製品のカテゴリ、
- Product: 製品の名前。カテゴリラベルを作成しましょう。neo4j はプロパティと呼ばれるものを提供します。これらは特定のノードのメタデータであると想像できます。ここで、nameとembeddingがプロパティです。したがって、カテゴリの名前とそれに対応する埋め込みを DB に保存しています。リーリー
同様に製品ノードを作成できます。ここでのプロパティは、
name
、
- description、price、warranty_period、available_stock、review_rated、product_release_date、エディングリーリーここで、上記の 2 つの関数によって生成されたクエリを実行する別の関数を作成しましょう。ユーザー名とパスワードを適切に更新してください。
リーリー
リーリー
人間関係を築く
Category
と
Product
の間にリレーションシップを作成します。リレーションシップの名前は
- CATEGORY_CONTAINS_PRODUCTになります。リーリーMATCH クエリを使用して既に作成されたノードと一致させることで、ノード間の関係を確立します。
開く
アイコンの上にカーソルを置き、
neo4jブラウザ
をクリックして、作成したノードを視覚化します。
そして、データは埋め込みとともに neo4j にロードされます。
今後のブログでは、Python を使用してグラフ クエリ エンジンを構築し、取得したデータを使用して拡張生成を行う方法を説明します。
これがお役に立てば幸いです...また会いましょう !!!
LinkedIn - https://www.linkedin.com/in/praveenr2998/
Github - https://github.com/praveenr2998/Creating-Lightweight-RAG-Systems-With-Graphs/tree/main/push_data_to_db
以上がNeo4j へのデータのロードの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。