d[IA]gnosis: IRIS for Healt を使用した RAG アプリケーションの開発
IRIS でのベクトル データ型とベクトル検索機能の導入により、アプリケーション開発の可能性が無限に広がります。これらのアプリケーションの一例は、私が最近見たものです。バレンシアの保健省は、AI モデルを使用した ICD-10 コーディングを支援するツールをリクエストしました。
要求されたものと同様のアプリケーションを実装するにはどうすればよいでしょうか?何が必要なのか見てみましょう:
- ICD-10 コードのリスト。RAG アプリケーションのコンテキストとして使用して、プレーン テキスト内の診断を検索します。
- ICD-10 コード内の同等性を探すテキストをベクトル化するトレーニング済みモデル。
- ICD-10 コードとテキストの取り込みとベクトル化に必要な Python ライブラリ。
- 診断の候補を探すテキストをサポートするフレンドリーなフロントエンド。
- フロントエンドから受信したリクエストのオーケストレーション。
IRIS は上記のニーズをカバーするために何を提供しますか?
- RecordMapper 機能を使用するか、埋め込み Python を直接使用して CSV インポートします。
- 組み込み Python を使用すると、選択したモデルを使用してベクトルを生成するために必要な Python コードを実装できます。
- フロントエンド アプリケーションから呼び出される REST API を公開します。
- IRIS 内の情報の追跡を可能にする相互運用性のプロダクション。
そうですね、開発された例を確認するだけで十分です。
d[IA]gnosis
この記事に関連して、開発されたアプリケーションにアクセスできます。次の記事では、モデルの使用、ベクトルの保存、ベクトル検索の使用に至るまで、各機能を実装する方法を詳しく説明します。 .
アプリケーションを確認してみましょう:
ICD-10 コードのインポート
設定画面には、インポートする CSV ファイルが ICD-10 コードに準拠している必要があるという形式が示されます。読み込みとベクトル化のプロセスは多くの時間とリソースを消費します。そのため、Docker コンテナのデプロイメントでは、要件が割り当てられた RAM を超える場合に備えて、Docker が使用できる RAM メモリだけでなくディスク メモリも構成されます。
# iris iris: init: true container_name: iris build: context: . dockerfile: iris/Dockerfile ports: - 52774:52773 - 51774:1972 volumes: - ./shared:/shared environment: - ISC_DATA_DIRECTORY=/shared/durable command: --check-caps false --ISCAgent false mem_limit: 30G memswap_limit: 32G
ICD-10 コードを含むファイルはプロジェクト パス /shared/cie10/icd10.csv で入手できます。100% に達すると、アプリケーションを使用できるようになります。
私たちのアプリケーションでは、診断コーディング用に 2 つの異なる機能を定義しました。1 つはシステムで受信した HL7 メッセージに基づいており、もう 1 つはプレーン テキストに基づいています。
HL7 からの診断キャプチャ
プロジェクトには、テスト用に準備された HL7 メッセージがいくつか含まれています。/shared/hl7/messagesa01_en.hl7 ファイルを /shared/HL7In フォルダーにコピーするだけで済みます。関連するプロダクションは、そこから診断を抽出して Web アプリケーションに表示する責任を負います:
診断リクエスト画面から、HL7 メッセージング経由で受信したすべての診断を確認できます。それらを ICD-10 にコード化するには、虫眼鏡をクリックするだけで、受け取った診断に最も近い ICD-10 コードのリストが表示されます。
選択すると、診断とそれに関連する ICD-10 コードがリストに表示されます。封筒アイコンのボタンをクリックすると、元のメッセージを使用し、診断セグメント内で選択された新しいメッセージを含むメッセージが生成されます。
MSH|^~\&|HIS|HULP|EMPI||||ADT^A08|592956|P|2.5.1 EVN|A01| PID|||1556655212^^^SERMAS^SN~922210^^^HULP^PI||GARCÍA PÉREZ^JUAN^^^||20150403|M|||PASEO PEDRO ÁLVAREZ 195 1 CENTRO^^LEGANÉS^MADRID^28379^SPAIN||555283055^PRN^^JUAN.GARCIA@YAHOO.COM|||||||||||||||||N| PV1||N DG1|1||O10.91^Unspecified pre-existing hypertension complicating pregnancy^CIE10-ES|Gestational hypertension||A||
このメッセージはパス /shared/HL7Out
にあります。平文での診断のスクリーンショット
[テキスト アナライザー] オプションから、ユーザーは分析プロセスが実行されるプレーン テキストを含めることができます。アプリケーションは、見出し語化された 3 つの単語のタプルを検索します (冠詞、代名詞、およびその他の関連性の低い単語を削除します)。分析が完了すると、システムは関連する下線付きのテキストと、特定された可能性のある診断を表示します。
分析が実行されると、分析履歴からいつでも参照できます。
分析履歴
実行されたすべての分析は記録され、いつでも参照でき、利用可能なすべての ICD-10 コードを表示できます。
次の記事では...
組み込み Python を使用して、コンテキストとして使用する ICD-10 コードとフリー テキストの両方のベクトル化に特定の LLM モデルを使用する方法を見ていきます。
ご質問やご提案がございましたら、お気軽に記事にコメントを書いてください。
以上がd[IA]gnosis: IRIS for Healt を使用した RAG アプリケーションの開発の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











このチュートリアルでは、Pythonを使用してZIPFの法則の統計的概念を処理する方法を示し、法律の処理時にPythonの読み取りおよび並べ替えの効率性を示します。 ZIPF分布という用語が何を意味するのか疑問に思うかもしれません。この用語を理解するには、まずZIPFの法律を定義する必要があります。心配しないでください、私は指示を簡素化しようとします。 ZIPFの法則 ZIPFの法則は単に意味します。大きな自然言語のコーパスでは、最も頻繁に発生する単語は、2番目の頻繁な単語のほぼ2倍の頻度で表示されます。 例を見てみましょう。アメリカ英語の茶色のコーパスを見ると、最も頻繁な言葉は「thであることに気付くでしょう。

この記事では、Pythonライブラリである美しいスープを使用してHTMLを解析する方法について説明します。 find()、find_all()、select()、およびget_text()などの一般的な方法は、データ抽出、多様なHTML構造とエラーの処理、および代替案(SEL

ノイズの多い画像を扱うことは、特に携帯電話や低解像度のカメラの写真でよくある問題です。 このチュートリアルでは、OpenCVを使用してPythonの画像フィルタリング手法を調査して、この問題に取り組みます。 画像フィルタリング:強力なツール 画像フィルター

データサイエンスと処理のお気に入りであるPythonは、高性能コンピューティングのための豊富なエコシステムを提供します。ただし、Pythonの並列プログラミングは、独自の課題を提示します。このチュートリアルでは、これらの課題を調査し、グローバルな承認に焦点を当てています

この記事では、深い学習のためにTensorflowとPytorchを比較しています。 関連する手順、データの準備、モデルの構築、トレーニング、評価、展開について詳しく説明しています。 特に計算グラップに関して、フレームワーク間の重要な違い

このチュートリアルでは、Python 3にカスタムパイプラインデータ構造を作成し、機能を強化するためにクラスとオペレーターのオーバーロードを活用していることを示しています。 パイプラインの柔軟性は、一連の機能をデータセットに適用する能力にあります。

Pythonオブジェクトのシリアル化と脱介入は、非自明のプログラムの重要な側面です。 Pythonファイルに何かを保存すると、構成ファイルを読み取る場合、またはHTTPリクエストに応答する場合、オブジェクトシリアル化と脱滑り化を行います。 ある意味では、シリアル化と脱派化は、世界で最も退屈なものです。これらすべての形式とプロトコルを気にするのは誰ですか? Pythonオブジェクトを維持またはストリーミングし、後で完全に取得したいと考えています。 これは、概念レベルで世界を見るのに最適な方法です。ただし、実用的なレベルでは、選択したシリアル化スキーム、形式、またはプロトコルは、プログラムの速度、セキュリティ、メンテナンスの自由、およびその他の側面を決定する場合があります。

Pythonの統計モジュールは、強力なデータ統計分析機能を提供して、生物統計やビジネス分析などのデータの全体的な特性を迅速に理解できるようにします。データポイントを1つずつ見る代わりに、平均や分散などの統計を見て、無視される可能性のある元のデータの傾向と機能を発見し、大きなデータセットをより簡単かつ効果的に比較してください。 このチュートリアルでは、平均を計算し、データセットの分散の程度を測定する方法を説明します。特に明記しない限り、このモジュールのすべての関数は、単に平均を合計するのではなく、平均()関数の計算をサポートします。 浮動小数点数も使用できます。 ランダムをインポートします インポート統計 fractiから
