隨著IRIS 中向量資料類型和向量搜尋功能的引入,為應用程式的開發打開了一個充滿可能性的世界,這些應用程式的一個範例是我最近在公開競賽中看到的一個範例巴倫西亞衛生部要求提供一種工具來協助使用人工智慧模型進行ICD-10 編碼。
我們如何實現與所要求的應用程式類似的應用程式?讓我們看看我們需要什麼:
IRIS 為我們提供什麼來滿足上述需求?
好吧,我們只需要看看開發的範例:
與本文相關,您可以訪問已開發的應用程序,在接下來的文章中,我們將詳細了解如何實現每個功能,從模型的使用、向量的存儲和向量搜索的使用.
讓我們回顧一下應用程式:
從設定畫面中,我們被告知 CSV 檔案的格式必須符合我們要匯入的 ICD-10 代碼。載入和向量化過程會消耗大量時間和資源,這就是為什麼 Docker 容器的部署不僅要配置 Docker 可用的 RAM 內存,還要配置磁碟內存,以防需求超出分配的 RAM:
雷雷帶有ICD-10程式碼的檔案位於專案路徑/shared/cie10/icd10.csv,一旦達到100%,應用程式就可以使用了。
在我們的應用程式中,我們定義了兩種不同的診斷編碼功能,一種基於系統中接收到的 HL7 訊息,另一種基於純文字。
專案包含一些準備測試的HL7訊息,只需將/shared/hl7/messagesa01_en.hl7檔案複製到/shared/HL7In資料夾和相關生產將負責從中提取診斷結果並將其顯示在Web 應用程式中:
從診斷請求畫面中,我們可以看到透過 HL7 訊息傳遞收到的所有診斷。要將它們編碼為 ICD-10,我們只需點擊放大鏡即可顯示最接近收到的診斷結果的 ICD-10 代碼清單:
選擇後,我們將在清單中看到診斷及其相關的 ICD-10 代碼。透過點擊帶有信封圖示的按鈕,將使用原始訊息產生一條訊息,並包含在診斷段中選擇的新訊息:
雷雷這則訊息可以在路徑/shared/HL7Out
中找到透過文字分析器選項,使用者可以包含將對其執行分析過程的純文字。該應用程式將搜尋 3 個詞形還原單字的元組(消除冠詞、代名詞和其他不太相關的單字)。分析後,系統將向我們顯示相關的帶下劃線的文本以及可能的診斷:
分析完成後,可以隨時從分析歷史記錄中查閱。
所有進行的分析都會被記錄並可以隨時查閱,能夠查看所有可能的 ICD-10 代碼:
We will see how, using Embedded Python, we use a specific LLM model for the vectorization of both the ICD-10 codes that we will use as context and the free texts.
If you have any questions or suggestions, do not hesitate to write a comment on the article.
以上是d[IA]gnosis:使用 IRIS for Healt 開發 RAG 應用程式的詳細內容。更多資訊請關注PHP中文網其他相關文章!