Heim > Technologie-Peripheriegeräte > KI > Verwendung von Azure Semantic Search und OpenAI zum Aufbau eines kognitiven Suchsystems

Verwendung von Azure Semantic Search und OpenAI zum Aufbau eines kognitiven Suchsystems

DDD
Freigeben: 2023-10-12 10:18:04
nach vorne
834 Leute haben es durchsucht

Im heutigen digitalen Zeitalter sind robuste, skalierbare und effiziente Systeme mehr als nur ein Wettbewerbsvorteil; Das ist notwendig. Unabhängig davon, ob Sie die Verarbeitung von Benutzereingaben optimieren möchten, um die Dokumentsuche zu vereinfachen, ist eine Kombination aus Diensten und Plattformen der Schlüssel zu beispielloser Leistung. In diesem Artikel untersuchen wir einen ganzheitlichen Ansatz, der die Leistungsfähigkeit von Azure Cognitive Services mit den Funktionen von OpenAI kombiniert. Indem Sie sich mit Absichtserkennung, Dokumentenfilterung, domänenspezifischen Algorithmen und Textzusammenfassung befassen, lernen Sie, ein System zu erstellen, das nicht nur die Absicht des Benutzers versteht, sondern auch Informationen effizient verarbeitet und präsentiert.

Wir werden Folgendes erstellen:

Verwendung von Azure Semantic Search und OpenAI zum Aufbau eines kognitiven Suchsystems

Umgebung einrichten

Bevor wir loslegen, stellen wir sicher, dass die erforderlichen Pakete installiert und Umgebungsvariablen festgelegt sind:

!pip show azure-search-documents
%pip install azure-search-documents --pre
%pip show azure-search-documents
!pip install python-dotenv
!pip install openai
import os
import requests
import json
import openai
openai.api_key = os.getenv("AZURE_OPENAI_KEY")
openai.api_base = os.getenv("AZURE_OPENAI_ENDPOINT")
openai.api_type = 'azure'
openai.api_version = '2023-05-15'
# Look in Azure OpenAI Studio > Deployments
deployment_name = 'gpt-35-turbo'
Nach dem Login kopieren

Hier verwenden wir die erforderlichen API-Schlüssel, Endpunkte und Typen zum Einrichten der OpenAI-Umgebung.

Azure Search einrichten

Um Azure Semantic Search nutzen zu können, müssen wir die notwendigen Module importieren und die Umgebung einrichten.

import os
from azure.core.credentials import AzureKeyCredential
from azure.search.documents.indexes import SearchIndexClient
from azure.search.documents import SearchClient
from azure.search.documents.indexes.models import (
    ComplexField,
    CorsOptions,
    SearchIndex,
    ScoringProfile,
    SearchFieldDataType,
    SimpleField,
    SearchableField
)
Nach dem Login kopieren

Nach dem Importieren des Moduls können wir jetzt den Azure Search-Dienstendpunkt und den API-Schlüssel einrichten:

# 从环境中设置服务端点和 API 密钥
service_name = "xxxxx"
admin_key ="xxxxx"
# 如果您共享密钥 - 请确保您的 index_name 是唯一的!
index_name = "hotels-quickstart"
# 创建 SDK 客户
endpoint = "https://{}.search.windows.net/".format(service_name)
admin_client = SearchIndexClient(endpoint=endpoint,
                      index_name=index_name,
                      credential=AzureKeyCredential(admin_key))

search_client = SearchClient(endpoint=endpoint,
                      index_name=index_name,
                      credential=AzureKeyCredential(admin_key))
Nach dem Login kopieren

(Hinweis: Stellen Sie sicher, dass Sie Ihren Schlüssel maskieren oder verbergen, bevor Sie Code freigeben.)

für die Vorbereitung der Azure Semantic Search der Index

Bevor wir Daten zu Azure Search hinzufügen, müssen wir einen Index definieren, der die Struktur der Daten beschreibt:

# 删除索引(如果存在)
try:
    result = admin_client.delete_index(index_name)
    print ('Index', index_name, 'Deleted')
except Exception as ex:
    print (ex)
Nach dem Login kopieren

Dieses Codefragment stellt sicher, dass der Index gelöscht wird, wenn er bereits vorhanden ist. Dies ist nützlich, wenn Sie Code erneut ausführen oder Indizes ändern.

Jetzt geben wir das Schema des Index an:

# 指定索引模式
name = index_name 
fields = [ 
        SimpleField(name= "HotelId" , type=SearchFieldDataType.String, key= True ), 
        SearchableField(name= "HotelName" , type=SearchFieldDataType.String, sortable= True ), 
        SearchableField (名称= “描述”,类型=SearchFieldDataType.String,analyzer_name= “en.lucene”),
        SearchableField(名称= “Description_fr”,类型=SearchFieldDataType.String,analyzer_name= “fr.lucene”),
        SearchableField(名称= “类别”、 type=SearchFieldDataType.String、facetable= True、filterable= True、sortable= True )、
        SearchableField(name= "Tags"、collection= True、type=SearchFieldDataType.String、facetable= True、filterable= True )、
        SimpleField(name = “ParkingInincluded”,类型=SearchFieldDataType.Boolean,facetable= True,filterable= True,sortable= True),
        SimpleField(name= “LastRenovationDate”,type=SearchFieldDataType.DateTime关闭设置,facetable= True,filterable=True、sortable= True )、
        SimpleField(name= "Rating"、 type=SearchFieldDataType.Double、facetable= True、filterable= True、sortable= True )、
        ComplexField(name= "地址"、 fields=[ 
            SearchableField(name= " StreetAddress"、 type=SearchFieldDataType.String)、
            SearchableField(name= "City"、 type=SearchFieldDataType.String、facetable= True、 filterable= True、 sortable= True )、
            SearchableField(name= "StateProvince"、 type=SearchFieldDataType.String、facetable= True、filterable= True、sortable= True )、
            SearchableField(name= "邮政编码"、 type=SearchFieldDataType.String、facetable= True、filterable= True、sortable= True )、
            SearchableField(name = “国家”,类型= SearchFieldDataType.String,facetable = True,filterable = True,sortable = True),
        ])
    ] 
cors_options = CorsOptions(allowed_origins = [ “*” ],max_age_in_seconds = 60)
Scoring_profiles = [] 
suggester = [{ 'name' : 'sg' , 'source_fields' : [ '标签' , '地址/城市' , '地址/国家' ]}]
Nach dem Login kopieren

Als nächstes müssen Sie diesen Index auf Azure erstellen:

index = SearchIndex(
    name=name,
    fields=fields,
    scoring_profiles=scoring_profiles,
    suggesters = suggester,
    cors_options=cors_options)
try:
    result = admin_client.create_index(index)
    print ('Index', result.name, 'created')
except Exception as ex:
    print (ex)
Nach dem Login kopieren

Nach dem Erstellen des Index müssen wir ihn mit Dokumenten füllen. Es ist wichtig darauf hinzuweisen, dass es sich um jede Art von Dokument handeln kann! Ich füge hier einfach manuell die Dokumente hinzu, die im Blob-Speicher verbleiben:

文档 = [ 
    { 
    "@search.action": "上传", "@search.action" : "上传" , 
    "HotelId" : "1" , 
    "HotelName" : "秘密点汽车旅馆" , 
    "Description" : "酒店地理位置优越,位于纽约市中心的城市主要商业干道上。几分钟即可到达时代广场和城市的历史中心,以及使纽约成为美国最具吸引力的城市之一的其他名胜古迹和国际大都市。” ,
    “Description_fr”:“L'hôtel est idéalement situé sur la prime artère Commerciale de la ville en plein cœur de New York.A insi que d'autres lieux d'intérêt qui font纽约的城市充满魅力和美国的国际化。” , 
    "Category" : "精品店" , 
    "Tags" : [ "游泳池" , "空调" , "礼宾服务" ], 
    "ParkingInincluded" : "false" , 
    "LastRenovationDate" : "1970-01-18T00:00:00Z ”,
    "Rating" : 3.60 , 
    "Address" : {    
        “StreetAddress”:“677 第五大道”,
        “City”:“纽约”,
        “StateProvince”:“纽约” ,
        “PostalCode”:“10022”,
        “Country”:“美国”
         } 
    },
    { 
    “@search. action" : "上传" , 
    "HotelId" : "2" , 
    "HotelName" : "双圆顶汽车旅馆" , 
    "Description" :“该酒店坐落在一座十九世纪的广场上,该广场已按照最高建筑标准进行扩建和翻新,打造出一座现代化、实用的一流酒店,艺术和独特的历史元素与最现代的舒适设施共存。” , 
    "Description_fr" : "L'hôtel 位于十九世纪的地方,是一座现代化酒店的高级规范建筑,在艺术和历史独特方面具有一流的功能和一流的设计舒适与现代共存。” , 
    "Category" : "精品店" , 
    "Tags" : [ "泳池" ,], 
    "ParkingInincluded" : "false" , 
    "LastRenovationDate" : "1979-02-18T00:00:00Z" , 
    "Rating" : 3.60 , 
    "Address" : { 
        "StreetAddress" : "140 大学城中心" , 
        "City”:“萨拉索塔”,
        “StateProvince”:“佛罗里达州”,
        “PostalCode”:“34243”,
        “Country”:“美国”
         } 
    },
    { 
    "@search.action" : "上传" , 
    "HotelId" :"3" , 
    "HotelName" : "三重景观酒店" , 
    "Description" : "该酒店在 William Dough 的管理下以其卓越的美食脱颖而出,他为酒店的所有餐厅服务提供建议并监督。" , 
    "Description_fr" : "L'hôtel 位于十九世纪的地方,是一座现代化酒店的高级规范建筑,在艺术和历史独特方面具有一流的功能和一流的设计舒适与现代共存。” , 
    "Category" : "度假村中心" ,
    "Tags" : [ "酒吧" , "欧陆式早餐" ], 
    "ParkingInincluded" : "true" , 
    "LastRenovationDate" : "2015-09-20T00:00:00Z" , 
    "Rating" : 4.80 , 
    "Address" : { 
        "StreetAddress" : “3393 Peachtree Rd”、
        “City”:“亚特兰大”、
        “StateProvince”:“GA”、
        “PostalCode”:“30326”、
        “Country”:“美国”
         } 
    }
]
Nach dem Login kopieren

Schieben Sie diese Dokumente nun in den semantischen Suchindex.

try:
    result = search_client.upload_documents(documents=documents)
    print("Upload of new document succeeded: {}".format(result[0].succeeded))
except Exception as ex:
    print (ex.message)
Nach dem Login kopieren

Integration mit OpenAI

Lassen Sie uns eine Verbindung zu OpenAI herstellen:

question="What is the address of ChatGpt Hotel?"
Nach dem Login kopieren

Dann fügen Sie eine Azure OpenAI-Verbindung hinzu:

###
import os
import requests
import json
import openai
os.environ["AZURE_OPENAI_KEY"] = "xxxx"
os.environ["AZURE_OPENAI_ENDPOINT"] = "xxxx"
openai.api_key = os.getenv("AZURE_OPENAI_KEY")
openai.api_base = os.getenv("AZURE_OPENAI_ENDPOINT")
openai.api_type = 'azure'
openai.api_version = '2023-05-15'
# 在 Azure OpenAI Studio > 部署中查找
deployment_name = 'gpt-35-turbo'
###
# 定义一个函数,根据系统消息和消息创建提示
def create_prompt(system_message, messages):
    prompt = system_message
    message_template = "\n<|im_start|>{}\n{}\n<|im_end|>"
    for message in messages:
        prompt += message_template.format(message[&#39;sender&#39;], message[&#39;text&#39;])
    prompt += "\n<|im_start|>assistant\n"
    return prompt
# 定义系统消息
system_message_template = "<|im_start|>system\n{}\n<|im_end|>"
system_message = system_message_template.format("")
print(system_message)
Nach dem Login kopieren

An diesem Punkt können Sie Semantic Search und Azure OpenAI verwenden. Lassen Sie uns die semantische Suche abfragen:

import json
results =  search_client.search(search_text=question, include_total_count=True, select=&#39;HotelId,HotelName,Tags,Address&#39;)=  search_client.search(search_text=question, include_total_count=True, select=&#39;HotelId,HotelName,Tags,Address&#39;)
json_results=""
print (&#39;Total Documents Matching Query:&#39;, results.get_count())
for result in results:
    #print("{}: {}: {}".format(result["HotelId"], result["HotelName"], result["Tags"],results["Address"]))
    json_results+=str(result)
print(json_results)
Nach dem Login kopieren

Mit den vorliegenden Suchergebnissen können wir jetzt Azure OpenAI nutzen, um die Ergebnisse zu interpretieren oder weiterzuverarbeiten.

# 创建消息列表来跟踪对话
messages = [{"sender": "user", "text": "Hello, take into account the following information "+json_results},
            {"sender": "user", "text": question},
            ]
response = openai.Completion.create(
  engine=deployment_name,
  prompt= create_prompt(system_message, messages),
  temperature=0.7,
  max_tokens=800,
  top_p=0.95,
  frequency_penalty=0,
  presence_penalty=0,
    stop=["<|im_end|>"])
print(response)
Nach dem Login kopieren

Dieser Code fordert das OpenAI-Modell mit Suchergebnissen und unserer ursprünglichen Frage auf, sodass es auf der Grundlage der Daten aussagekräftige Informationen verarbeiten und bereitstellen kann.

Fazit

In diesem Artikel haben wir erfahren, wie wir die Leistungsfähigkeit der Azure Semantic Search mit den Funktionen von OpenAI kombinieren können. Durch die Integration dieser beiden leistungsstarken Tools können wir Benutzern umfassende, intelligente Suchergebnisse in unseren Anwendungen bereitstellen.

Das obige ist der detaillierte Inhalt vonVerwendung von Azure Semantic Search und OpenAI zum Aufbau eines kognitiven Suchsystems. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:Dr. Ernesto Lee
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage