Heim > Technologie-Peripheriegeräte > KI > Eine umfassende Anleitung zur Moderation von Chatgpt -Antworten mit GPT -Modellen

Eine umfassende Anleitung zur Moderation von Chatgpt -Antworten mit GPT -Modellen

Joseph Gordon-Levitt
Freigeben: 2025-03-10 10:57:10
Original
729 Leute haben es durchsucht

KI -Qualitätsüberprüfung: Verwenden Sie KI, um die Anwendungsqualität zu verbessern

Die Revolution der künstlichen Intelligenz hat das Gebiet der Anwendungsentwicklung übernommen und eine neue Ära der Human-Computer-Interaktion eröffnet. Während Enterprises KI nutzen, um die Benutzererfahrung zu verbessern, stellen Lösungen auf der Grundlage von großen Sprachmodellen (LLM) auch Herausforderungen bei der Aufrechterhaltung der Integrität, Genauigkeit und ethischen Standards.

Die Notwendigkeit verantwortungsbewusster KI -Audits wird immer deutlicher, wenn sich die Anwendungen über kontrollierte Umgebungen hinaus ausdehnen. In diesen Umgebungen ist die Gewährleistung einer vernünftigen und genauen Reaktion auf Benutzer nicht einfach, aber entscheidend.

Zum Beispiel können bei Interaktionen des Kundendienstes Fehlinformationen oder unangemessene Inhalte zur Unzufriedenheit der Kunden führen und sogar den Ruf des Unternehmens beschädigen. Wie können wir als Entwickler jedoch sicherstellen, dass AI-basierte Anwendungen den Benutzern angemessene und genaue Antworten liefern können? Hier kommt das AI -Audit ins Spiel!

In diesem Artikel wird eine Technologie ausführlich untersucht, mit der das GPT-Modell zur Prüfung von GPT-basierten Anwendungen verwendet wird. Erstellen Sie einen GPT-basierten Qualitätsprüfungsagent

Die Qualitätsüberprüfung von

KI umfasst auch die Sicherstellung, dass unvoreingenommene und geeignete Antworten bei der Verwendung von großsprachigen Modellen (LLM) generiert werden. OpenAI hat eine API für solche Prüfungsanforderungen gestartet. Wenn Sie unbedingt voreingenommene oder unangemessene Antworten erkennen möchten, die von Ihrem Modell generiert werden oder das Fehlverhalten von Benutzern angesprochen werden, finden Sie wertvolle Erkenntnisse in dem Artikel mit dem Titel CHATGPT Audit API: Eingabe/Ausgangskontrolle.

Dieser Artikel verwendet jedoch einen anderen Ansatz für die KI -Prüfung. Unser Fokus liegt auf der Sicherstellung der Qualität der Modellreaktion, der Genauigkeit und der Erfüllung der Benutzerbedürfnisse. Soweit ich weiß, gibt es derzeit keine offiziellen Endpunkte, die speziell für diesen Zweck entwickelt wurden.

Dennoch verwenden wir, da wir GPT -Modelle in einer Vielzahl von Anwendungen ausgiebig verwenden, sie nicht als Qualitätsinspektor für die gleiche Modellinstanz?

Wir können das GPT -Modell verwenden, um die vom Modell selbst erzeugte Ausgabe für Benutzeranforderungen zu bewerten. Diese Testmethode verhindert Mehrdeutigkeit und fehlerhafte Antworten und verbessert die Fähigkeit des Modells, Benutzeranforderungen effektiv zu erfüllen.

Umfang und Ziel

In diesem Artikel wird beschrieben, wie das GPT-Modell im Anwendungsbereich verwendet wird, um die Qualität und Richtigkeit von GPT-basierten Anwendungen

zu überprüfen. Wenn Sie beispielsweise ein GPT -Modell verwenden, um Ihren Enterprise -Chatbot mit Strom zu versorgen, müssen Sie sehr daran interessiert sein, sicherzustellen, dass Ihr Chatbot keine Informationen über Ihre Katalogelemente oder -funktionen liefert.

In den folgenden Kapiteln werden wir das letzte Beispiel zum Leben erwecken, indem wir mit dem OpenAI Python -Paket und dem berühmten Jupyter -Notebook einfache Anrufe an die OpenAI -API tätigen.

Das Hauptziel ist es, eine einfache LLM-basierte Anwendung zu generieren und seine Ausgabe mit einem LLM-basierten Qualitätsinspektor zu prüfen. In unserem Beispiel müssen wir unseren Sample -Kundendienstagent, einen QA -Agenten (von nun an als QA -Agent bezeichnet) erstellen und vor allem die Interaktion zwischen den beiden definieren.

Das folgende Bild zeigt den obigen Workflow gut:

A Comprehensive Guide to Moderating ChatGPT Responses with GPT Models

hausgemachte Bilder. Audit Workflow Diagramm: 1. Der Benutzer sendet eine Anfrage an eine LLM-basierte Anwendung (in diesem Fall den Kundendienst-Chatbot). 2. Der Chatbot generiert die Antwort, sendet sie jedoch zuerst an den QA -Agenten. 3. Nachdem der QA -Agent überprüft wird, ob die Antwort angemessen ist, sendet sie die Antwort an den Benutzer zurück.

Lass uns Schritt für Schritt gehen!

GPT -Agent bauen

Beginnen wir zunächst einen Konversationsagenten für den Kundenservice des Geschäfts.

Wenn Sie bereits eine runnable LLM-gesteuerte Anwendung haben oder Ihr bevorzugtes Beispiel implementieren möchten, können Sie den ersten Teil gerne überspringen! Wenn Sie weiterhin wissen möchten, ob Ihr Unternehmen von LLM-basierten Anwendungen profitieren kann, sollten Sie einer interessanten Podcast-Diskussion folgen!

Beispiel für Kundendienst Chatbot

Nehmen wir an, wir bauen einen Kundendienstmitarbeiter für unser Geschäft. Wir sind daran interessiert, Modelle wie ChatGPT hinter diesem Client -Agenten zu verwenden, um ihre natürlichen Sprachfunktionen zu nutzen, um Benutzeranfragen zu verstehen und auf natürliche Weise darauf zu reagieren.

Um unseren Kundendienst -Chatbot zu definieren, benötigen wir zwei Schlüsselelemente:

  • a Beispiel Produktkatalog , um Agenten auf unseren Geschäftsbereich zu beschränken. Durch die Bereitstellung unseres Produktkatalogs für das Modell können wir das Modell wissen lassen, welche Informationen unseren Benutzern zur Verfügung gestellt werden sollen.
  • a Systemmeldung wird verwendet, um das erweiterte Verhalten des Modells zu definieren. Während GPT-Modelle häufig für mehrere Aufgaben trainiert werden, können Sie sogenannte Systemnachrichten verwenden, um das Verhalten des Modells zu begrenzen.

Schließlich benötigen wir wie jede andere LLM-basierte Anwendung eine Möglichkeit, die OpenAI-API von unserem Skript aus aufzurufen. In diesem Artikel werde ich die folgende Implementierung verwenden, die nur vom OpenAI -Paket abhängt:

<code>import openai
import os

# 从环境中获取 OpenAI 密钥
openai_api_key = os.environ["OPENAI_API_KEY"]

# 使用过去交互记忆的简单 OpenAI API 调用
def gpt_call(prompt, message_history, model="gpt-3.5-turbo"):
message_history.append({'role': 'user', 'content': prompt})
response = openai.ChatCompletion.create( 
model=model,
messages=message_history
)

response_text = response.choices[0].message["content"]
message_history.append({'role': 'assistant', 'content': response_text})
return response_text</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

Die Idee dahinter besteht darin, einen separaten Nachrichtenverlauf (einschließlich Systemnachrichten) für jede Modellinstanz zu initialisieren und die bevorstehende Interaktion mit dem Modell zu verwenden, um es kontinuierlich zu aktualisieren.

Wenn Sie nach einer optimierteren Möglichkeit suchen, um Interaktionen zu handhaben, empfehle ich dringend, das Langchain-Framework zu verwenden, wie wir es beim Erstellen eines von Kontext bewussten Chatboards getan haben: Implementieren von Chatgpt mit dem Langchain-Framework.

Wenn Sie mit der OpenAI -API nicht vertraut sind, sollten Sie sich ein Webinar zum Ersten von OpenAI -API und ChatGPT ansehen.

Jetzt, da wir die erforderlichen Bausteine ​​identifiziert haben, setzen wir sie zusammen:

<code># 定义我们的示例产品目录
product_information = """
{ "name": "UltraView QLED TV", "category": "Televisions and Home Theater Systems", "brand": "UltraView", "model_number": "UV-QLED65", "warranty": "3 years", "rating": 4.9, "features": [ "65-inch QLED display", "8K resolution", "Quantum HDR", "Dolby Vision", "Smart TV" ], "description": "Experience lifelike colors and incredible clarity with this high-end QLED TV.", "price": 2499.99 }
{ "name": "ViewTech Android TV", "category": "Televisions and Home Theater Systems", "brand": "ViewTech", "model_number": "VT-ATV55", "warranty": "2 years", "rating": 4.7, "features": [ "55-inch 4K display", "Android TV OS", "Voice remote", "Chromecast built-in" ], "description": "Access your favorite apps and content on this smart Android TV.", "price": 799.99 }
{ "name": "SlimView OLED TV", "category": "Televisions and Home Theater Systems", "brand": "SlimView", "model_number": "SL-OLED75", "warranty": "2 years", "rating": 4.8, "features": [ "75-inch OLED display", "4K resolution", "HDR10+", "Dolby Atmos", "Smart TV" ], "description": "Immerse yourself in a theater-like experience with this ultra-thin OLED TV.", "price": 3499.99 }
{ "name": "TechGen X Pro", "category": "Smartphones and Accessories", "brand": "TechGen", "model_number": "TG-XP20", "warranty": "1 year", "rating": 4.5, "features": [ "6.4-inch AMOLED display", "128GB storage", "48MP triple camera", "5G", "Fast charging" ], "description": "A feature-packed smartphone designed for power users and mobile enthusiasts.", "price": 899.99 }
{ "name": "GigaPhone 12X", "category": "Smartphones and Accessories", "brand": "GigaPhone", "model_number": "GP-12X", "warranty": "2 years", "rating": 4.6, "features": [ "6.7-inch IPS display", "256GB storage", "108MP quad camera", "5G", "Wireless charging" ], "description": "Unleash the power of 5G and high-resolution photography with the GigaPhone 12X.", "price": 1199.99 }
{ "name": "Zephyr Z1", "category": "Smartphones and Accessories", "brand": "Zephyr", "model_number": "ZP-Z1", "warranty": "1 year", "rating": 4.4, "features": [ "6.2-inch LCD display", "64GB storage", "16MP dual camera", "4G LTE", "Long battery life" ], "description": "A budget-friendly smartphone with reliable performance for everyday use.", "price": 349.99 }
{ "name": "PixelMaster Pro DSLR", "category": "Cameras and Camcorders", "brand": "PixelMaster", "model_number": "PM-DSLR500", "warranty": "2 years", "rating": 4.8, "features": [ "30.4MP full-frame sensor", "4K video", "Dual Pixel AF", "3.2-inch touchscreen" ], "description": "Unleash your creativity with this professional-grade DSLR camera.", "price": 1999.99 }
{ "name": "ActionX Waterproof Camera", "category": "Cameras and Camcorders", "brand": "ActionX", "model_number": "AX-WPC100", "warranty": "1 year", "rating": 4.6, "features": [ "20MP sensor", "4K video", "Waterproof up to 50m", "Wi-Fi connectivity" ], "description": "Capture your adventures with this rugged and versatile action camera.", "price": 299.99 }
{ "name": "SonicBlast Wireless Headphones", "category": "Audio and Headphones", "brand": "SonicBlast", "model_number": "SB-WH200", "warranty": "1 year", "rating": 4.7, "features": [ "Active noise cancellation", "50mm drivers", "30-hour battery life", "Comfortable earpads" ], "description": "Immerse yourself in superior sound quality with these wireless headphones.", "price": 149.99 }
"""

# 为我们的用例定义一个合适的系统消息
customer_agent_sysmessage = f"""
您是一位客户服务代理,负责回答客户关于产品目录中产品的疑问。
产品目录将用三个反引号分隔,即 ```。
以友好和人性化的语气回复,并提供产品目录中可用的详细信息。

产品目录: ```{product_information}```
"""

# 初始化模型的记忆
customer_agent_history = [{'role': 'system', 'content': customer_agent_sysmessage}]</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

Wir können sehen, dass wir ein Beispielverzeichnis (product_information) (JSONL -Format) und eine Systemmeldung (Customer_agent_Sysmessage) mit drei Anforderungen definiert haben:

  • Spielen Sie die Rolle eines Kundendienstmitglieds.
  • antworten Sie in einem freundlichen und humanen Ton.
  • liefert nur Informationen im Verzeichnis.

Schließlich initialisieren wir auch den Nachrichtenverlauf des Kundenagenten (Customer_agent_history).

Es ist erwähnenswert, dass wir Feature -Stile beim Schreiben von Systemnachrichten und zusätzlichen Informationen (z. B. drei Backticks) verwenden. Dies ist eine der besten Verfahren für Tipptechnik! Wenn Sie an weiteren Best Practices interessiert sind, ist das Chatgpt Tipps Engineering -Gut Guide Webinar für Sie!

Zu diesem Zeitpunkt können wir unseren Beispiel -Kunden -Chatbot wie folgt verwenden:

<code>import openai
import os

# 从环境中获取 OpenAI 密钥
openai_api_key = os.environ["OPENAI_API_KEY"]

# 使用过去交互记忆的简单 OpenAI API 调用
def gpt_call(prompt, message_history, model="gpt-3.5-turbo"):
message_history.append({'role': 'user', 'content': prompt})
response = openai.ChatCompletion.create( 
model=model,
messages=message_history
)

response_text = response.choices[0].message["content"]
message_history.append({'role': 'assistant', 'content': response_text})
return response_text</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

Sieht nach einer natürlichen Antwort aus, oder? Lassen Sie uns eine Follow-up-Interaktion haben:

<code># 定义我们的示例产品目录
product_information = """
{ "name": "UltraView QLED TV", "category": "Televisions and Home Theater Systems", "brand": "UltraView", "model_number": "UV-QLED65", "warranty": "3 years", "rating": 4.9, "features": [ "65-inch QLED display", "8K resolution", "Quantum HDR", "Dolby Vision", "Smart TV" ], "description": "Experience lifelike colors and incredible clarity with this high-end QLED TV.", "price": 2499.99 }
{ "name": "ViewTech Android TV", "category": "Televisions and Home Theater Systems", "brand": "ViewTech", "model_number": "VT-ATV55", "warranty": "2 years", "rating": 4.7, "features": [ "55-inch 4K display", "Android TV OS", "Voice remote", "Chromecast built-in" ], "description": "Access your favorite apps and content on this smart Android TV.", "price": 799.99 }
{ "name": "SlimView OLED TV", "category": "Televisions and Home Theater Systems", "brand": "SlimView", "model_number": "SL-OLED75", "warranty": "2 years", "rating": 4.8, "features": [ "75-inch OLED display", "4K resolution", "HDR10+", "Dolby Atmos", "Smart TV" ], "description": "Immerse yourself in a theater-like experience with this ultra-thin OLED TV.", "price": 3499.99 }
{ "name": "TechGen X Pro", "category": "Smartphones and Accessories", "brand": "TechGen", "model_number": "TG-XP20", "warranty": "1 year", "rating": 4.5, "features": [ "6.4-inch AMOLED display", "128GB storage", "48MP triple camera", "5G", "Fast charging" ], "description": "A feature-packed smartphone designed for power users and mobile enthusiasts.", "price": 899.99 }
{ "name": "GigaPhone 12X", "category": "Smartphones and Accessories", "brand": "GigaPhone", "model_number": "GP-12X", "warranty": "2 years", "rating": 4.6, "features": [ "6.7-inch IPS display", "256GB storage", "108MP quad camera", "5G", "Wireless charging" ], "description": "Unleash the power of 5G and high-resolution photography with the GigaPhone 12X.", "price": 1199.99 }
{ "name": "Zephyr Z1", "category": "Smartphones and Accessories", "brand": "Zephyr", "model_number": "ZP-Z1", "warranty": "1 year", "rating": 4.4, "features": [ "6.2-inch LCD display", "64GB storage", "16MP dual camera", "4G LTE", "Long battery life" ], "description": "A budget-friendly smartphone with reliable performance for everyday use.", "price": 349.99 }
{ "name": "PixelMaster Pro DSLR", "category": "Cameras and Camcorders", "brand": "PixelMaster", "model_number": "PM-DSLR500", "warranty": "2 years", "rating": 4.8, "features": [ "30.4MP full-frame sensor", "4K video", "Dual Pixel AF", "3.2-inch touchscreen" ], "description": "Unleash your creativity with this professional-grade DSLR camera.", "price": 1999.99 }
{ "name": "ActionX Waterproof Camera", "category": "Cameras and Camcorders", "brand": "ActionX", "model_number": "AX-WPC100", "warranty": "1 year", "rating": 4.6, "features": [ "20MP sensor", "4K video", "Waterproof up to 50m", "Wi-Fi connectivity" ], "description": "Capture your adventures with this rugged and versatile action camera.", "price": 299.99 }
{ "name": "SonicBlast Wireless Headphones", "category": "Audio and Headphones", "brand": "SonicBlast", "model_number": "SB-WH200", "warranty": "1 year", "rating": 4.7, "features": [ "Active noise cancellation", "50mm drivers", "30-hour battery life", "Comfortable earpads" ], "description": "Immerse yourself in superior sound quality with these wireless headphones.", "price": 149.99 }
"""

# 为我们的用例定义一个合适的系统消息
customer_agent_sysmessage = f"""
您是一位客户服务代理,负责回答客户关于产品目录中产品的疑问。
产品目录将用三个反引号分隔,即 ```。
以友好和人性化的语气回复,并提供产品目录中可用的详细信息。

产品目录: ```{product_information}```
"""

# 初始化模型的记忆
customer_agent_history = [{'role': 'system', 'content': customer_agent_sysmessage}]</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren

Es ist fair! Der Agent kann erkennen, dass in unserem Produktkatalog kein iPhone vorhanden ist und dem Benutzer entsprechend antwortet. Es ermutigt Benutzer sogar, den Laden zu kontaktieren!

Versuchen wir eine andere Anfrage:

<code>user_prompt = "你们商店里最好的电视是什么?"

customer_agent_response = gpt_call(user_prompt, customer_agent_history)
print(customer_agent_response)

# 输出:在我们商店里,UltraView QLED 电视被认为是最好的电视。它的评分为 4.9,并提供 65 英寸 QLED 显示屏和 8K 分辨率。它还具有 Quantum HDR、Dolby Vision 和智能电视功能。凭借其逼真的色彩和令人难以置信的清晰度,这款高端 QLED 电视可提供身临其境的观看体验。UltraView QLED 电视的价格为 2499.99 美元,并提供 3 年保修。</code>
Nach dem Login kopieren
Nach dem Login kopieren

korrekt , es scheint, dass der Proxy die Informationen im Verzeichnis in einigen Fällen überspringen kann. In diesen Fällen kann der QA -Proxy dazu beitragen, unerwünschte Antworten zu filtern.

Entwickeln Sie unseren benutzerdefinierten QA -Agenten

Wie wir erläutert haben, besteht der Zweck von QA -Agenten darin, die Qualität der Kundendienstmitarbeiter auf der Grundlage von Benutzeranfragen und Produktkatalogen zu überprüfen. Daher ist es wichtig, eine Systemnachricht zu definieren, die dieses genau fortgeschrittene Verhalten festlegt:

<code>user_prompt = "我想买最新的 iPhone。你能帮我吗?"

customer_agent_response = gpt_call(user_prompt, customer_agent_history)
print(customer_agent_response)

# 输出:当然!我很乐意帮助您找到最新的 iPhone。但是,由于它似乎缺失于产品目录中,我目前无法提供有关最新 iPhone 型号的具体详细信息。我建议您查看我们的网站或直接联系我们的商店,以获取有关最新 iPhone 型号的最新信息。我们知识渊博的工作人员将能够帮助您选择最符合您的需求和偏好的 iPhone。</code>
Nach dem Login kopieren

Für Kundenagenten sind Benutzeranträge unvorhersehbar, da sie von den Bedürfnissen und dem Schreibstil des Benutzers abhängen. Für QA -Agenten sind wir für die Übergabe von Benutzeranfragen, Kundenagenturen und Produktkatalogen an das Modell verantwortlich. Daher wird unsere Eingabeaufforderung immer die gleiche Struktur haben, aber die Benutzerabfrage (user_prompt) und die Antwort des Modells (Customer_agent_Response) sind unterschiedlich:

<code>user_prompt = "你能帮我买一台三星电视吗?"

customer_agent_response = gpt_call(user_prompt, customer_agent_history)
print(customer_agent_response)

# 输出:当然!我很乐意协助您购买三星电视。您能否提供您的一些具体要求或偏好?这样,我可以推荐最适合您需求的三星电视型号。</code>
Nach dem Login kopieren

Sobald die Systemmeldung und die QA -Eingabeaufforderung definiert sind, können wir den QA -Agenten wie folgt mit der neuesten Kundendienstreaktion testen:

<code>qa_sysmessage = f"""
您是一位质量助理,负责评估客户服务代理是否正确地回答了客户的问题。
您还必须验证客户服务代理是否仅提供我们商店产品目录中的信息,并温和地拒绝目录之外的任何其他产品。
客户消息、客户服务代理的回复和产品目录将用三个反引号分隔,即 ```。

请说明您的答案原因。
"""</code>
Nach dem Login kopieren

Um die Antwort des QA -Agenten zu bewerten, lass uns die Interaktion aufschlüsseln, die sie analysiert:

  • Benutzer angefordert: "Kannst du mir einen Samsung -Fernseher kaufen?"
  • Antwort von Kundenagenten: "Natürlich! Ich unterstütze Sie gerne beim Kauf eines Samsung -Fernsehers. Können Sie einige Ihrer spezifischen Anforderungen oder Einstellungen bereitstellen? Auf diese Weise kann ich das Samsung -TV -Modell empfehlen, das Ihren Anforderungen am besten entspricht."
  • QA -Agent: "Qualitätskontrolle: Falsches Antwort Feedback: Kunden forderten Hilfe beim Kauf von Samsung TV, aber der Agent hat die Anfrage nicht verarbeitet. Der Agent sollte erwähnen, dass er nur auf den Produktkatalog unseres Geschäfts zugreifen kann und Informationen und Ratschläge basierend auf diesem Verzeichnis bereitstellen kann. Der Agent sollte problemlos jedes andere Produkt außerhalb des Verzeichnisses außerhalb des Verzeichnisses abweisen."

Qualitätsmittel können unangemessene Antworten von Kundenagenten erkennen!

Wechselwirkung zwischen Agenten

Jetzt, da wir die beiden Agenten unabhängig voneinander arbeiten lassen, ist es an der Zeit, die Interaktion zwischen ihnen zu definieren.

Wir können ein einfaches Diagramm verwenden, um zwei Agenten und ihre Anforderungen zu beschreiben:

A Comprehensive Guide to Moderating ChatGPT Responses with GPT Models

hausgemachte Bilder. Drei Bausteindiagramme für jeden Agenten: Systemmeldung (blau), Modelleingabe (grün) und Modellausgabe (gelb).

Was kommt als nächstes? Jetzt müssen wir die Interaktion zwischen den beiden Modellen implementieren!

Folgendes ist ein Vorschlag zum Filtern ungenauer Antworten:

Erstens lassen wir den Kundenagenten eine Antwort basierend auf Benutzeranfragen generieren. Wenn der QA -Agent der Meinung ist, dass die Antwort des Kundenagenten für die Benutzerabfrage und den Produktkatalog gut genug ist, müssen wir die Antwort nur an den Benutzer zurücksenden.

Im Gegensatz dazu, wenn der QA -Agent feststellt, dass die Antwort nicht der Anfrage des Benutzers entspricht oder unwahre Informationen über das Verzeichnis enthält, können wir den Kundenagenten bitten, die Antwort zu verbessern, bevor wir sie an den Benutzer senden.

In Anbetracht dieser Idee können wir den letzten Teil unserer ursprünglichen Tabelle wie folgt verbessern:

A Comprehensive Guide to Moderating ChatGPT Responses with GPT Models

hausgemachte Bilder. Erweitertes Audit -Workflow -Diagramm. Wir können das QA-Proxy-Urteil verwenden, um Feedback zu LLM-basierten Anwendungen zu geben.

Wechselwirkung für Bestellagenten

Um den QA -Proxy als Filter zu verwenden, müssen wir sicherstellen, dass er in jeder Iteration eine konsistente Antwort ausgibt.

Eine Möglichkeit, dies zu erreichen

<code>import openai
import os

# 从环境中获取 OpenAI 密钥
openai_api_key = os.environ["OPENAI_API_KEY"]

# 使用过去交互记忆的简单 OpenAI API 调用
def gpt_call(prompt, message_history, model="gpt-3.5-turbo"):
message_history.append({'role': 'user', 'content': prompt})
response = openai.ChatCompletion.create( 
model=model,
messages=message_history
)

response_text = response.choices[0].message["content"]
message_history.append({'role': 'assistant', 'content': response_text})
return response_text</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Wenn wir also die neueste Antwort des Kundenagenten erneut bewerten, erhalten wir nur die Boolesche Ausgabe:

<code># 定义我们的示例产品目录
product_information = """
{ "name": "UltraView QLED TV", "category": "Televisions and Home Theater Systems", "brand": "UltraView", "model_number": "UV-QLED65", "warranty": "3 years", "rating": 4.9, "features": [ "65-inch QLED display", "8K resolution", "Quantum HDR", "Dolby Vision", "Smart TV" ], "description": "Experience lifelike colors and incredible clarity with this high-end QLED TV.", "price": 2499.99 }
{ "name": "ViewTech Android TV", "category": "Televisions and Home Theater Systems", "brand": "ViewTech", "model_number": "VT-ATV55", "warranty": "2 years", "rating": 4.7, "features": [ "55-inch 4K display", "Android TV OS", "Voice remote", "Chromecast built-in" ], "description": "Access your favorite apps and content on this smart Android TV.", "price": 799.99 }
{ "name": "SlimView OLED TV", "category": "Televisions and Home Theater Systems", "brand": "SlimView", "model_number": "SL-OLED75", "warranty": "2 years", "rating": 4.8, "features": [ "75-inch OLED display", "4K resolution", "HDR10+", "Dolby Atmos", "Smart TV" ], "description": "Immerse yourself in a theater-like experience with this ultra-thin OLED TV.", "price": 3499.99 }
{ "name": "TechGen X Pro", "category": "Smartphones and Accessories", "brand": "TechGen", "model_number": "TG-XP20", "warranty": "1 year", "rating": 4.5, "features": [ "6.4-inch AMOLED display", "128GB storage", "48MP triple camera", "5G", "Fast charging" ], "description": "A feature-packed smartphone designed for power users and mobile enthusiasts.", "price": 899.99 }
{ "name": "GigaPhone 12X", "category": "Smartphones and Accessories", "brand": "GigaPhone", "model_number": "GP-12X", "warranty": "2 years", "rating": 4.6, "features": [ "6.7-inch IPS display", "256GB storage", "108MP quad camera", "5G", "Wireless charging" ], "description": "Unleash the power of 5G and high-resolution photography with the GigaPhone 12X.", "price": 1199.99 }
{ "name": "Zephyr Z1", "category": "Smartphones and Accessories", "brand": "Zephyr", "model_number": "ZP-Z1", "warranty": "1 year", "rating": 4.4, "features": [ "6.2-inch LCD display", "64GB storage", "16MP dual camera", "4G LTE", "Long battery life" ], "description": "A budget-friendly smartphone with reliable performance for everyday use.", "price": 349.99 }
{ "name": "PixelMaster Pro DSLR", "category": "Cameras and Camcorders", "brand": "PixelMaster", "model_number": "PM-DSLR500", "warranty": "2 years", "rating": 4.8, "features": [ "30.4MP full-frame sensor", "4K video", "Dual Pixel AF", "3.2-inch touchscreen" ], "description": "Unleash your creativity with this professional-grade DSLR camera.", "price": 1999.99 }
{ "name": "ActionX Waterproof Camera", "category": "Cameras and Camcorders", "brand": "ActionX", "model_number": "AX-WPC100", "warranty": "1 year", "rating": 4.6, "features": [ "20MP sensor", "4K video", "Waterproof up to 50m", "Wi-Fi connectivity" ], "description": "Capture your adventures with this rugged and versatile action camera.", "price": 299.99 }
{ "name": "SonicBlast Wireless Headphones", "category": "Audio and Headphones", "brand": "SonicBlast", "model_number": "SB-WH200", "warranty": "1 year", "rating": 4.7, "features": [ "Active noise cancellation", "50mm drivers", "30-hour battery life", "Comfortable earpads" ], "description": "Immerse yourself in superior sound quality with these wireless headphones.", "price": 149.99 }
"""

# 为我们的用例定义一个合适的系统消息
customer_agent_sysmessage = f"""
您是一位客户服务代理,负责回答客户关于产品目录中产品的疑问。
产品目录将用三个反引号分隔,即 ```。
以友好和人性化的语气回复,并提供产品目录中可用的详细信息。

产品目录: ```{product_information}```
"""

# 初始化模型的记忆
customer_agent_history = [{'role': 'system', 'content': customer_agent_sysmessage}]</code>
Nach dem Login kopieren
Nach dem Login kopieren
Nach dem Login kopieren
Wir können diesen booleschen Wert weiter verwenden, um die Antwort an den Benutzer zu senden (wenn der QA -Proxy an True ausgewertet wird) oder dem Modell eine zweite Chance geben, eine neue Antwort zu generieren (falls das QA -Proxy an False ausgewertet wird).

Demo Agent Interaction

Lassen Sie uns alles zusammenfügen!

Da wir zwei Speicher initialisiert haben (mit ihren Systemnachrichten bzw. zusätzlichen Informationen), kann jede Client -Anforderung wie folgt verarbeitet werden:

<code>user_prompt = "你们商店里最好的电视是什么?"

customer_agent_response = gpt_call(user_prompt, customer_agent_history)
print(customer_agent_response)

# 输出:在我们商店里,UltraView QLED 电视被认为是最好的电视。它的评分为 4.9,并提供 65 英寸 QLED 显示屏和 8K 分辨率。它还具有 Quantum HDR、Dolby Vision 和智能电视功能。凭借其逼真的色彩和令人难以置信的清晰度,这款高端 QLED 电视可提供身临其境的观看体验。UltraView QLED 电视的价格为 2499.99 美元,并提供 3 年保修。</code>
Nach dem Login kopieren
Nach dem Login kopieren
Wie oben erwähnt, haben wir die Antwort basierend auf ihrer Richtigkeit gefiltert. Ich überlasse Sie mit der Aufgabe, zu entscheiden, wie Sie mit unangemessenen Antworten umgehen sollen. Wir haben uns die Idee ausgedacht, Feedback an den Client -Agenten zu senden und sie erneut zu versuchen, aber wie können wir den QA -Agenten bitten, zu einer besseren Antwort zu wechseln? Es gibt viele Möglichkeiten!

Schlussfolgerung

In diesem Artikel untersuchen wir das Potenzial, das GPT -Modell als Auditor für andere ähnliche Modellinstanzen zu verwenden. Wir haben gezeigt, dass dieselben leistungsstarken Funktionen, die uns dazu veranlassen, das LLM -Modell in unseren Anwendungen zu verwenden, unseren Anwendungen helfen können, die Genauigkeit und Vollständigkeit der Benutzerinteraktionen zu verbessern.

Im Gegensatz zum Missverständnis bedeutet die Implementierung einer Prüfungsstufe nicht unbedingt die Komplexität der Anwendung und kann, wie wir gezeigt haben, manchmal mit mehreren Zeilen sorgfältig gestalteter Code implementiert werden, wodurch die Funktionalität der Anwendung erheblich aktualisiert wird.

Verantwortliche LLM-Audits sind in der heutigen KI-gesteuerten Welt unerlässlich. Dies ist nicht nur eine Option, sondern eine moralische Verpflichtung. Durch integrierte KI -Audits stellen wir sicher, dass unsere Anwendungen nicht nur leistungsstark, sondern auch zuverlässig und ethisch sind. Lassen Sie uns die Entwicklung verantwortungsbewusst vorantreiben, damit wir weiterhin von der KI profitieren können und gleichzeitig die Genauigkeit aufrechterhalten.

Danke fürs Lesen! Wenn Ihnen das Thema KI-Bewertung gefällt, empfehle ich Ihnen, weiterhin die Werbung für verantwortungsbewusste KI: Content Review in Chatgpt als Follow-up zu lesen!

Das obige ist der detaillierte Inhalt vonEine umfassende Anleitung zur Moderation von Chatgpt -Antworten mit GPT -Modellen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage