Web 上でのソーシャル インタラクションが成長し続ける中、特に生成 AI が世界的に普及し続けているため、冒涜的な言葉を検出してフィルタリングする機能を備えたソーシャル アプリケーションを構築する必要性が高まっています。
冒涜的な言葉を検出してフィルタリングできるアプリケーションの構築は、オンラインでのソーシャル コミュニケーションや交流をより安全にするためのソリューションの 1 つになる可能性があります。
このチュートリアルでは、Python better_profanity API と GraphQL を使用して冒涜フィルターを構築する方法をコード スニペットで説明します。
冒涜とは、会話の中で罵り、無礼、攻撃的な言葉を使用することです。冒涜は、誰かまたは何かに対する強い敵意や不承認の感情を表現するために使用されることがあります。
冒涜フィルターは、オンライン通信チャネルで冒涜として認識される単語を検出し、フィルタリングするアプリケーションです。
Better-profanity は、汚い言葉を検出して除去するための非常に高速な Python ライブラリです。カスタムの単語リスト、セーフリスト、変更された単語のスペル、Unicode 文字 (leetspeak とも呼ばれます) での冒涜の検出、さらには多言語の冒涜の検出もサポートしています。
始めるには、次の前提条件が必要です:
プロジェクトの better_profanity ライブラリをインストールするには、ターミナルで次のコマンドを実行します。
pip install better_profanity
Python プロジェクトで、profanity_filter.py ファイルを作成し、次のコード スニペットを追加します。
from better_profanity import profanity profanity.load_censor_words() def test_profanity(paragraph): print(profanity.censor(paragraph))
以下に示すように、攻撃的な単語を引数として関数に渡す場合:
test_profanity("Don't be fuck")
次の結果が得られます:
Don't be ****
Python better_profanity には、文字列に汚い言葉が含まれているかどうかを示す関数があります。
profanity.contains_profanity() # True | # False
Python better_profanity には、カスタム文字を含む罵り言葉を検閲する関数があります。
profanity.censor(word, '-')
.censer('-') の 2 番目の引数は、最初の引数 (単語) で見つかった悪口を検閲するために使用されます。
これで冒涜フィルターが機能するようになりました。フィルター用の GraphQL API を構築してテストしてみましょう。
Flask ライブラリと GraphQL ライブラリをアプリケーションにインストールするには、ターミナルで次のコマンドを実行します。
pip install better_profanity
次に、API GraphQl スキーマを作成します。これを行うには、schema.py ファイルを作成し、次のコードを追加します。
from better_profanity import profanity profanity.load_censor_words() def test_profanity(paragraph): print(profanity.censor(paragraph))
次に、アクセス可能な URL を持つサーバーに冒涜フィルターを設定しましょう。これを行うには、Python ファイル app.py を作成し、次のコードをそれに追加します。
test_profanity("Don't be fuck")
アプリケーションを実行するには、ターミナルで次のコマンドを実行します:
Don't be ****
すべてを正しく行うと、サーバーが実行を開始し、ターミナルは以下の添付画像のようになるはずです。
これで、ターミナルに表示されているこの URL (http://127.0.0.1:5000/) にアクセスして API をテストできます。
URL にアクセスすると、以下の画像に示すように GraphiQL インターフェイスが表示されます。
API をテストするには、提供された GraphQL インターフェイスで次のクエリを実行します。
profanity.contains_profanity() # True | # False
次の応答が得られます:
profanity.censor(word, '-')
すべてのユーザーにとって安全なソーシャル ネットワークを構築することは、ソーシャル アプリケーションを構築する際に考慮すべき重要な要素です。このチュートリアルでは、冒涜的な言葉の概念と、アプリケーション内で冒涜的な言葉を検出してフィルタリングする方法を紹介しました。 Python フレームワーク Flask と GraphQL を使用して、冒涜フィルター API を構築する方法を説明しました。
以上がGraphQL で Python better_profanity フィルター API を使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。