堅牢な AI ガバナンスを実装してデータを民主化する-AI-php.cn

堅牢な AI ガバナンスを実装してデータを民主化する

GenAI の出現により、データの可能性を解き放つペースが加速し、新たな洞察とより良い意思決定の機会が提供されています。ただし、より広範なデータアクセスを実現するには、包括的なデータガバナンス戦略が必要です。データの民主化と厳格なデータガバナンスのバランスを取ることができる企業は、独自のデータドリブンな洞察を解き放つことで、市場での差別化を図ることができます。

Gartner によると、2026 年までに 80% 以上の企業が GenAI API およびモデルを使用するか、実稼働環境に GenAI 対応アプリケーションを導入する予定であり、これは昨年の 5% 未満から増加しています。 GenAI の自然言語インターフェイスにより、部門長から最前線の従業員に至るまで、技術者以外のユーザーがより簡単にデータにアクセスして使用できるようになります。これにより、情報とスキルへのアクセスにおける競争の場が平準化され、ガートナーはこれを「この 10 年間で最も破壊的なトレンドの 1 つ」と呼んでいます。

企業がプライバシー、セキュリティ、データ品質に対するリスクの増加を回避したい場合、この方法でデータを民主化することで、強力なガバナンスがさらに重要になります。これは、データが何であるか、データがどこに存在するか、誰がアクセスできるかを正確に把握することを意味します。それと、それぞれのタイプのユーザーがそれをどのように使用できるかについて説明しますが、企業はイノベーションを抑制することなく全体的な制御をどのように実施するのでしょうか?

より高いレベルでは、データを包括的なリポジトリに統合し、さまざまなチームやワークグループ間で簡単かつ安全に共有することが推奨されるアプローチです。データを統合することで、企業は管理を一元化し、データへのアクセスを拡大しながら、複雑さを最小限に抑え、コストを最適化できます。データを一元的に保存するこのアプローチは、データの一貫性と正確性を確保し、データの重複や不整合によって引き起こされる問題を回避するのに役立ちます。さらに、アクセス制御や監視手段をより簡単に実装できるため、データセキュリティの向上とプライバシーの保護にも役立ちます。したがって、企業にとって統合データリポジトリを確立することは非常に重要です。

データ主権規制により、特定のデータは特定の国または地域に保存する必要があるため、実際にはいくつかの課題が生じる可能性があります。この状況に直面して、企業はデータサイロを排除し、データプラットフォーム全体に一貫したガバナンスフレームワークを導入することに取り組む必要があります。

さらに、いくつかの特定の方法とテクノロジーは、GenAI がデータへのアクセスを拡大する際に、企業がセキュリティを維持しながら効果的なガバナンスを維持できるようにするのに役立ちます。これらのアプローチには、さまざまな設定に適用される基本的なガバナンスの実践が含まれていますが、GenAI がデータアクセスの民主化をさらに推進するにつれて、特に重要になります。

プライバシーとコンプライアンスのきめ細かな制御

従業員のデータへのアクセスが増加するにつれて、データ侵害のリスクや、権限のないユーザーによる個人識別情報 (PII) のアクセスのリスクも増加します。したがって、コンプライアンスを確保し、不適切なアクセスからデータを保護するには、厳格なアクセス制御ポリシーを実装し、匿名化および識別テクノロジーを使用することが重要です。

Snowflake Data Cloud のトレンドを分析した新しい Data Trends 2024 レポートでは、データをきめ細かく制御しながら、より多くのユーザーがより多くのユースケースに適切に利用できるガバナンス機能の使用が大幅に増加していることに気付きました。適用されたマスクまたは行アクセスポリシーの使用量は、2024 年 1 月 31 日までの 12 か月間で前年同期と比較して 98% 増加し、同時にマスキングポリシーが割り当てられた列の数は 97% 増加しました。

ただし、ポリシーで保護されたオブジェクトに対して実行されたクエリの総数が 142% 増加したことは注目に値します。優れたデータガバナンスとは、「ノー」と言ってデータの使用を制限することではないことを示しているため、この数字は重要です。レポートでは、ラベル付けおよびブロックポリシーの使用によるガバナンスの強化が見られるにもかかわらず、このデータを使用して行われる作業量が急速に増加していると指摘しています。

場合によっては、従業員が直接アクセスを許可されていないデータセットを検査したい場合があります。そのような場合、差分プライバシーは、ユーザーがスキーマごとにデータセットを表示して共有および探索できるため、強力な技術です。個々のユーザーの PII を明らかにすることなくデータセットを作成します。これをさらに一歩進めて、データクリーンルームを使用すると、生データを互いに公開することなく、複数の関係者がデータで共同作業できるようになります。データクリーンルームは、通常、異なるビジネス間でデータを共有するために使用されますが、このテクノロジーは、データの増加に対応するために社内で使用されています。規制やプライバシーのニーズに応じて、GenAI インターフェイスのコンテキストで PII データを探索するための効果的な手法となり得ます。

一貫した調整されたセキュリティ

セキュリティは、個々のデータセットやユーザーに合わせて後から修正するのではなく、データプラットフォームの構造に組み込む必要があり、会話型インターフェイスをサポートするテクノロジは、データに対する ID やその他のコア権限が複製されないため、セットアップが脆弱になります。 2 つ以上のシステムが誰がどのデータにアクセスできるかを追跡している場合、エラーや不正アクセスが発生する可能性が大幅に増加します。

GenAI ユースケースのデータ保護において重要な役割を果たすテクノロジーには、継続的なリスクの監視と保護、ロールベースのアクセス制御 (RBAC)、およびきめ細かい承認ポリシーが含まれます。ロールベースのタグとタグベースのマスキングポリシーを使用すると、マスキングポリシーをタグに割り当て、そのタグを 1 つ以上のデータベースオブジェクトに設定することで、列レベルでデータを保護できます。

データサイロは優れたガバナンスの敵です

データのコピーや断片を異種システムに保存すると、誰がどの情報にアクセスできるかを追跡し、アクセスおよび制御ポリシーの一貫性を維持することが非常に困難になります。これが、データサイロが強力なガバナンスの敵である理由です。

データサイロにより、従業員が最新かつ正確なデータを確実にクエリすることが困難になり、コストのかかるミスにつながる可能性があります。 GenAI を通じてデータへの広範なアクセスを実現するには、企業はすべての従業員が同じ情報を参照し、すべてのデータにわたって制御とポリシーを適用および更新できることを保証する単一の信頼できる情報源を必要とします。

正確な結果を得るためのデータ品質の確保

サイロを排除し、適切な権限を持っていたとしても、従業員がアクセスしている情報が正しいという保証はありません。データ品質フレームワークは、以下に基づいています。テーブルへの適用特定の列または列のセットに対して構成可能なデータ品質ルールにより、品質の問題を検出し、正確な情報を確保できます。

さらに、GenAI が時々幻覚を起こし、実際には根拠のない答えを生成する可能性があり、これは企業での使用には受け入れられないことは、今では誰もが知っています。企業は、大規模言語モデル (LLM) を、社内の顧客データベースや信頼できるサードパーティプロバイダーからの精査されたデータセットなど、信頼できるとわかっているデータソースと組み合わせることで、この問題を解決できます。

これらの信頼できるデータソースは、LLM カスタマイズが必要なプロセス (微調整など)、または LLM カスタマイズを必要としないプロセス (ジャストインタイムエンジニアリングや検索拡張生成 (RAG) など) を使用してマージできます。。いずれの場合でも、これらのテクノロジーは、オンプレミスのクラウド環境に組み込まれているガバナンス基準を遵守しながら、従業員が正確で高品質な結果を確実に受け取るのに役立ちます。

データアクセスとユニバーサル検索の力

GenAI ガバナンスの重要な側面は、従業員が分析に役立つ適切なデータセットとデータ製品を簡単に見つけられるようにすることです。これは非常に強力であり、従業員が中央チームを介さずにデータを操作できるようになりますが、そのためには、従業員が利用可能なデータとその検索方法を知っている必要があります。

検索機能はこの機能を提供し、ユーザーがデータセットやデータ製品を検索してクエリできるようにします。この検索機能自体は LLM を利用することができ、データ検索をより直感的に行うことができます。これは、Snowflake で開発したものです。私たちのユニバーサル検索の一部です。

ガバナンスはデータ民主化の基盤です

ビジネスユーザーは組織のデータをより幅広く活用することを望んでおり、GenAI はついにこれを可能にします。 LLMS と自然言語処理のおかげで、財務、人事、営業、運営などの分野の従業員は、自分の役割に固有の質問を作成し、より多くの情報に基づいた意思決定を行うために必要な答えを得ることができるようになりました。

しかし、企業のセキュリティとコンプライアンスのニーズを満たすためには、これは強力なガバナンスを備えた環境でのみ発生します。ガバナンスが強化されるほど、従業員は会社にさらなるリスクを与えることなく、より自由にデータを閲覧できるようになります。 , GenAI は真のデータ民主化への扉を開き、優れたガバナンスがそれを可能にする基盤です。

以上が堅牢な AI ガバナンスを実装してデータを民主化するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。