2022 年にこれまでに見てきたことに基づいて、Datanami は今年の残りの期間についてこれら 5 つの予測を立てることができると確信しています。
今年上半期はデータの可観測性にとって非常に大きな成果を上げ、お客様はデータ フローの状況をより深く理解し、関連する指標を開発できるようになりました。意思決定にとってデータの重要性が高まるにつれて、そのデータの健全性と可用性も重要になります。
私たちは、Cribl (シリーズ D 1 億 5,000 万ドル)、Monte Carlo (シリーズ D 1 億 3,500 万ドル) 、Coralogix (シリーズ D 1 億 4,200 万ドル) など、多くのデータ可観測性スタートアップがベンチャーキャピタルで数億ドルを調達するのを見てきました。 ); その他。ニュースになっている他の企業としては、メタデータ メトリクスを開始した Bigeye、Software AG に 5 億 8,000 万ドルで買収された StreamSets、先月可観測性スタートアップの Databand を買収した IBM などがあります。
この勢いは、より多くのデータ可観測性スタートアップが森の中から現れ、既存のスタートアップがこの新興市場での地位を固めようとするため、2022 年下半期も続くでしょう。
リアルタイム データは長年後回しにされ、ニッチなユースケースに対応していましたが、実際には一般の企業では広く使用されていませんでした。しかし、新型コロナウイルス感染症(COVID-19)のパンデミックと、過去数年間にわたるそれに伴う事業計画の再構築のおかげで、リアルタイムデータが主流のテクノロジーシーンに参入する条件が整いました。
「ストリーミングがついに実現しつつあると思います」と Databricks の CEO、Ali Ghodsi 氏は最近の Data AI Summit で述べ、同社のクラウドベースのデータ プラットフォームにおけるストリーミング ワークロードが 2.5 倍に増加していることを指摘しました。 「リアルタイムを必要とする AI のユースケースがますます増えています。」
インメモリ データベースとインメモリ データ グリッドも、リアルタイム ルネッサンスの恩恵を受ける準備ができています。 Kafka のようなイベントベースのシステムを強化する高速分析データベースである RocksDB には、Speedb と呼ばれる代替データベースが登場しました。 SingleStore は、OLTP 機能と OLAP 機能を単一のリレーショナル フレームワークに組み合わせたもので、先月の資金調達ラウンドで評価額が 13 億ドルに達しました。
最近、Apache Doris ベースの新しい高速 OLAP データベースの資金調達を受けた StarRocks や、Apache Druid ベースのリアルタイム分析ビジネスを継続するために、Imply が 5 月に 1 億ドルのシリーズ D 資金調達を完了した、DataStax もあります。は、Apache Cassandra ツールキットに Apache Pulsar を追加し、リアルタイム アプリケーション開発を進めるために 1 億 1,500 万ドルを調達しました。 Datanami は、リアルタイム データ分析への注力が今後も続くと予想しています。
GDPR が発効してから 4 年が経過し、ビッグデータ ユーザーに注目が集まり、責任あるデータへの取り組みに必要な要素としてデータ ガバナンスの台頭が加速しています。米国では、データ アクセスを規制する任務は各州に委ねられており、カリフォルニア州が多くの点で GPDR をモデルにした CCPA を主導しています。しかし、さらに多くの州がこれに追随する可能性が高く、米国企業にとってのデータプライバシーの方程式は複雑化することになる。
しかし、GDPR と CCPA は規制の始まりにすぎません。また、企業がユーザーのオンライン行動を追跡することが困難になるサードパーティ Cookie も廃止されようとしています。プラットフォーム上でのサードパーティ Cookie の終了を 2023 年 1 月 1 日まで延期するという Google の決定により、マーケティング担当者は適応するための時間的余裕が得られますが、Cookie からの情報を複製するのは困難になります。
データ規制に加えて、人工知能の使用に関する新しい規制も目前にあります。 EUは2021年に人工知能法案を提出しており、専門家らは2022年末か2023年初めまでに成立する可能性があると予測している。
古典的なテクノロジー戦争により、データがビッグ データ システムにどのように保存されるか、誰がアクセスできるか、誰が使用できるかを決定する新しいデータシート形式が形成されています。それと。
ここ数か月で、Apache Iceberg がデータ テーブル形式の新しい標準となる可能性があるとして勢いを増しています。クラウドデータウェアハウス大手のスノーフレークとAWSは今年初め、トランザクションなどのデータ管理を提供し、ネットフリックスとアップルから出てきたアイスバーグを支援することを表明した。元HadoopディストリビュータのClouderaも6月にIcebergを支援した。
しかし、Databricks の担当者は、Iceberg と同様の機能を提供する Delta Lake 表形式の代替案を提供しています。 Apache Spark の支援者は当初、Delta Lake の表形式を独自の方法で開発していたため、Databricks が顧客を囲い込んでいるとの非難につながりました。しかし、6月のData AI Summitで同社は、フォーマット全体をオープンソース化し、誰でも使用できるようにすると発表した。
この問題に紛れたのは Apache Hudi です。Apache Hudi はビッグ データ リポジトリに常駐し、さまざまなコンピューティング エンジンからアクセスできるため、データの一貫性も提供します。 Apache Hudi の作成者が支援するビジネスである Onehouse は、今年初めに Hudi ベースの Lakehouse プラットフォームを立ち上げました。
ビッグデータ エコシステムは競争を好むため、2022 年の残りの期間を通じてこれらのフォーマットが進化し、競争するのを見るのは興味深いでしょう。
人工知能の最前線は毎月先鋭化しています。今日、AI の先鋒となっているのは大きな言語モデルであり、ますます優れています。実際、大規模な言語モデルは非常に優れているため、6 月には Google のエンジニアが、同社の LaMDA 会話システムに知覚力が備わったと主張しました。
人工知能はまだ知覚力を持っていませんが、それは企業にとって役に立たないという意味ではありません。念のために言っておきますが、Salesforce には CodeGen と呼ばれる大規模言語モデリング (LLM) プロジェクトがあり、ソース コードを理解し、さまざまなプログラミング言語で独自のコードを生成するように設計されています。
先月、Meta (Facebook の親会社) は、200 の言語に翻訳できる大規模な言語モデルを発表しました。また、BigScience Large Open Science Open Access Multilingual Language Model (BLOOM) などのプロジェクトを通じて AI を民主化する取り組みも見てきました。
以上が2022 年下半期のデータおよび人工知能テクノロジーの予測の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。