AI和開源重新定義2025年的企業數據平台
我今年早些時候發布了有關該市場的概述,但是這種景觀的變化很快,以至於它值得一分集,重點是目前正在發生的最大變化媒介。其中之一是,諸如Apache Iceberg和Delta Lake之類的開放格式正在使跨系統移動數據變得更加容易,而不會卡在供應商筒倉中。還推動了通過諸如檢索增強的生成和矢量搜索等技術啟用更多AI-Ready工具,可以從實時數據中提取答案 - 這是在我們到達這些系統中對代理AI的驚人迅速採用之前。最重要的是,越來越多的企業將統一的平台變成一個地方。具有規模和功能集的供應商可以用作平台,正在彈力這些功能,以提高其競爭地位。
在這種情況下,數據體系結構不僅越來越成為技術IT關注的問題,而且是保持快速,聰明和競爭性的關鍵戰略考慮因素。因此,讓我們深入了解這些新興變革的向量如何在企業數據管理市場中產生影響。
對於2025年的企業數據平台很重要
企業數據平台正在發展為更模塊化的標準驅動系統,而不是單供應商堆棧。對於初學者來說,如今已得到廣泛支持的開放式餐桌格式,例如Apache Iceberg和Delta Lake,從而更容易建造跨雲層起作用並隨著時間的推移而適應的建築;這也有助於通過使數據更易於移動和查詢不同平台的移動和查詢來減少供應商的鎖定。而且,數據平台越來越多地將它們視為連接的連續過程,而不是處理攝入,轉化和治理作為單獨的步驟。 Snowflake,IBM,Cloudera和Informatica支持Iceberg,而Databricks通過其Unity目錄支持這兩種格式,而Delta Lake Stribers則可以訪問交叉格式。開放標準的使用使組織更具控制數據的控制權,並使在不從頭開始的情況下更輕鬆地切換工具。
當今的數據平台也從頭開始為AI構建。代理系統可以自己處理元數據標記和數據質量檢查等任務。 RAG將AI始終基於可信賴的企業數據,而諸如向量搜索和嵌入管理等工具現在是標準的。低代碼功能和政策自動化也已成為標準化 - 不僅用於效率,還用於實踐需求,例如儘早確定數據質量問題,執行合規規則並為無需大量手動工作而準備審計。在這一點上,AI已經超越了試點項目。從簡化供應鏈調整到標記欺詐性交易,將副駕駛,代理和特定於域的自動化嵌入到日常任務中。這使技術和非技術團隊都能獲得更快,更一致的結果。
就基礎設施,混合和邊緣部署而言,已成為常態。公司需要更接近其創建的數據,尤其是在醫療保健,製造和金融等行業中,速度,隱私和控制物質。隨著傳統數據中心以外的數據生成的增加,無縫的邊緣集成也已成為必要。現在,像Microsoft,IBM和Cloudera這樣的供應商現在提供支持此班次的邊緣就緒選項。
由於人工智能工作量的成本不斷增加,金融運營或填充功能變得越來越重要。現在,供應商提供各種解決方案,可在復雜環境中提供這些成本的可見性。 AWS的成本優化樞紐,微軟的增強織物控件以及IBM將Finops工具集成到其數據堆中,就是這些解決方案的示例。金融治理正在發展為完整的生命週期計劃,並使用跟踪使用情況,預測成本和幫助團隊做出明智的工作負載管理的工具。
同時,隨著政府和企業經常希望在國家或地區邊界內的AI系統來滿足隱私法律和監管期望,因此主權AI正在振興蒸汽。這種關注控制權,特別是在信任和問責制至關重要的國防,醫療保健和政府部門,正在推動美國司法部2025年數據安全計劃等新法規的製定。真正的優勢將來自可以在政策和地理方面發揮作用的平台。考慮模型審核,邊界感知的部署以及對混合雲,本地和邊緣混合環境的支持。您的平台越適合您的平台,即使在一個複雜的規則和期望上升的世界中,保持快速行動就越容易。
在數據方面,強大的治理現在已成為默認設置。譜系跟踪,策略執法和元數據標籤之類的功能並不是很好 - 他們期望。越來越多的團隊也開始將數據視為一種產品:從一開始就可以重複使用,記錄良好的內容。
將所有內容放在一起,至此,供應商再也無法重點關注其平台的潛力了。今天,這是關於實際功能。買家正在大規模尋求切實的現實世界表現,以及強大的治理和可觀察性以及適應性的靈活性。滿足這些期望的平台有望塑造企業數據策略的下一階段。
比較企業數據供應商
企業數據平台供應商繼續採取不同的道路,這是由其背景和戰略重點塑造的。 Snowflake通過Cortex AI-SQL將AI添加到其SQL本地平台中,使用戶將AI直接嵌入查詢中。現在,它通過開源Polaris目錄支持Apache Iceberg,並最近引入了OpenFlow來處理實時管道,並將結構化和非結構化數據與事件驅動的用例相結合。 Cittabase使用Cortex AI-SQL自動將非結構化的視覺數據轉換為結構化的文本摘要,從而使團隊能夠將圖像衍生的見解與關係表一起使用,以供更豐富的分析。
Databricks專注於數據科學和AI優先的工作流程。如上所述,它支持Delta Lake和Iceberg,其Unity目錄現在提供了多種格式和發動機的治理。 Databricks正在互操作性和代理驅動的自動化上加倍;這是其LakeHouseiq的支持,它的知識引擎可以通過學習組織的數據上下文來實現自然語言查詢,而Mosaic AI是建立和管理AI模型和代理商的平台,更不用說其對Tabular的收購(冰山背後的團隊)。 DraftKings使用Databricks上的機器學習構建了實時欺詐檢測系統。 Coinbase使用該平台監視區塊鏈交易和標記可疑活動。這兩個示例都表明該平台在實時處理,向量搜索和ML工具中的強度。
Informatica繼續以元數據為導向的治理領導。它的Claire AI引擎現在包括Claire Agents - 自主工具,用於管理聊天式互動以外的數據。它支持冰山並提供混合部署的靈活性,吸引需要強大政策控制的企業。例如,Holiday Inn Club Vacations使用Claire來鞏固與斷開系統的客戶數據,從而提高了準確性。薪資通過Informatica的雲工具對其管道進行了現代化的現代化,從而加快了分析和AI的交付。 (有關以下Salesforce項目中Informatica的更多信息。)
Cloudera在混合和邊緣部署方面發揮了優勢。它依靠開源技術(例如NIFI)用於流媒體和火花進行處理,並通過酸性交易和時間旅行為冰山提供了支持,該技術可以查詢數據表的歷史版本,以進行審計,恢復或時間分析。最近的更新添加了GPU可觀察性,NVIDIA H100支持和擁抱面部模型集成(包括Llama 3.2),以供AI-Bable Lakehouse用例使用。製造商在邊緣使用它來進行預測性維護,而零售商和銀行則使用它來確保客戶數據並實時檢測欺詐 - 將本地處理與集中監督平衡。
Teradata仍然是金融和零售等行業大規模分析的首選。現在,它的VantageCloud Lake和Clearscape Analytics平台現在支持基於生成的AI,具有用於成本跟踪和工作負載管理的新工具,旨在使技術和業務團隊的生活更輕鬆。銀行和電信公司由於其強大的工作負載管理和可擴展性而將其用於合規,風險建模和審計,這非常適合具有大量數據需求的監管行業。
IBM一直在擴展WATSONX,以涵蓋更複雜和受監管的AI工作負載。 2025年6月的更新帶來了非結構化的數據支持,通過DataStax實時的Cassandra集成以及通過Apache Gluon的火花加速。如今,WATSONX支持冰山,邊緣部署和增強的矢量搜索,其中包括現代管道工具和Finops功能。 Vodafone使用WATSONX模擬客戶互動,而保險公司通過從表格和文檔中提取關鍵信息來自動處理索賠處理,這表明WATSONX在混合,以合規性為中心的設置中的價值。
Salesforce將通過提議的80億美元收購Informatica擴大其企業數據策略,預計將在2026年秋季關閉。這可能會擴大Salesforce堆棧中Informatica的治理和AI能力 - 與Data Cloud,Tableau和Mulesoft集成,同時更直接地將Salesforce定位為諸如Snowflake和Datebricks等競爭對手。 2025年8月,Salesforce還完成了對WAII的收購,該公司使用元數據知識圖將自然語言查詢轉化為優化的SQL。 WAII的技術有望增強數據云,代理Force和Tableau,使用戶和AI代理能夠通過對話查詢與企業數據進行交互。
雲服務提供商的企業數據管理產品
主要的雲提供商繼續採取不同的方法來提供自己的企業數據平台,這是根據AI,基礎架構和開發人員工具的優勢所塑造的。 AWS提供了一個廣泛的工具包,包括用於倉庫的紅移,ETL的膠水,用於機器學習的Sagemaker和用於臨時查詢的雅典娜。雖然強大,但這些服務通常需要縫合在一起。為了提供幫助,AWS介紹了Datazone的治理和成本優化中心,以進行更好的財務跟踪。同時,綠草支持製造,零售和現場運營中的邊緣部署。
Microsoft Azure專注於通過Microsoft Fabric集成,該面料將突觸,數據工廠和Power BI結合到OneLake上的一個SaaS平台中。 (有關Fabric如何簡化AI的數據管理的更多信息,請參閱我的分析2024年。)Fabric現在擁有17,000多個客戶,其中包括大多數財富500強的客戶。最近的更新添加了實質性的湖景,改進的鏡像和更嚴格的Onelake集成。 Azure Arc將Azure數據服務擴展到本地和主權環境,支持混合用例。現實世界中的用例涵蓋了許多行業。例如,墨爾本機場使用Microsoft Fabric進行統一分析來有效地管理操作數據。香奈兒(Chanel)將織物納入其分析工作流程,平衡決策支持與強大的治理。微軟本身在內部使用織物來管理複雜的大規模數據環境。
Google Cloud強調了AI和數據靈活性。它的堆棧(BigQuery,Vertex AI和Looker)支持Iceberg和Delta Lake,允許開放的,雲刺激的建築。 Anthos啟用混合和邊緣編排,Google更新的Finops儀表板旨在提供更好的成本可見度。該平台開放的AI工具吸引了建立自定義工作流程的工程團隊。拜耳將AlloyDB與BigQuery一起在開放式冰山傳播的數據上部署實時分析,與以前的體系結構相比,響應率更快,吞吐量更高。
Oracle Cloud基礎架構著重於交易和應用程序集成工作負載的性能。通過自主數據庫和AI向量搜索,OCI與Oracle的ERP和SaaS堆棧緊密地對齊。儘管其邊緣功能仍在成熟,但OCI為已經在Oracle上標準化的企業提供了穩定的定價和內置集成。作為客戶使用的一個示例,DeWeyVision部署了Oracle自主數據庫以及AI向量搜索,以交付跨不同數據類型的快速,AI驅動的語義媒體搜索,從而提高了可發現性和用戶體驗。
企業數據平台的戰略前景
企業數據平台市場預計將在未來七年中翻一番,從2025年的1,113億美元到2032年的2435億美元,增長率為11.8%。數據複雜性,AI採用,更嚴格的法規和持續的雲擴展所推動了這種增長。
當今的企業需要簡化操作,降低成本並使AI有用的平台。諸如目錄聯合會,基於代理的編排和AI Awaen Awawe成本建模之類的功能開始滿足這些需求。新的“認知”平台將AI代理視為活躍的數據使用者 - 能夠在沒有人類監督的情況下採取行動。
主權AI和邊緣計算也是整形平台設計。 AI系統越來越需要保持在受監管的數據源附近,而邊緣功能支持快速的本地處理。大多數供應商都在適應兩者的支持。可持續性也開始更重要。評估平台時,公司開始考慮數據基礎架構的環境影響。展望未來,平台選擇將較少取決於名稱識別,而在技術擬合方面進行的更多鉸鏈。最強大的競爭者將提供靈活的部署,開放標準,透明的成本控制和烘焙治理 - 幫助企業移動更快,並在製造,醫療保健,金融,零售以及其他方面做出更明智的決定。
以上是AI和開源重新定義2025年的企業數據平台的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undress AI Tool
免費脫衣圖片

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

九年前,埃隆·馬斯克(Elon Musk)站在記者面前,宣布特斯拉(Tesla)正在大膽地邁向未來,這使每輛新的電動汽車與完全自動駕駛能力的完整硬件相提並論。

為什麼困惑能確定獲得網絡瀏覽器?答案可能在於地平線的根本轉變:代理AI互聯網的興起 - 瀏覽器可能是它的核心。

了解歐盟自然信貸框架歐盟的性質信貸計劃引入了一個可量化的生物多樣性單位系統,旨在表彰和獎勵個人和團體積極參與恢復和保存

總而言之,“您一樣完美的自我”線已經成為一種牢固的咒語,現代AI已準備好向任何想听到過時的陳詞濫調的用戶興起。 讓我們來談談。 對

現在,她因擔心“人工通用智能”的到來(一種能夠匹配或超過無數領域的人類績效的理論形式)而抓住了永久性的缺席,這可能會導致CI崩潰

隨著圍繞AI代理商的對話在企業和個人之間繼續發展,一個中心主題脫穎而出:並非所有的AI代理人都是平等的。從基本的,規則驅動的系統到高度先進的自適應模型,都有廣泛的範圍

一項新的柳葉刀研究研究調查了在結腸鏡檢查中使用AI如何影響醫生的診斷能力。研究人員評估了醫師在沒有AI的三個月內識別特定異常的技能,然後在此之後重新評估了它們

正如Openai首席執行官Sam Altman所說,GPT -5是邁向AGI的“重要一步”,並且是“迄今為止最聰明,最快,最有用的模型”。他將從GPT-4到GPT-5的跳躍與從大學畢業生轉變為“博士學位專家”。 該模型的發布
