首頁> 運維> 安全> 主體

雲端原生穩定性價值被低估?看頭部金融企業穩定保障法則!

WBOY
發布: 2023-07-04 08:34:33
轉載
1246 人瀏覽過

雲端運算、大數據、人工智慧、區塊鏈等科技浪潮賦予金融科技創新源源不絕的生命力,但同時,以數位經濟為代表的新型經濟形態也對傳統金融業態和既有底層技術帶來深刻改變與巨大挑戰。

在國際情勢複雜化的脈絡下,國家對安全可靠、自主可控技術提出了更高的要求。目前迫切需要的工作是加強金融業資訊系統的自主研發能力,減少對商業產品的依賴。

由於金融業涉及民生,業務一旦出現問題,就會對整個社會輿論造成嚴重影響,因此,金融業的系統穩定性保障尤為重要。然而,走向數位化的金融企業在業務方面存在不可預測、不可控、複雜性高等問題,這就為系統穩定性保障帶來不小挑戰。

那麼,金融企業如何規劃系統穩定性治理工作?如何利用雲端原生架構的特性與優勢,來保障業務系統穩定性?近日,51CTO訪談了網易數帆雲原生解決方案專家朱劍峰,攜國有大行長期實務經驗,為金融業的系統穩定性建設獻策支招。

金融業雲端原生升級挑戰多

隨著近年來同業競爭加劇,各大金融機構紛紛追求金融服務個人化、場景化,欲打造開放金融,加之監管要求需要實現IT 自主可控目標,金融企業從大單體總線架構進一步向微服務、雲原生架構演進。

在近日舉辦的WOT#全球技術創新大會上,來自銀行、證券、保險等領域的多位科技部門負責人表示,雲端原生架構的落地不是一蹴而就的,需要在架構演進過程中,不斷完善相關的能力與規範,形成企業的組織文化與技術體系。企業需要全面整理、逐步演進,從週邊到核心,先創新再傳統。映射到金融企業,就是先從偏向網路業務方向的敏態業務開始進行微服務分割和雲端原生改造,進而再滲透到核心系統的穩態業務。

隨著更多企業開始遷移到雲端原生架構,雲端原生的穩定性保障也越來越受到重視。企業在雲端原生穩定性保障方面也遇到了不小挑戰。朱劍峰表示,金融企業在雲端原生穩定性保障方面主要有兩大挑戰。一類集中在系統韌性方面,在外部環境下,訪問流量的變化會導致系統過載,應用高可用設計不達標,都會造成系統韌性不足;另一類在系統可觀測性方面,由於系統可觀測性不足,導致維運人員無法第一時間發現多樣化的雲端服務風險故障,例如針對生產環境的操作變更(人為誤操作、變更失敗),程式碼編寫的缺陷(程式碼品質、程式邏輯、應用架構等故障),以及業務依賴的平台硬體故障、網路故障等情況,無法快速發現並定位問題,最終造成業務損失。

所以,金融企業業務系統的關鍵演進方向是雲端原生技術底座。金融企業需要將雲原⽣的特性應⽤在業務場景方面,增強傳統雲端服務的觀測性、應⽤韌性、⾼可⽤性、故障⾃愈等能⼒,從而消除不確定性,為業務系統帶來額外保障。

雲原生提供的穩定性價值被低估,國有大行已嚐鮮

眾所周知,傳統運作環境偏向手工運維,更依賴個人經驗,一般很難做到標準化。而雲端原生架構的本質差異在於容器和容器編排調度的能力,容器化帶來了運行應用程式的標準化環境,包括雲端原生環境下的監控警告、異常事件等資料也是以#標準化的格式#存放,再結合#K8s技術提供的故障自癒以及實現自動化的維運技術,採用雲端原生技術建置的風險預測平台天然就擁有較為智慧、自動化、標準的穩定性保障能力,也可以為傳統虛擬機器環境上的業務應用提供更有效的工具平台。

然而,業界對於雲端原生的期待大多也聚焦在如何將業務遷移到雲端原生架構上。但這遷移過程成本相對比較高,週期也較長,金融業創新意願強烈的頭部客戶固然已經在行動,尤其是一些技術實力強勁的國有大行,以基於雲原生的穩定性保障為後盾,將分散式架構轉型和核心業務小機下移的規劃相結合推進落地,而更多技術儲備不足的企業,往往處於觀望狀態。綜合分析,朱劍峰認為,基於雲端原生架構能夠額外提供的可觀測性、故障自癒能力是被低估的。

朱劍峰表示,像容器、K8s、微服務平台以及穩定性平台屬於工具類平台,是PaaS的雲端原生底座,這些技術工具平台擁有雲端原生的能力和優勢,相較於傳統虛擬機器和實體機可以進一步實現智慧化能力,這也是大家沒有太多感知到的。所以,在業務雲原生化之前,企業不妨考慮將技術工具類平台遷移到雲端原生架構上,透過穩定性保障技術反向為#傳統架構下的業務(包括穩態業務)進行賦能。事實上,部分與網易數帆合作的金融客戶,在某些業務上也謹慎地採用了這樣的策略。

系統穩定性保障三部曲事前降發生與事中降影響並重

#墨菲定律指出,“凡是可能出錯的事有很大機率會出錯”,指的是任何一個事件,只要具有大於零的機率,就不能夠假設它不會發生。這個定律的要義是,即使某件事情發生的機率很低,也不能輕視它,應該採取預防措施來防止不良影響。

那麼,對於業務系統的穩定性保障,該如何建構與完善呢?朱劍峰依照事件生命週期,將增強業務系統的穩定性風險保障能力的建設路徑梳理為三部曲:事前提供風險預測,降低故障發生機率;事中透過故障感知自動根因分析快速止損,降低故障影響;事後完善故障改善追蹤能力,實現穩定建置目標。

事前階段,透過風險預見和中間件巡檢,結合全鏈路壓測、混沌工程、引流回放在測試環境事先發現系統存在的可能風險,給予分析報告;同時,在生產環境定時巡檢,及時發現生產環境可能存在的風險問題。事中階段,透過立體化監控收集系統的深度指標,標準化資料讓根因分析及時發現故障,並定位根因,給予分析報告,做到1分鐘發現問題,5分鐘定位問題。複盤過程中的事後階段的主要目的是總結經驗,並將事前和事中的一些經驗歸納為專家規則庫。

雲端原生穩定性價值被低估?看頭部金融企業穩定保障法則!

然而,如果企業的##IT#團隊能力有限,在資金投入也受限的情況下,應該注重事前、事中還是事後呢?朱劍峰表示,每個企業的情況不一樣,在企業沒有充足的預算和人力的情況下,應該著重在事前降發生和事中降影響兩個面向。事前透過持續巡檢、⻛險評估、故障演練等將異常⻛險左移,引⼊演算法實現事前⻛險預測能⼒,降低潛在的⻛險;事中透過⽴體化監控,在故障發⽣後能快速定位根因,根據故障特徵模版採取限流兜底或⾃愈策略,把影響降⾄最低。

雲端原生穩定性價值被低估?看頭部金融企業穩定保障法則!

沉澱專家經驗降低穩定性保障門檻

據了解,針對企業雲原生穩定性保障方面,網易數帆提供事件生命週期全端能力,包括故障演練、服務治理、風險預見、立體化監控、根因分析、故障自癒、規則專家庫等不同模組。

那麼,網易數帆的核心競爭力有哪些呢?朱劍峰告訴 51CTO,網易數帆雲端原生穩定性保障平台的核心價值在於專家經驗的沉澱,這也是企業數位資產的一部分。一方面,網易在集團業務中涉及大規模互聯網業務,沉澱了非常多的專業的專家經驗,可以覆蓋70%-80% 的互聯網場景,並可復用於金融等行業敏態業務支撐。另一方面,網易數帆還在和包括國有大行在內的多家頭部金融企業合作共建金融業專家庫,不斷完善金融場景下的專家經驗,為金融敏態業務提供穩定性保障。 「基於這套專家經驗庫,網易數帆透過將專家經驗和故障庫形成程式碼,讓機器透過演算法降低對系統保障對『人』的經驗的依賴,讓穩定性保障的門檻變低。」

雲端原生穩定性價值被低估?看頭部金融企業穩定保障法則!

專家經驗能夠在穩定性保障場景中有效使用,其實是透過決策來實現的。一方面是透過規則引擎直接運行專家經驗,另一方面是透過AIGC、AIOps等技術,幫助企業進行輔助性決策,從而不斷提升診斷建議的科學性和有效性。這也是網易數帆在穩定性保障方面的下一步舉措,並且正在內部驗證過程中。

提供轉型利器保障金融系統穩定性

在服務金融企業技術架構轉型過程中,網易數帆對自己的定位也相對比較清晰。一是透過與業界頭部金融企業合作共建,打造經過大規模實踐優化的具備#自主可控、#穩定、# #、技術領先,以及

持續演進的技術底座產品,為金融企業提供轉型的利器。二是秉持開源、開放式、無綁定的原則,提供輕量、解耦的模組化工具產品,配合企業已有的IT規劃小步快跑,逐漸落地數位轉型。

某家金融企業常出現快取不可用的情況,間接導致業務無法使用。而這家企業的自動化程度較低、觀測性也較弱,無法發現問題出現的根本原因。接入網易數帆雲原生穩定性保障平台後,該企業透過穩定性巡檢的方式發現底層儲存抖動,精確定位到SSD寫穿掉磁碟的故障,以便及時發現問題,告知儲存團隊排查處理。此外,底層儲存的抖動,也會影響到對應虛擬機器和實體機運作的中間件,網易數帆基於雲端原生實作中間件品類設計

配套的異地多活及故障自癒能力,如果出現異常

抖動的情況,######可以透過這項能力及時將流量遷移到穩定的叢集######,從而規避風險。朱劍峰強調,大型企業最核心的訴求就是出現問題後能夠快速止損,因此底層儲存出現抖動,如果排查問題並恢復#######對應的儲存######,整個週期是非常長的。但是透過穩定性巡檢######的######方式快速發現問題,並且自動解決事故,是事中快速停損的一種方法。 ###############結語################

金融業一直是網易數帆持續投入與推動落地實踐的重要領域。融合網易互聯網技術與金融業服務經驗,透過提供微服務治理、API 閘道、容器平台、分散式快取、訊息、搜尋等雲端原生PaaS 中介軟體及相關雲端原生分散式產品全端能力,網易數帆已經幫助兩家國有四大行、十餘家中國金融百強企業客戶向雲端原生分散式架構轉型升級,建立API資產全生命週期管理,#打造滿足金融業務特性的企業級技術底座,幫助金融企業應對複雜業務場景的挑戰,加速金融業務創新。在雲端原生穩定性保障領域,未來,網易數帆也將與金融企業持續合作,不斷完善DBASRE老專家經驗,進而提升診斷建議的科學性及有效性,並結合智慧決策,幫助金融企業滿足業務穩定性成長需求。

以上是雲端原生穩定性價值被低估?看頭部金融企業穩定保障法則!的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:51cto.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
最新問題
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!