5G將開啟產(chǎn)業(yè)互聯(lián)網(wǎng)變革的新篇章,推動5G融合應用發(fā)展是業(yè)內(nèi)共識。GTI最新發(fā)布的《5G智能化網(wǎng)絡白皮書》強調(diào),網(wǎng)絡智能化是5G網(wǎng)絡高效高質(zhì)建設部署和運營不可或缺的能力。如何為用戶提供更高質(zhì)量、更有保障的通信服務,成為運營商乃至整個社會信息化發(fā)展的重要課題。
5G核心網(wǎng)運維的新挑戰(zhàn)
5G核心網(wǎng)(5G Core)是電信運營商5G建設的重要組成部分,采用全新技術,在實現(xiàn)網(wǎng)絡部署、網(wǎng)絡功能、新業(yè)務開展的同時,監(jiān)控保障也面臨全新挑戰(zhàn)。在4G核心網(wǎng)(EPC,Evolved Packet Core)中,網(wǎng)元由專有設備承載,硬件屬性較強。而在5G核心網(wǎng)環(huán)境中采用基于服務架構(SBA,Service Based Architecture),融入云原生、微服務等設計思想, 以軟件化,模塊化、服務化的方式構建核心網(wǎng)。對于全新核心網(wǎng)的運維保障,面臨如下挑戰(zhàn):
網(wǎng)絡功能解耦使監(jiān)控對象數(shù)量激增
依據(jù)3GPP定義,5G核心網(wǎng)的各網(wǎng)絡功能(NF,Network Function)在功能級別上解耦,拆分出若干個獨立的網(wǎng)絡功能服務(NFS,Network Function Service),這些網(wǎng)絡功能獨立運行,提供標準化服務接口,通過相互調(diào)用訪問實現(xiàn)網(wǎng)絡功能。在5G核心網(wǎng)方案中,虛擬化、云原生技術的融入,使通用服務器取代專有硬件設備,與此同時虛擬網(wǎng)元,虛擬機、容器POD的數(shù)量飛速增長,每個工作負載同時提供多個IPv4、IPv6工作平面。
相較4G EPC,由于眾多方面演進疊加在一起,在5G核心網(wǎng)SBA架構中虛擬化后的NFS實例數(shù)量以2個以上的數(shù)量級增長,需要監(jiān)控的對象數(shù)量巨大是5G核心網(wǎng)保障側(cè)第一個挑戰(zhàn)。
服務自動化增加了網(wǎng)絡追蹤的難度
通過網(wǎng)絡功能倉儲(NRF,NF Repository Function),5G 核心網(wǎng)的各類網(wǎng)絡功能服務得以自動化管理,實現(xiàn)服務的自動發(fā)現(xiàn)以及注冊、更新、狀態(tài)檢測等,避免服務訪問中進行大量手動配置工作;集中控制面可以將大量跨區(qū)域的信令交互變成數(shù)據(jù)中心內(nèi)部流量,優(yōu)化信令處理時延;根據(jù)業(yè)務應用的變化,按需快速擴縮網(wǎng)絡功能和服務,提高網(wǎng)絡的業(yè)務響應速度。自動化管理在生產(chǎn)側(cè)提升了管理效率,同時在核心網(wǎng)保障側(cè)增加了動態(tài)性強、難以跟蹤的新挑戰(zhàn)。
路徑優(yōu)化與交互解耦抬高了監(jiān)控復雜度
4G核心網(wǎng)的網(wǎng)元之間的通信遵循請求者和響應者的點對點模式,是一種相互耦合的傳統(tǒng)模式。在 5G 核心網(wǎng)服務化架構下,各網(wǎng)絡功能服務之間可以根據(jù)需求按需通信。5G 核心網(wǎng)架構下的網(wǎng)絡功能服務間通信機制進一步解耦為生產(chǎn)者和消費者模式,具備靈活可編排、解耦、開放等優(yōu)點,是 5G 時代迅速滿足垂直行業(yè)需求的一個重要基礎能力。各網(wǎng)絡功能在實際應用過程中,避免了不必要的網(wǎng)絡中轉(zhuǎn),但服務間的調(diào)用依賴,訪問追蹤,性能分析,故障定位等也成為運維保障側(cè)的新挑戰(zhàn)。
DeepFlow 5G核心網(wǎng)網(wǎng)絡功能服務監(jiān)控方案實踐
DeepFlow是一款面向5G核心網(wǎng),基于對服務NFS間的通信訪問流量進行獲取分析,以保障核心網(wǎng)穩(wěn)定運行的軟件產(chǎn)品。在整體方案中,可按處理邏輯分為流量獲取、數(shù)據(jù)分發(fā)傳輸、診斷分析三大部分,通過流量采集預處理抽象層,提供流量采集及預處理的北向管理接口,使整個監(jiān)控平臺具備可擴展的基礎數(shù)據(jù)獲取能力。
通常5G核心網(wǎng)環(huán)境中,主要涉及到KVM虛擬機與容器POD的網(wǎng)絡流量獲取。DeepFlow 5G核心網(wǎng)網(wǎng)絡功能服務監(jiān)控方案支持IPv4、IPv6協(xié)議環(huán)境,緊密結(jié)合HTTP v2協(xié)議,實現(xiàn)服務間關聯(lián)依賴監(jiān)控。本文基于運營商實際5GC運行環(huán)境,化繁為簡并以Free5GC環(huán)境為基礎進行介紹。
What is free5GC?
The free5GC is an open-source project for 5th generation (5G) mobile core networks. The ultimate goal of this project is to implement the 5G core network (5GC) defined in 3GPP Release 15 (R15) and beyond. -- www.free5gc.org
Free5GC是5G核心網(wǎng)開源軟件項目,總體架構基于3GPP標準、遵循SBA框架,采用虛擬化方式實現(xiàn)網(wǎng)絡功能,可運行5G核心網(wǎng)的標準服務,并且可以模擬相應工作流程。在實際5G環(huán)境中,多數(shù)廠商已經(jīng)采用容器技術承載網(wǎng)絡功能服務。在本文環(huán)節(jié)中,采用虛擬機運行容器,創(chuàng)建Kubernetes集群, 搭建5G核心網(wǎng)驗證環(huán)境,使能各網(wǎng)絡功能。通過云杉網(wǎng)絡的DeepFlow平臺實現(xiàn)對各網(wǎng)絡服務的監(jiān)控保障。實踐過程中部署的組件包括控制器、采集器以及數(shù)據(jù)節(jié)點。
圖:5G核心網(wǎng)監(jiān)控方案
由大到小追蹤網(wǎng)絡服務
在5G核心網(wǎng)的監(jiān)控實踐中,由大到小,逐級有序地展示服務運行狀態(tài)及關聯(lián)關系。通常根據(jù)工作流程分為三大范圍,較大范圍以數(shù)據(jù)中心所屬區(qū)域或資源池劃分,其次為網(wǎng)絡功能或服務類型,比如AMF、UDM、SMF等,最后將集中在IT單元,比如容器POD、宿主機、IP等。DeepFlow平臺按照三類范圍由大到小的操作劃分,為核心網(wǎng)所涉及到的復雜網(wǎng)絡提供完整的、逐級的監(jiān)控跟蹤。下圖呈現(xiàn)的是各類型網(wǎng)絡功能服務運行及調(diào)用關系全景視圖,將服務接口(SBI,service-based interface)中的網(wǎng)絡各功能間的調(diào)用通信,以及性能指標進行自動繪制并呈現(xiàn)。
圖:功能服務全景圖
實踐過程中,關注服務間重點指標,包括網(wǎng)絡層(吞吐、載荷),傳輸層(并發(fā)連接、TCP建連時延、TCP系統(tǒng)時延,TCP重傳、建連失敗)應用層(HTTP請求、HTTP時延、HTTP異常),繪制訪問調(diào)用關系全景視圖后,在知識圖譜功能支持下,可以迅速關聯(lián)列舉相應的知識維度。
分鐘級定位異常邊界范圍
5G核心網(wǎng)中存在大量的、復雜的NFS間服務調(diào)用,具備有效的調(diào)用性能跟蹤能力尤為重要。
圖:服務間訪問示例
如上圖所示,一個簡單的邏輯調(diào)用,AMF(Access and Mobility Management Function)中的NFS調(diào)用UDM(Unified Data Management)中的NFS獲取用戶信息,這個過程中,并不是像傳統(tǒng)環(huán)境中直觀簡單。在5G現(xiàn)網(wǎng)環(huán)境中,普遍涉及宿主機、虛擬機、容器的網(wǎng)絡虛擬化實現(xiàn),以全棧分段來梳理訪問調(diào)用,是應對新環(huán)境運維排障挑戰(zhàn)所必須具備的。以全棧視角,展開以上調(diào)用,可以剖析NFS發(fā)起調(diào)用所經(jīng)過的POD接口、虛擬機接口、宿主機接口乃至網(wǎng)關等鏈路。
圖:服務調(diào)用全棧跟蹤示意圖
全棧跟蹤針對云中服務間的調(diào)用訪問,將虛擬化所實現(xiàn)的邏輯通信進行逐步展開,清晰便捷展示每段的網(wǎng)絡狀態(tài),性能,結(jié)合知識圖譜及豐富的指標數(shù)據(jù),快速定位性能異常的問題范圍邊界。以上所述訪問為例,如果排查調(diào)用延時故障,確定NFS調(diào)用服務雙端后,展開全棧跟蹤,直接定位延時所在的接口。如全棧跟蹤示例圖中,清晰展示出服務AMF服務實例至UDM服務實例兩端訪問延時瓶頸在UDM功能側(cè),且聚焦在其運行所屬虛擬機的虛擬網(wǎng)絡接口處。而排除UDM服務實例的POD網(wǎng)絡接口及AMF所涵蓋的虛擬機、POD等眾多接口路徑。
圖:全棧跟蹤示例
在沒有DeepFlow全棧跟蹤工具的情況下,排查服務訪問調(diào)用的性能將是一個頭緒紛亂、復雜繁瑣且冗長的過程,同時對于一線運維人員要求所掌握的技術棧相對較多、要求綜合能力強,很可能耽誤寶貴的運維窗口時間。
總結(jié)
以上Free5GC示例運行在實驗室環(huán)境,模擬運行了相應的測試用例,實際生產(chǎn)場景較實驗室更加環(huán)境復雜且規(guī)模巨大,勢必對運維保障提出更高要求。經(jīng)過實際環(huán)境測試驗證,DeepFlow平臺也確實能為5G核心網(wǎng)填補監(jiān)控保障空白。
DeepFlow是一款面向5G核心網(wǎng),應對網(wǎng)絡功能服務(NFS)分拆解耦后的新挑戰(zhàn),進行流量采集獲取、分發(fā)、可視化與監(jiān)控保障的產(chǎn)品。幫助5G核心網(wǎng)在基于服務架構中統(tǒng)一采集服務間的網(wǎng)絡流量,實現(xiàn)對訪問調(diào)用的全面性能監(jiān)控,并提供容器化后的全棧路徑跟蹤,補齊5G核心網(wǎng)服務監(jiān)控空白,應對云原生特點,緊密結(jié)合5G服務,解決5G核心網(wǎng)生產(chǎn)中遇到的監(jiān)控、運維、保障等難題。