部署一個應(yīng)用交付控制器(ADC)的主要任務(wù)就是為了滿足用戶的需求:在95%的情況下,他們需要保證越來越多且越來越嚴(yán)格的應(yīng)用服務(wù)水平(SLA)。為此,我們必須要考慮提高應(yīng)用的可用性。我們不僅利用本地服務(wù)負(fù)載均衡來保證本地服務(wù)器的暢通,還用全局負(fù)載均衡(GSLB)結(jié)合災(zāi)難恢復(fù)站點來縮短全球范圍的故障時間。另外,提升性能也尤為重要,一些技術(shù)手段可以合理安排由服務(wù)器下達給ADC的CPU密度級任務(wù)來降低負(fù)載,比如SSL、壓縮和智能緩存。
但即使是在部署最好的ADC解決方案之后,我們?nèi)皂毭鎸ΡO(jiān)控既定SLA的挑戰(zhàn)。檢測某個應(yīng)用程序的不可用事件看似簡單:觀察其是否有反應(yīng),若無反應(yīng)則發(fā)送一個錯誤消息。一些ADC在應(yīng)用不可用時會發(fā)出提醒,但為時已晚。
從另一個角度而言,應(yīng)用減速很難被檢測到。因為用戶不會經(jīng)常檢測應(yīng)用程序,甚至不知道多長的無反應(yīng)時間是不正常的,等注意到時已落后許久。帶來的結(jié)果往往是對業(yè)務(wù)執(zhí)行的嚴(yán)重?fù)p害,甚至降低員工的生產(chǎn)效率,同時也會影響客戶的滿意度和忠誠度。
為了填補應(yīng)用減速的監(jiān)控盲區(qū),我們需要確定對哪個節(jié)點進行實時流量監(jiān)控,對哪個節(jié)點制定自動執(zhí)行監(jiān)控任務(wù),并且時刻準(zhǔn)備執(zhí)行。
在接收到應(yīng)用減速提醒,并認(rèn)識維護用戶體驗的重要性后,最痛苦的事情莫過于尋找引起應(yīng)用減速的癥結(jié)所在,而這需要更高級的解決方案。
應(yīng)用性能監(jiān)測系統(tǒng)(APM)是一套精良可視化的工具,它幫助IT管理員們獲取程序的性能指數(shù),并實時維護應(yīng)用的SLA活躍度。它的重要性體現(xiàn)在可為潛在的問題或者是在問題出現(xiàn)的第一時間訂制積極的解決方案,因為問題存在之后的被動反應(yīng)會造成嚴(yán)重的經(jīng)濟損失。
一般說來,制定APM方案可以從以下兩方面考慮:
1.利用運行預(yù)置的腳本的綜合工具來瀏覽web應(yīng)用程序并衡量其反應(yīng)時長或可用性。
2.在每個應(yīng)用程序服務(wù)器里安裝專用軟件客戶端,收集每個用戶和服務(wù)器中處理事務(wù)的數(shù)據(jù),并以此衡量性能。
第一個選擇是廉價的,要求應(yīng)用的集成度相對較低,只需為每個應(yīng)用程序運行一個非入侵性的腳本。然而這種方法有很強的局限性:一方面,它只能獲取應(yīng)用程序的狀態(tài),且不是實時的;另一方面,它無法改寫數(shù)據(jù)來解決問題。對應(yīng)用程序的實時狀況(包括實際應(yīng)用交易及用戶體驗)覆蓋度明顯不足。
第二個選擇提供高端的解決方案,它能夠以每個實際用戶或業(yè)務(wù)為單位細致拆解,進行精確的根源分析。它要求前期較高的成本投入,同時需要和服務(wù)器操作系統(tǒng)的深度整合也會給生產(chǎn)環(huán)境帶來一定的風(fēng)險。
想像一下,如果你有第三個選擇會怎樣。它提供的監(jiān)控方案既便捷又經(jīng)濟,同時更綜合了前兩個選擇的優(yōu)勢,你的應(yīng)用交付設(shè)備將由這樣的APM工具所支持,它具備如下特性:
•可監(jiān)控各服務(wù)的性能;
•可監(jiān)控用戶與數(shù)據(jù)中心之間的網(wǎng)絡(luò)性能;
•可監(jiān)控實際用戶體驗,如響應(yīng)時間,錯誤類型等;
•可識別多用戶,多業(yè)務(wù),以及應(yīng)用裝載之間的關(guān)系映射;
•提供一個中心APM控制臺,可從多個數(shù)據(jù)中心的各項應(yīng)用中收集數(shù)據(jù),并將處理過的信息顯示出來;
•可為某個業(yè)務(wù)或某一組業(yè)務(wù)設(shè)置監(jiān)控策略,一旦超過既定SLA就能給你提醒;
•可提供根源分析的所有相關(guān)信息;
Radware的APM系統(tǒng)是業(yè)內(nèi)領(lǐng)先的。其狀態(tài)收集功能被整合在ADC中,它可以從這個絕佳位置來監(jiān)督所有服務(wù)和用戶。它還具備先進的報告引擎來生成和傳遞符合人們閱讀習(xí)慣的報告,在該系統(tǒng)全權(quán)監(jiān)控下,一旦任何應(yīng)用的SLA有誤差,就會發(fā)出警告。
當(dāng)IT管理員捧著扔過來的性能數(shù)據(jù),被要求去查明是否存在問題、問題的癥結(jié)何在時,不會再手足無措。Radware的APM系統(tǒng)可將縱向挖掘的數(shù)據(jù),與應(yīng)用裝載狀態(tài),數(shù)據(jù)中心、網(wǎng)絡(luò)和用戶之間的延時曲線等橫向數(shù)據(jù)相結(jié)合,有效分析并定位影響相關(guān)SLA的根源所在。
因此,網(wǎng)絡(luò)管理員不會再聽到應(yīng)用管理員的抱怨,說網(wǎng)絡(luò)有問題再次造成應(yīng)用減速;而應(yīng)用團隊也不會被告知說網(wǎng)絡(luò)是正常的,問題出在應(yīng)用本身。Radware的APM系統(tǒng)提供透明的監(jiān)控方案,讓雙方都可以輕易地發(fā)現(xiàn)在應(yīng)用交付的哪個環(huán)節(jié)出現(xiàn)問題,哪個環(huán)節(jié)造成了延時,哪個環(huán)節(jié)的工作需要完善等,讓各應(yīng)用的SLA和響應(yīng)時間回歸正常。
Radware的ADC解決方案用全新的且具有歷史意義的途徑來保證各項應(yīng)用的SLA:它提供的工具既支持應(yīng)用的可用性又滿足其加速需求,同時,一個被整合或嵌入的APM系統(tǒng)可以孵化出最佳的方案,可支持重要應(yīng)用性能監(jiān)控的可視化功能,從而成為應(yīng)用性能持續(xù)優(yōu)化的有力保障。