分享到:
0
智能運維之——看日志分析平臺如何點“數”成金

前言

日志數據是運維監控中主要的數據源,記錄了從業務、中間件、系統等全鏈路信息,可以有效監控IT系統各個層面,從而快速診斷系統故障,洞察系統運行狀況,對于開發、運維、測試和審計等各個環節工作都有非常重要的作用。
 
大數據智能時代,數據中心服務器規模、數據規模、集群規模等均呈爆發式增長,數據中心網絡、設備、系統、環境、業務操作、交易等所產生的海量日志數據,可達到PB/EB量級數據。目前,企業日志數據的應用主要面臨著以下挑戰:
 
·日志統一管理:

業務系統多、數據離散、日志種類多、字段定義未標準化,無法統一管理;同時日志分散不方便查看、日志搜索操作復雜且效率低。
 
·海量日志數據處理:

在每天TB級以上的數據增量下,傳統解決方案的擴展性和穩定性無法保證。
 
·安全合規:

對運維人員的違規操作、系統運行異常、設備故障等安全事件缺乏監控能力。
 
·日志數據的價值挖掘:

日志數據中蘊含大量有價值內容,對數據價值利用不足,僅停留在被動排障階段,無法對業務和IT主動感知,業務異常無法及時發現。
 
傳統運維依靠人力從日志中排查故障原因,通過傳統方式手動設置來解析日志,對代碼要求高、操作繁瑣、排障時間長。因此,利用機器學習等人工智能技術和大數據技術構建一體化的日志分析平臺,對離散日志數據進行統一采集、處理、檢索、可視化分析,是解決當前日志分析難題的重要手段。智能日志分析平臺減少了人工篩查時間,幫助運維人員更快的定位故障,判斷失敗類型,有效地提高故障診斷和恢復效率。
 
德訊大數據日志分析平臺,依據一體化智能運維管理框架,協助數據中心構建完善的“智能感知-智能預警-智能處理”的智能運維管理體系,有機融合監控、管理和故障定位,以預測和自動決策為核心目標,跨平臺融合數據中心機房和系統層面網絡、設備、系統、動環、操作、業務交易等海量數據及日志信息,重點采用大數據、人工智能(AI)、機器學習、機器人等成熟技術進行分析挖掘、故障智能識別與故障自愈,減少對人的依賴,實現機器自判、自斷和自決,實現數據中心智能化IT運維。
 

 
德訊大數據日志分析平臺可實現:
 
(1)多指標關聯分析與告警:

運維指標相關性故障預測,包含跨系統跨主機KPI關聯分析、多KPI關聯預測系統狀況、事件和時序關聯性分析,提前預警系統問題,爭取故障排除時間。
 
(2)多指標動態指標基線預測:

利用閾值預測模型,自動化學習系統關鍵指標歷史運維數據,生成歷史告警運行規律,構建某周期動態預警基線圖,按基線實時預警,擺脫“經驗式”故障告警模式,提升運維準確性。
 
(3)海量日志監控與故障分析:

判斷海量GC日志中錯誤日志;關鍵KPI數據統計分析,預測GC異常,降低GC異常發生時性能影響,過濾大量無效信息。
 
智能故障識別預警是數據中心智能化運維最佳策略。實現數據中心故障智能化,可降低成本;自動異常檢測,智能根因定位,可提高效率;同時避免人員經驗差異與人員操作差異。
 
德訊大數據日志分析平臺具有對業務系統無侵入性、通用性、智能化、實時可視化分析等特點,目前已廣泛應用于制造業、銀行、證券、電力、交通等行業數據中心,助力企業構建大數據運維分析預警,洞察系統隱患,實現故障準確定位并快速解決,同時為企業提供運維決策預測依據,做好管理決策支撐。

 

吉林11选5真准网