虹科PagerDuty为澳大利亚零售巨头提供始终在线的数字体验
澳大利亞零售巨頭( Australian Retail Giant)
隨著決定將其網站的開發和管理納入內部,這家零售巨頭看到了重塑其技術生態系統的機會。該網站將是第一個使用全新 API 平臺的網站,該公司需要實時了解系統以管理和診斷問題。一位首席開發人員分享道:“第一個在新平臺上使用新 API 的應用程序是網站。建立成功的在線零售體驗對于我們向前發展的戰略至關重要。”
支持內部網站啟動
雖然工程團隊已經成熟,但需要更多可擴展的事件管理流程來支持不斷變化的環境。“我們需要各種不同的技術來支持新平臺上的這項計劃,”首席開發人員解釋說。雖然登錄成功,但沒有簡單的方法來提醒團隊注意問題。必須有人去查看和理解日志,確定警報是否值得打電話,并找出實際打電話給誰。隨著時間的推移,工程的快速交付使得在正確的時間找到正確的人變得具有挑戰性。
零售商需要應對這些挑戰,以確保網站具有高可用性。中斷可能導致生產力損失、收入損失和負面品牌影響。經過審查,團隊定義了改進事件響應所需的幾項技術要求:
- 深入了解事件的根本原因。
- 利用隨著時間的推移提供智能建議的 AI 功能。
- 鼓勵產品所有權,以減少事件到達正確工程師的時間,并消除不正確的呼叫。
- 管理和衡量 MTTA 和 MTTR。
為實現這一目標,該公司需要一個能夠豐富可用信息的平臺——鏈接系統之間的依賴關系,并與 ITSM 和 APM 工具同步信息。這將告知誰受到事件的影響以及哪些能力可能會被破壞,并確保將關鍵工作迅速發送給正確的團隊。
將 PagerDuty 集成到生態系統中
PagerDuty 被選為可擴展、易于使用的數字運營平臺。PagerDuty 與零售商的現有服務集成,提供整個生態系統的端到端可見性。這使團隊能夠為關鍵工作構建一個精心策劃的流程,并支持一種產品所有權文化。
與ServiceNow的緊密集成立即證明對事件響應很有價值——映射優先級、在兩者之間同步注釋以及關閉任一平臺上的事件。“能夠以非常少的工作量提供大量開箱即用的集成,真是太好了,”首席開發人員分享道。Jira集成用于不需要經過正式 ITSM 流程的警報,例如其他問題的副產品。該團隊利用 Jira 內部的工作流程來管理這些警報,在兩個平臺之間同步筆記。這種集成鼓勵了更具彈性的應用程序設計、引導質量日志記錄并確保創建高質量的票證。
利用自動化和事件智能
PagerDuty 的 ML 支持的事件管理Event Intelligence幫助自動化事件響應。變更事件提供了態勢感知,在代碼存儲庫中顯示有關最近部署和發布的關鍵信息。這對于 Terraform 項目特別有用,可以提供有關何時、何地以及誰進行合并等事件的洞察。
在關鍵集成到位后,該團隊構建了技術服務來路由事件。工程師有權掌握技術服務數據庫的所有權,跟蹤誰擁有什么。在這些技術服務中創建了依賴關系,從而實現了跨 API 的問題相關性。隨著時間的推移,PagerDuty 可以確定事件的潛在影響因素并縮小正確的工程師范圍。“我們看到了 AI 鏡頭對我們的服務和依賴項的好處。” 首席開發人員說。“PagerDuty 幫助我們對我們的服務更有信心,并從工程角度為我們提供了關于技術服務及其狀態的真實來源。”
對于零售商來說,了解事件對業務的影響至關重要。使用 PagerDuty 的業務服務,它能夠有效地將信息傳達給正確的業務利益相關者。更好的是,業務服務的所有者可以訂閱警報或查看狀態儀表板,以了解正在發生的事情以及解決方案何時到位。“使用 PagerDuty 使我們的服務臺能夠立即了解特定事件可能會破壞哪些功能,”首席開發人員解釋說。
PagerDuty 的優勢
借助 PagerDuty,這家零售店使用新的 API 平臺成功地在內部推出了新網站。隨著更好的事件響應操作到位,該公司旨在為客戶提供令人驚嘆的在線零售體驗,同時讓他們自己的員工滿意。
團隊取得了:
- 全棧可見性。與現有技術堆棧(包括 ServiceNow、Microsoft Teams、Jira 和 Dynatrace)的集成具有集中操作。AI 正在提供有意義的關聯,推動更快地診斷 API 問題的根本原因。
- 減少解決時間。AIOps 功能消除了事件路由中的手動流程和猜測。可操作的警報會立即發送給正確的工程師。準確的數據提供對事件響應的洞察,幫助團隊學習和改進運營。
- 改善團隊健康。在高度集成和明確的產品所有權的推動下,工程師收到的警報越來越少,并且確信他們收到的警報是為他們準備的。
- 有效的利益相關者溝通。狀態儀表板可讓團隊查看何時發生影響他們關心的業務服務的事件。
- 全渠道客戶體驗。為客戶帶來全新的零售體驗,他們現在可以在店內或網上無縫購物。
首席開發人員分享道:“PagerDuty 正在幫助我們了解我們的應用程序,可視化我們的產品健康狀況,并營造一種主人翁文化。”
面向未來的強大平臺
整個組織都有持續改進的計劃。該公司正在探索PagerDuty Analytics,包括用于衡量事件對團隊影響的智能儀表板,并將引入事后分析以避免重復錯誤。它還積極研究最佳實施更多事件智能功能的方法,以幫助團隊減少噪音并縮短解決時間。為了進一步簡化運營,PagerDuty 將推廣到其他團隊,包括企業基礎設施和安全。
“回顧這一切,我們實現了目標,并擁有一個非常強大的平臺,我們可以在此基礎上進行構建,”首席開發人員說。
總結
以上是生活随笔為你收集整理的虹科PagerDuty为澳大利亚零售巨头提供始终在线的数字体验的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 用C语言数组写的简易客房管理系统
- 下一篇: dwz之整理篇