維運與維護
維運與維護確保 FactVerse 環境在上線後持續可用。維運模型應明確負責人、例行檢查、支援流程、變更窗口、故障分流和定期複核。
前提條件
環境應已完成上線交接。需要指定環境負責人、支援負責人、整合負責人、身分負責人,以及已部署模組的產品負責人。
維運節奏
輸入資訊
| 輸入 | 範例 |
|---|---|
| 環境清單 | URL、部署模型、產品、整合、來源系統、負責人。 |
| 支援模型 | 一線支援負責人、升級路徑、服務窗口、回應預期。 |
| 監控範圍 | 登入健康、頁面可用性、連接器任務、排程任務、API 錯誤、儲存、備份狀態。 |
| 維護窗口 | 更新、配置變更、憑證操作和整合變更的固定時間窗口。 |
| 溝通對象 | 業務負責人、IT 負責人、產品負責人、服務台、DataMesh 聯絡人。 |
例行檢查
| 頻率 | 檢查項 |
|---|---|
| 每日或工作日 | 環境可用性、使用者登入問題、關鍵連接器任務、緊急支援單。 |
| 每週 | 失敗任務、存取請求、產品工作流程異常、儲存趨勢、備份狀態。 |
| 每月 | 使用者和角色複核、未使用服務身分、憑證和 Key 到期、版本說明、已知問題。 |
| 每季 | 復原測試規劃、整合負責人複核、資料留存複核、維運模型複核。 |
故障分流
- 確認受影響環境、租戶、使用者群組、產品區域和開始時間。
- 將問題歸類為存取、產品工作流程、資料整合、效能、可用性或外部依賴。
- 檢查近期變更、版本發布、憑證輪換、IdP 變化、網路變化和來源系統變化。
- 指定客戶溝通負責人和技術調查負責人。
- 記錄影響、臨時處理方式、下次更新時間和關閉證據。
維護活動
| 活動 | 需要指定的負責人 |
|---|---|
| 使用者和角色複核 | 租戶管理員或客戶 IT 負責人。 |
| 連接器憑據輪換 | 整合負責人和來源系統負責人。 |
| API Key 複核 | 整合負責人和環境負責人。 |
| 憑證續期 | 客戶 IT 負責人或託管負責人。 |
| 版本驗證 | 產品負責人、業務負責人和 DataMesh 專案或支援聯絡人。 |
| 備份複核 | 環境負責人和復原負責人。 |
維運記錄
日常維運應留下能幫助下一任支援負責人接手的記錄。建議持續維護環境清單、整合清單、使用者管理記錄、服務身分記錄、事件記錄、維護記錄、版本驗證記錄,以及備份或復原測試記錄。這些記錄可以保持輕量,應說明發生了什麼變更、由誰批准、如何驗證,以及還有哪些後續事項未關閉。
對於較大部署,可以在月度或季度維運會議中複核這些記錄。複核重點應放在重複事件、長期未處理的存取請求、反覆失敗的連接器、容量或儲存趨勢、憑證和密鑰到期,以及業務責任人的變化。這樣可以讓團隊從專案記憶過渡到穩定的維運流程。
預期結果
環境可維護的標誌是:負責人能夠發現問題、溝通影響、執行例行變更、驗證復原預期,並在不重新梳理專案背景的情況下記錄決策。
常見問題
| 現象 | 檢查 |
|---|---|
| 問題反覆出現 | 根因記錄、監控訊號、負責人和定期複核。 |
| 存取請求處理慢 | 角色模板、審核負責人、租戶管理員可用性和 SSO 群組映射。 |
| 整合失敗難診斷 | 來源系統負責人、憑據負責人、同步計畫、日誌和樣例記錄識別。 |
| 維護窗口影響使用者 | 溝通清單、業務日曆、版本範圍、驗證計畫和回復條件。 |