Day #11 サービスの運用
※注意:個人で勉強した内容を記事として書き起こしています。内容が必ずしも正しいという保証はありません。もし間違いを見つけられましたら、コメントなどでお知らせいただけると嬉しいです。
システム運用管理者の役割
システム運用管理者の役割は、ユーザに対して IT サービスを提供し業務に役立ててもらうことです。
従来は依頼があってからの リアクティブ (受動的) な運用が主でしたが、最近は自発的に貢献する プロアクティブ (能動的) な活動が推奨されます。
とくに、通常時の運用と障害時の運用の両方を考えたり、導入時の手順なども予め決めておきます。
スケジュール設計
通常時の運用では、日次処理 、 週次処理 、 月次処理 など段階別に運用内容を決定しておきます。
運用ジョブ についても、先行ジョブとの関連を考え ジョブネットワーク (ジョブのつながり方) を考慮してスケジュール設計を行います。
障害時運用設計
障害時の対応も予め設計しておく必要があります。
一般的には BCP (Business Continuity Planning : 事業継続計画) を策定し、復旧にかかる時間の目標である RTO (Recovery Time Objective : 目標復旧時間) や、どの時点のデータまで復旧できるかの目標である RPO (Recovery Point Objective : リカバリポイント目標) を決定します。
障害が起こると重大な影響があり 1秒 も停止させることが許されないシステムを ミッションクリティカルシステム と言います。また、災害などによる致命的な障害から復旧させることを ディザスタリカバリ (災害復旧) と言います。
バックアップ
バックアップの取得方法にはいくつか種類があります。
フルバックアップ | 差分バックアップ | 増分バックアップ | |
---|---|---|---|
容量 | 大 | 中 | 小 |
取得時間 | 長 | 中 | 短 |
復旧時間 | 短 | 中 | 長 |
フルバックアップを取得する周期が短いほど、復旧にかかる時間は短くなります。逆に、フルバックアップからの期間が長いと、差分バックアップや増分バックアップによってフルバックアップ後の更新作業をシミュレートするため、復旧が遅くなります。
システム運用の評価項目
実際の運用が要件を満たしているかどうか、定期的に評価する必要があります。
- 機能性評価指標
- 要求機能の実現度
- 使用性評価指標
- 使いやすさの実現度
- 性能指標
- 応答時間、処理時間など
- 資源の利用状況に関する指標
- 資源の利用状況
- 信頼性評価指標
- システム故障の頻度、障害件数、回復時間など
- 運用者の作業負担
- システム活用のためのユーザへの負担
サービスデスク (ヘルプデスク)
様々なサービスやイベントに関わるスタッフを一戸にまとめる機能です。ユーザにとっては問題が発生した場合の SPOC (Single Point Of Contact : 単一窓口) です。
一般的に、サービスデスクで解決できる問題の場合はその場で解決します。解決しない場合は、他の担当者に連絡して引き継ぐ エスカレーション を行います。