サーバー設定作業でミスを防ぐ5つの方法|作業前のチェックリスト

こんにちは。「クロジカサーバー管理」 IT/テックライターのkait78です。

企業のホームページや社内システムを動かしているサーバー。サーバー管理・運用担当者は、本番環境として稼働しているサーバーに対して、コンテンツの追加やソフトウェアのバージョンアップデートなどの作業が必要です。

しかし、サーバー設定作業中に予期せぬエラーや設定不備によりホームページやシステムに不具合を起こしてしまった担当者の方もいるのではないでしょうか。本記事では、サーバー設定における作業ミスを防ぐための方法について解説します。

サーバー設定作業とは

はじめに、サーバー設定作業についての具体的な事例と共に、設定作業ミスが起こる原因、それに伴うリスク・損害について解説します。

サーバー設定作業

サーバー設定作業とは、具体的にどのような作業をしているのでしょうか。サーバー設定作業は下記のような場合に行われます。

  • システムにおける機能追加・改修
  • 既存のシステムにおいて不具合がある場合や、機能追加(EC機能やAIチャットボットの搭載など)を行う場合
  • 月次での手動バックアップの取得や、ログの収集・調査、不要のファイル削除などを行う場合
  • サーバーの故障時や機器のリプレースを行う場合
  • 日常的なメンテナンス
  • サーバー交換作業

このようにウェブサイトやシステムの安定稼働には、サーバーのメンテナンスは欠かすことができない作業となります。

サーバーの設定作業ミスが起こる原因

それでは、なぜサーバー設定作業でミスが起こってしまうのでしょうか。技術的なスキルが足りない場合や、サーバーの機械的な不具合(CPU高騰によるコマンドを受け付けなくなる)などの原因もありますが、基本的には人為的エラー(ヒューマンエラー)が原因です。

総務省「多様化・複雑化する電気通信事故 の防止の在り方について 参考資料」によると、ヒューマンエラーは大きく2種類あるとされています。

  • うっかりミスや錯覚等により、意図せず行ってしまったもの
  • 手順違反と知りながらやってしまったもの

設定・作業ミスにより発生する損害

サーバー設定のミスが引き起こす損害は計り知れません。システムやWebサイトのサービス停止や、仮に設定ミスでセキュリティが脆弱になってしまうと、企業活動にとって深刻な影響を及ぼす可能性があります。例えば、企業のブランド力低下や損害賠償請求などにも繋がる恐れがあり、小規模レベルでも数百万円の損害が出る場合があります。

セキュリティ事故による損害について下記で詳しく解説しています。

▼Webサイトのセキュリティ対策における損害についての記事はコチラ
Webサイトのセキュリティ対策を怠ることで起きてしまう損害とは?

サーバー設定作業でミスを防ぐ方法

それでは、サーバー設定作業でミスを防ぐ方法について詳しく見ていきましょう。ミスを未然に防ぐための手法は複数あります。1つだけを実践するのではなく、複数の手法を取り入れることが重要です。

TBM-KY

TBM-KYとは、TBM(ツールボックスミーティング)とKY(危険予知活動)を作業前に行う方法を指します。作業員が作業前に「ツールボックス=道具箱」の近くで行う打合せという意味でこの名前が付けられました。TBM-KYでは、作業前にメンバーで集まり、実施する作業の危険ポイントや周知事項などの共有を行います。具体的にはメンバー間で下記のようなことを確認します。

  • 作業対象とその影響範囲

「今回の作業はシステムAにおける作業であり、その他のシステムには全く触らない作業である、よってシステムA以外のアラームが出ないという認識を持つこと」これにより、システムA以外でアラームが鳴った場合、作業ミスをしている可能性があると気づくことができます。

  • 危険個所の説明
    「今回の作業の項番●において、ミドルウェアの再起動を行います。サーバー本体の再起動ではないため注意してください。」

このように、危険作業のポイントを事前に説明しておくことで、対象箇所により注力して作業を実施できるようになります。TBM-KYは作業前の5分~10分の間で実施を行います。作業1時間前や前日に実施してしまうと作業員も記憶が薄れてしまうため、TBM-KYは作業直前に実施するようにしましょう。

事前確認・事後確認

事前確認・事後確認を実施するようにしましょう。作業前後だけでなく、作業内の項番ごとに確認することが重要です。

例えば、サーバーのプログラム修正を行う場合は、以下のように作業の前後で確認するとミスを減らすことができます。

  1. 事前のコードと変更箇所を確認
  2. コードの変更を実施
  3. 事後でコードが追加されたことを確認

ダブルチェック

ダブルチェックも作業ミスを減らす施策として非常に有効です。ダブルチェックは、一度のチェックだけでは見落とされがちなエラーを防ぐために行います。別の作業員が作業内容を再チェックすることで、ミスを未然に防ぎます。

手順書遵守

作業手順書の遵守を徹底しましょう。

人間は作業に慣れてしまうと、手順書を読み飛ばしてしまったり、自分の記憶だけで作業をしてしまう傾向にあります。ヒューマンエラーの原因となるため、慣れている作業・熟練の作業員でも手順書を遵守して作業させるように日頃から意識させることが重要です。

ツールによる自動化

サーバー設定作業自体をツールにより自動化することも、作業ミス削減に繋がります。特に繰り返し行われる作業においては、自動化ツールの導入が効果的です。ただし、ツールの自動化にはRPAや新たにシステムを構築する必要があるため、コストや時間が掛かってしまうことに注意しましょう。

もし設定作業ミスをしてしまったら

ここまで、作業ミスを防ぐ方法について解説してきました。しかし、人間はミスをする生き物です。そこで最後に、サーバー設定作業でミスが発生した場合の対処法についてご紹介します。

社内へ情報共有

設定ミスが発生した場合、迅速な情報共有が重要です。

部署の上長やリーダー、カスタマーセンターなど然るべき部署に情報共有をしましょう。これにより2次被害を防止し、お客様への情報展開など被害の拡大を食い止めることができます。ただし、作業ミス発生時は、作業員も気が動転して正確な情報共有や正常な判断ができない可能性があります。作業手順書などに予め緊急連絡先を記載しておくと良いでしょう。

切り戻し作業の実施

作業ミスが発生した場合は、直ちに切り戻し(作業前に戻す)作業を実施するようにしましょう。作業ミスを取り戻そうとして、手順にない作業を実施してしまうと被害が深刻化する場合があります。切り戻しで一度作業前の状態に戻し、作業ミスした原因を特定・修正したうえで再実施を行いましょう。

再発防止策の策定

ミスの再発を防ぐためには、原因分析と再発防止策の策定が不可欠です。ミスの原因を効果的に特定し、同様のミスを起こさないように心がけましょう。再発防止策は手順書の追加・修正や、ツールによる自動化、メンバーへの周知徹底などが挙げられます。施策内容によっては、期間として数か月~1年程度、金額も数十万円~数百万円掛かる場合があります。

サーバー管理は外部委託へ任せた方が安心

本記事ではサーバー設定作業でのミスを防ぐ方法と、万が一ミスが発生した際の対処法を解説しました。サーバー設定はシステムの安定稼働には不可欠な作業ですが、ヒューマンエラーなどの危険も伴います。そこで、日々のサーバー管理や設定変更作業を外部委託へ任せてみてはいかがでしょうか。

「クロジカサーバー管理」では、お客様サーバーのバージョンアップ作業やバックアップの取得を代行して行うサービスを提供しています。他にも、24時間体制での監視やセキュリティ運用などトータルでサポートが可能です。

また、事業会社様のウェブサイトをデザインされるWeb制作会社様でクライアント様から「サーバー管理まで対応してほしい」というお声がある場合、Web制作会社様向けのパートナープログラムもご用意しておりますので、詳細のご質問などについてお気軽にお問い合わせください。

▼パートナープログラムについて
https://kurojica.com/server/partner-program/

ライター:kait78

元大手通信事業者のインフラエンジニア。ネットワーク・サーバー・AWS領域でIT/テック記事に特化した記事を執筆。Webサーバーにまつわる課題や悩みに対して実務経験を基にした、現場社員目線の課題解決となるアイデアを提供します。

コーポレートサイトクラウドでセキュアに

コーポレートサイトをクラウドでセキュアに クロジカガイドブック

無料ではじめるサーバー管理
クロジカガイドブック

「クロジカサーバー管理」の詳しい内容がわかる資料をご用意しました。
  • コーポレートサイト構築・運用の課題を解決
  • クロジカサーバー管理の主な機能
  • 導入事例
  • 導入までの流れ

詳しい資料をご覧いただけます

クロジカサーバー管理のサービス内容を記載した資料をダウンロードできます。
クロジカの機能や事例が分かる
資料ダウンロード