技術情報コラムColumn

久しぶりのサーバのシャットダウン/再起動

技術解説
システムエンジニアというの仕事をしていると、お客様のサーバをシャットダウン、再起動する機会が多くなります。 中には、導入後初めてシャットダウンする場合や、そこまでではなくても1年ぶりに再起動するといった場合が多々あります。 この「久しぶりに」というのが中々の曲者で、ハードウェアの故障で二度と起動しなくなったり、OS(ソフトウェア)の問題で、OSが正常に起動しなかったり、と様々な問題が最悪のタイミングで発生する場合があります。 特にハードウェアに関しては電源OFF/ON時に負荷が掛り、経年劣化したハードウェアがその負荷に耐え切れずにそのままお亡くなりになってしまう事があります。 私も何度か経験しました。ハードウェア故障の場合は我々システムエンジニアではどうしようもないのでメーカーに修理依頼をする事になります。当然作業は中断してしまいます。 一方でOS(ソフトウェア)の観点でもやはり、再起動の影響でOSが正常に起動しない場合があります。 ざっと思い出すだけでも以下のような経験があります。 ・WindowsUpdate実行後、再起動しないまま放置していて再起動したことによりOSの構成変更が発生してそれが原因で起動しない。 ・Windowsのシステムファイルやドライバファイルが破損して、読み込みができない。  これらのファイルは基本的に、OS起動時にメモリに読み込まれます。読み込まれた後にファイル自体が破損した場合, 再起動しない限りは正常に稼働し続ける場合があります。(破損したタイミングでOSに問題が発生する場合もあります。)  しかしながら、再起動した場合は破損したファイルを読み込もうとして失敗してしまい、OSの起動ができなくなる場合があります。 ・稼働中にバックアップ用に増設した外付けUSBHDDが原因でOSが起動できなくなってしまった。  サーバのメーカー、BIOS設定によっては増設した外付けUSBHDDが起動順の最上位になってしまう場合があります。  この場合、USBHDDにはブート可能な領域がないため、OSの起動に失敗してします。 システムエンジニアのせいではない場合が殆どなのですが、お客様には我々の作業が原因で壊れた!と受け止められてしまう事があり、何か納得できないイヤ~な気分になります。 サーバシャットダウン/再起動時に発生する問題は、ハードウェア、ソフトウェアに関わらず、未然に防ぐことは中々困難で厄介な問題です。 ハードウェアに関しては故障箇所を交換するしか解決方法はないのですが、OS(ソフトウェア)に関しましては復旧できる場合があります。 この業界で長く仕事をしているとトラブル時の復旧のノウハウもスキルも必然的に上がっていきます。 復旧の方法に関しましては、ご説明するには行数が足りないため、またの機会にさせて頂きたいと思います。