2015年07月20日
このエントリーをはてなブックマークに追加
今まで監視というのは、ちょっとナナメに構えて考えていました。
一つは僕自身が望まれている仕事が、そうした動き続けることを確認するというよりも、依頼の内容・・それは主に新しいサーバーの構築・・・をどれだけ要望通りに素早く実現するのか。ということでした。

またトラブルについては、当初に比べればずっと責任が重くなったものの、それに対応する内容というのは、サーバーが落ちないように、軽微なトラブルが起きないように構築をするという方向に向いていました。
そしてそれは比較的簡単に実現することができ、たとえば純正品を確実に使うとか、事前の検証を十分に行うといった程度で実現が可能でした。・・・しかしコストは倍ぐらいになりますが・・。

今まで僕自身は価格の低下が非常に望まれていたため、純正品以外を利用することもよくありましたし、サーバー類についても、パーツの寄せ集めのような状態で構築することもありました。もちろん検証などを十分に行えば、動作については問題ありません。

しかし長期間運用すると、メーカー製とは異なったトラブルが生じ、それについての対応は個別となり、そういうことの積み重ねが、今まで求められている内容とはズレが生まれ始めました。

そういった部品や長期間のサポートについて、求められることへの変化への対応は少しずつ行ってきました。そしてそうした考え方にも慣れてきました。しかし今度は、運用について求められることが昔よりも増えてきました。
たとえばトラブルが起きる前の予防としての対応。トラブルが起きたときには、どんな軽微なことであっても調査し、原因を追及する姿勢。などでしょうか。
予防というのは、難しい部分もありますが、たとえば過負荷であったり、空きメモリが減少していたりなど。そういう部分については対応が可能な感じがします。

さらに、サービスの停止についてユーザーからの申告で気づくことも大切ですが、それと同時期ぐらいに、監視ツールでアラートを出すということも重要な感じがしています
会社のサーバーも似たような感じです。
自社に人がいるときは、調子が悪いとすぐにサーバー再起動という安直な方法をとっているようです。そして後ほど「調子が悪かったの再起動しました」と報告を受けることがあります。
具体的にどのように調子が悪かったのか話を聞いても、いまいち理解できません。もちろん対処療法としての再起動は良いのですが原因を追いかけられないのは困ったもんですね。

などといったいろいろな意味でも、監視を今まで以上にちゃんとやりたいと思います。


stock_value at 14:42│Comments(0)TrackBack(0)技術:2015年 

トラックバックURL

この記事にコメントする

名前:
URL:
  情報を記憶: 評価: 顔