done is better than perfect

自分が学んだことや、作成したプログラムの記事を書きます。すべての記載は他に定める場合を除き個人的なものです。

「入門 監視」を読んだ

入門 監視

すげータイトルだと思って思わず買ってしまった。

最近のイケてるツールの使い方とかを羅列した感じなのかな、という軽い気持ちで読み始めていたが、全然違った。全12章とおまけがあるわけだが、そのうち前半部分の1章から4章までは、監視の具体的な方法というより、業務としてシステムの監視を行う際のいわば「心構え」といった感じだった。

  • なぜ監視をするべきなのか
  • そのアラートは本当に上げる必要があるのか
  • というか外注できないのか

などなど。これはただの想像だが、監視というのはそれ自体がお金を産むわけではないので、この本の著者は常にこういったことを周りに説明する必要があったのだろうなと思う。 アラートが上がった際に止む無くオンコール対応しなければならない場合に備えてローテーションを組む方法まで書いてあって、にじみ出るような苦労を感じた。(あとこの著者は多分Nagiosが嫌い)

監視する対象はシステムのみにとどまらず、ビジネスのKPIに関するものもあった。言ってしまえば、あるサーバのあるプロセスのうちどれかが死んだからどうだ、というのは割とどうでもよくて、それがどれだけビジネスインパクト(より直接的に言うなら、お金)があるか、というのが重要なのだろう。極論すれば、別に全く儲からず重要でもないビジネスを支えるシステムなぞ監視する必要もないわけである。

「システムだから監視するよね」じゃなく、「どれだけ価値があるシステムで、それが止まった場合どれだけビジネスに影響があって、どれだけ損失があるかを予め把握した上で、それに対する保険のために監視しましょう」というのが筋なのだろう。(個人的には、こういった考え方は苦手で、ついついイケてるツールとかオレオレ最強監視スクリプトとか、そういったことを考えがちであって、反省させられた)

ぶっちゃけツールの使い方を知りたいなら別の本を読んだほうが良いと思いますが、「そもそも監視って何から始めたらいいの?」って人にはおすすめです。