「入門 監視 ――モダンなモニタリングのためのデザインパターン」を読んだ

読んだ。とてもいい本だった。まとめと感想を簡単に。

内容

  • 1-2章
  • 3章
    • チームとして健全にアラート、オンコール、インシデント管理を運用していくためにはどうしたらいいか
    • ここの内容は特に SRE 本の主張と被る
  • 4章
    • メトリクスの監視に必要な最低限の統計知識について
  • 5章
    • ビジネス KPI を監視と測る際の考え方
    • 「そんな事言われても何を測ればいいのか」→「プロダクトマネージャーなどと会話すれば、必要な KPI とその具体的な測り方が見えてくる」
  • 6-9章
    • フロントエンド, アプリケーション, サーバ, ネットワークそれぞれについてのメトリクスと監視について
    • 具体的に何を監視すればいいか(もしくはしなくもいいか)がわからなかったら、まずここを読むとよさげ
  • 10章
    • セキュリティ監視の考え方とその実現方法
    • 単純に考えるとすべてのログを取ればいい(が、それはそれで簡単ではない)
    • auditd, rkhunter などのセキュリティ監視に使えるツール紹介
  • 11章
    • これまでの内容を元に、簡単な例題アプリケーションに対して何を監視するべきかをおさらいする

感想

SRE 本から監視に関する部分を抽出して更に深掘りしたような感じだった。

監視についてどう考えればいいかがきちんとまとまっているし、具体例を出しているのでイメージも付きやすい(11章の存在が振り返りとしてとてもありがたい)。最近感じていた「サーバメトリクスってそこまで一様にアラートする必要あるっけ?」みたいな疑問にもきちんと答えてくれた。

今後誰かに監視について学びたい言われたら、間違いなくこの本を推すことになると思う。叶うなら3年前の自分に買い与えてあげたい。