ミネムラ珈琲ブログ

AI画像Tシャツ屋/ITラノベ著者/さすらいのコーヒー屋/WEBサービス開発チームマネージャーの日記

ノンエンジニアのためのMackerel活用術

この記事は Mackerel Advent Calendar 2023 の12月6日の記事です。

qiita.com

昨日はid:mds_boyさんでした。

mds-boy.hatenablog.com

ぼくについて

株式会社はてなでプロダクト開発チームのマネージャー。得意な技術はGoogleスプレッドシート。金勘定とトラブル対応が好物です。ノンエンジニアです。

今日の話

サーバー監視サービスであるMackerelは、エンジニアのツールという印象があるかもしれません。実際ぼくもチームのアカウントでは閲覧権限しか持っておらず、もっぱらダッシュボードから各種のメトリクスをみるだけなのですが、それが閲覧できないとぼくの業務は成り立ちません。というわけで今日はノンエンジニアなりに利用しているシーンを書きます。

PWGでエンジニアと一緒にグラフを眺める

はてなのプロダクトチームでは、月に1回PWG(Performance Working Group)という会を実施して、インフラの状況を確認しています。この際、エンジニアと一緒にMackerelのダッシュボードを眺めています。

(モザイク無しで貼れるようなデータはなかった)

はじめた頃はどのサーバーがサービスにおけるなんの機能を果たしているのか、各種のメトリクスがどうなったらなんなのかなどがさっぱりだったので多少苦労しましたが*1、そうだとしてもプロダクトマネジメントをやっている人間がPWGの場にいることには意義があります。

数字の変化について考察する上で、変化のあったタイミングにサービス内のイベントや目立った動きの有無について共有し、その数字の変化が予期したものなのかそうでないのか、一時的なものなのか恒久的なものなのかを考えるための材料を素早く提供することができます。例えば「直近の1ヶ月にリクエスト数が急増しておりこのままのペースで増え続けるならなんらかの手当が必要だがどうするか」みたいな話題に対して、「いまはCMが放映されているので新規ユーザーがどんどん増えているが、今週でいったん終了するのでこのペースで増え続けるわけではない」とコメントできると、会議がスムーズに進みます。

もちろん過去のことだけでなく、未来についての見通しも同様です。利用状況のトレンドや今後予定されている開発やイベントについて共有することで、スケールアップ等の要否を判断することができます。「来月xxをリリースするんだけど」「あー、じゃあ安全に振って〇〇を一時的に増強しておきましょうか」みたいなことですね。

コスト確認時の補助ツールとして

はてなは意外にも(?)ちゃんとした会社なので、経営向けにインフラコストの見通し予算の提出や月次の報告をする必要があり、ぼくがそれをまとめています。もっともお金を数えるのは好きなので、求められなくてもやっているとは思うのですが…。

じゃあそのコストのダッシュボードをMackerelでみているかというと別にそういうことはないです。AWSのサービスごとのコストがBigQueryに蓄積されている会社全体の基盤(便利!)からデータをスプレッドシートに引っ張ってみています。スプレッドシートに引っ張ると、そのまま今後のサービス成長目標と過去のPVとコスト実績からの回帰予測も出せるので便利。

こういうシーンであまり微に入り細に入り細かく見すぎる必要はないのですが、とはいえ気になったコスト変化について、大本のデータまで遡って見るために、Mackerelは必要です。

チームのMackerelダッシュボードには、オートスケールさせているコンテナの台数変化を出しているものもあるので、そこから実態の台数変化状況を見たりすることができます。

そして障害対応

みんな大好き障害対応です。いや、ないにこしたことはないんですが、アドレナリンがでます。

そもそもほとんどのケースでMackerelのアラートに気づくことから対応が始まるんで言わずもがなという感じで、とりあえずアラートに気づいたら「お」とか「ん」とか「なんだなんだ」とか一言発しておくのは重要な仕草だと思います。

障害対応での振る舞いについて真面目に書き始めると1記事になりそうなので、それは気の向いたときにまた。

*1:いまもサーバーの役割やメトリクスの意味を完璧に掴んでいるわけではない