はじめに
こんにちは!ウィルゲートでSREをやっている 4年目エンジニアのことみん(@kotomin_m)です!
2024年10月16日に開催された『Datadog Summit Tokyo 2024』に参加してきました。
今回は、会社の「5%ルール」を活用して参加しました。この制度の概要や、イベントに参加した感想をお伝えしていきます。
5%ルールとは
業務時間の5%を自己研鑽に充てられる制度です。最大3ヶ月分の5%(3日分)をまとめて取得でき、社外の勉強会に参加したり、技術を習得することができます。利用後に開発メンバー全体に、感想やブログなど実施した内容の簡単な共有を行うことがルールです。
この記事も利用後のアウトプットとして書いています!💪
また今回は、当日のハンズオンで学んだことなどを社内向けのドキュメントでも別途まとめる予定です。
Datadog Summit Tokyo とは
日本で開催される最大のDatadogコミュニティの祭典に参加しよう
Datadog Summit Tokyoはオブザーバビリティの専門家やDatadogチームから直接学ぶことができる無料の1Day イベントです。またオブザーバビリティカルチャーを築くことで組織を変革したエンジニアや開発者の話を聞くチャンスでもあります。イベントではDatadogがもたらすデータとインサイトを活用して、システムのパフォーマンス、セキュリティ、および信頼性を向上させるための実践的なアドバイスをコミュニティのメンバーから得ることもできます。この機会をぜひご活用ください。
公式サイトより引用。
会場にはセッション・ハンズオンのホール、Datadogの新機能の紹介ブースや、AWS GameDayなどの企画スペースがありました!
朝食やランチお弁当、懇親会などもあり参加者同士で交流できる時間があって有意義な1日でした!
参加したきっかけ・理由
Datadogからの紹介メールでこのイベントを知り、公式サイトでハンズオンがあることを知ってぜひ参加したいと思いました。 SREのハンズオンもあり、他の会社のSREの方が多く来そうだし交流してみたいと思ったのも参加の理由です。
また、ウィルゲートでもDatadogを利用しているため、業務に役立つ知識を得たいと思い参加しました。
参加したセッション・企画
ここからは参加したセッションと企画について簡単に感想を紹介します!
基調講演
基調講演は6名が連続でトークする形でした。どれも引き込まれる内容で午前中からとてもワクワクして聞き入ってしまいました……!! 6つのうち、2つは新卒2年目の方が登壇されていたのも良かったです。
特に良かったのは株式会社ワンキャリアさんの「開発チームと歩むSLO監視文化の立ち上げジャーニー」という講演です。
この講演では、ワンキャリアが過去にSLI/SLOを定義し運用した経験と、それに伴う課題と解決策について語ります。初期のSLO監視運用の課題として、監視の定着化の難しさや開発チームの工数増加などがありました。これらの課題を解決するためにSLI/SLOの定義を見直し、Datadogを用いたSLOの可視化と監視の自動化を行いました。 また、この経験から得た学びとして、開発チームとの連携の重要性やSLO運用の難しさについて触れます。 最後に、今後の展望でユーザーにとって重要な画面の監視強化の取り組みについて話します。
開発チームと歩むSLO監視文化の立ち上げジャーニー | Datadog より引用。
過去に行ってきた施策がどのように失敗をしたかの理由を的確に考察し、その後「SREの民主化」というキーワードの元に実施して再構築するまでのストーリーがとても分かりやすく語られていました。
そして最後に「SLO運用は「攻めの投資」になりうる」という言葉で締めていました。ユーザー体験を大事にしたSLO運用を経営の意思決定と連動させることを目指せるので「攻め」が出来るというのがとてもカッコイイなと思いました。
どちらかといえば守りの施策に感じやすいSREの仕事を、攻めの仕事だという考え方が私にとってはとても刺激を受ける内容で感動しました!
AWS GameDay
AWS GameDayは、AWS LamdaとDatadogを連携したアプリケーションが用意されており、設定が抜けていたり間違っている箇所が問題として出され、それを修正する形式でした!解けた時間が早いほど点数が高くなるので、点数を競うという要素もあってゲームで実際の使い方を学ぶことが出来て楽しかったです!
ブースには挑戦者それぞれにDatadogの社員さんがついており、所々解説やヒントをもらいながら行うことができたので、普段AWS Lamdaを使ったことがない私でも挑戦しやすかったのが嬉しかったです!
ワークショップ
ワークショップは全部で3つ同時開催されており、その中から「Datadog 101:SRE(サイト・リライアビリティ・エンジニアリング)」というワークショップに参加しました!
Datadogを通じてSREに必要な考え方や手法を学ぶワークショップです。
DatadogのコアツールはSRE向けにカスタマイズされており、インフラ全体を俯瞰するだけでなく、個々のプロセスにズーム・インすることもできます。
このワークショップでは、アプリケーション パフォーマンス モニタリング(APM)のトレース収集とプロファイリングを可能にするために、eコマース ウェブ アプリケーションの複数のサービスを計測する方法を学びます。 次に、パフォーマンスの問題を診断するために、アプリケーションからのログとネットワーク パフォーマンス モニタリング(NPM)データをフィルタリングして解析します。 最後に、メトリクスの変更を通知するモニターと、重要な遠隔測定を視覚化するのに役立つダッシュボードを作成します。
このワークショップの終了時には、Datadog を使用して、アプリケーションとインフラストラクチャの過去を分析し、現在を観測し、将来を最適化できるようになります。
Datadog 101:SRE(サイト・リライアビリティ・エンジニアリング) | Datadog より引用。
Datadog ラーニングセンターというお試しでDatadogが使える環境が用意されており、これを使って機能を試すことができました。説明→もくもく作業→説明→もくもく作業という進行で分かりやすかったです!
ラーニングセンターには手順が的確に記載されており、スムーズにハンズオンを進められました。ちなみに、今回のために英語版を日本語翻訳したそうです!嬉しいですね!
監視のモニターや通知など初めて触った機能もあり、様々なところで連携出来ることを知って実際に使ってみたいと思いました。
おわりに
自分が普段使っているサービスが他の会社でどのように利用されているかを知り、ハンズオンで実際に機能を触って体験できたりと、1日でたくさんのインプットがありました。
時間の関係で参加できなかったパネルセッションや新機能の展示などもあり、もっと参加したかった〜という気持ちもあるので、次回の開催があればぜひまた参加したいです!