仕事内容、必要とされるスキル
日経電子版を中心に、デジタル事業のシステム/サービスの信頼性、性能をソフトウェアエンジニアリングで担保します。SLI/SLOの設定・運用、トイルの撲滅やアーキテクチャ、システム運用の改善など、サービスの安定稼働に必要なあらゆることに取り組みます。
基盤の構築
電子版の裏側では多様なアーキテクチャによるバックエンドサービスが稼働しており、これらの環境をそれぞれのチームが構築し、運用しています。アクセスログの取り方がアプリケーションによって異なっていたり、専門のインフラエンジニアがいないチームもあったりします。これらの問題を解決するため、統合されたアプリケーション基盤の開発と構築を進めています。
統一されたアプリケーション基盤上で稼働させることで、ログやメトリクスを同じ方法で取得してSLI/SLOのメトリクスとして利用すること、インフラ運用の大部分を基盤側で担保することが可能になります。個々のチームでインフラを意識せずにアプリケーション開発に注力できることをゴールとし、各アプリケーションの依存関係の明瞭化、耐障害性の一律向上を目指しています。
可視化、数値化
信頼性やパフォーマンスの状態を表すデータを集め、SLI/SLOとしてモニタリングしつつ、障害の情報と履歴もデータベース化し、信頼性の向上に着実に取り組めるようにしていきます。エラーレート、アクセスログといったデータを基に改善すべき箇所を特定し、効果を計測しながらサービスの安定稼働を目指し、ユーザーに快適に使って頂ける状態を実現していきます。