- なぜ募集しているのか
- 数多くのサービスをパブリッククラウド(主にAWS)を活用しサービスを提供し続けているなか、今後は自動化の推進などによりDevOpsの効果、サービスの安定稼働、効率的な開発、Toilの削減などを強めていく為の増員となります。
- どんな仕事か
-
チームごとに利用している技術構成や業務内容に違いがあるため、以降で3つのチームを例に挙げて紹介します。
1.キャリア事業のSREチーム
一例として以下の業務をSREメンバーが行っています。
◎EC2 InstanceからECS Fargateへの移行
・デプロイフローの整備
・ecspressoとsqldefを利用してコンテナデプロイ・DBスキーマの修正を自動化
・Spot Instanceを活用し費用削減
◎DBの安定化対応
・DBのメジャーバージョンアップグレード
・DB構成の見直し
◎IaC
・Terraformを利用してコード化
・アプリ開発メンバーもTerraformを活用してコードを書けるようペアワーク活動
・モニタリング環境整備とモニタリング活動
◎アプリ開発メンバーと一緒に定期的にパフォーマンスや稼働状況を確認
・Rubyアップグレード & YJIT有効化時にパフォーマンス観点でアプリメンバーと対応
・メモリの消費量拡大のための対応等
2.全社横断のSREチーム
全社SREチームではクラウドマネジメント(AWS、GCP)、セキュリティ、ガバナンスなど組織横断での取り組みや、インフラ業務を担当できるメンバーがいないところへのサポートを行っています。
時には社内ITとの協力して商用環境のみならず全社のIT基盤への取り組みまで行うことがあります。
◎AWS,GCPなど商用環境を安全かつスムーズに利用できるための取り組み
・ガイドライン、ポリシーの構築
・脆弱性、EOL、コンプライアンスへの取り組み
・コスト管理
◎運用管理と障害対応
・メンテナンス対応
・AWS/GCP、OS、ミドルウェアの運用
・クラウドサービスの設計、運用、管理
3.カイポケ事業のSREチーム
カイポケ事業のSREチームには現行システムの開発を行うチームとリニューアルプロジェクトを行うチームの二つが存在し、それぞれのチームに参加して開発を行います。
チームの所属先は得意領域やスキルセットに応じて相談して決めています。
■現行システムのSREについて
ユーザ数が多く、長く利用されてきた現行システムの安定化や運用改善に取り組んでいます。
一例として以下の業務をSREメンバーが行っています。
◎脆弱性対応
◎開発者向け内部ツールの運用・管理
◎ログ検索基盤の構築
◎APMツールの運用
◎デプロイ自動化 - 求められるスキルは
-
必須 ・AWSの基礎的な知識・利用経験
・TCP/IP、HTTPなどのネットワークプロトコルについての基礎知識
・システムの技術的問題(例:パフォーマンス低下)の原因を発見、解決するための能力
・システムのパフォーマンスや信頼性を向上させるのに必要なアプリケーション、ミドルウェアへの機能追加、バグを修正するためのプログラミング能力歓迎 歓迎条件
・大規模サービスの開発、運用経験
・GCP、Microsoft Azureなどのクラウドサービスの基礎的知識
・AWS、GCP、Microsoft Azureなどのクラウドサービスの深い知識、経験
・MySQL等のRDBMSの運用経験
求める人物像等
・課題設定ができること
・周囲を巻き込んで課題を解決に導けること - 雇用形態は
- 正社員
- どこで働くか
- 東京都
- 給与はどのくらい貰えるか
- 1000万円 ~ 1249万円
掲載期間24/12/05~24/12/18
求人No.GRAND-241203MR