- なぜ募集しているのか
- 事業拡大に伴う増員となります。
- どんな仕事か
-
【職務内容】AI検索機能(キーワード検索、ベクトル検索、AIレコメンド等)を提供するプラットフォームの信頼性向上、パフォーマンス改善、開発効率化をリードしていただきます。
1.信頼性向上・スケーラビリティ確保(Reliability & Infrastructure):40% グローバル展開(10→100のスケール)に耐えうるインフラ基盤の設計・構築・運用をリードします。
コンテナ基盤の高度化: GKE (Kubernetes) / Cloud Run を活用した、高負荷に耐えうるオートスケーリング基盤の構築と運用。 SLI/SLOの導入・運用: サービスの信頼性を定義し、エラーバジェットに基づいた運用ルールの策定と、開発チームへの信頼性文化(Reliability Culture)の浸透。 グローバルインフラ設計: 各国のレイテンシ要件を満たすマルチリージョン構成やCDN戦略、ネットワーク設計の最適化。
2.パフォーマンス・エンジニアリング・可観測性(Performance & Observability):40% 「AIの賢さ」と「検索エンジンの速さ」を両立させるためのチューニングと監視環境を整備します。
検索基盤の高速化: Elasticsearchやベクトル検索エンジンのインデックス設計、クエリパフォーマンスのボトルネック特定と解消。 分散トレーシングの確立: マイクロサービスとAIモデルを横断するリクエストフローを可視化し、障害発生時の原因特定時間を短縮する。 コスト最適化 (FinOps): クラウドコストやAIリソース(GPU等)の使用状況を監視し、性能を維持しつつのコスト削減を提案・実行する。
3.DevEx向上・チームマネジメント(Developer Experience & Management):20% 開発チーム全体の生産性を最大化するための環境整備と、技術的なリードを行います
Toil(労苦)の削減: 手作業によるオペレーションを自動化し、エンジニアが創造的な作業に集中できる時間を創出する。 CI/CDパイプラインの進化: テスト自動化、カナリアリリース等のデプロイ戦略を実装し、安全かつ高速なリリースサイクルを実現する。 技術共有・育成: SREプラクティスの勉強会実施やコードレビューを通じ、開発メンバーのインフラ・運用スキルの底上 - 求められるスキルは
-
必須 ・ パブリッククラウド(GCPまたはAWS)におけるインフラ設計・構築・運用経験(目安:3年以上)
・ コンテナ技術(DockerKubernetes)を用いた本番環境の運用経験
・ Terraform等のIaCツールを用いたインフラ構成管理の経験
・ Webアプリケーションの開発・運用プロセス(CI/CD、バージョン管理)への深い理解
・ スクリプト言語(PythonGoBash等)を用いた運用自動化の経験
【歓迎】
・ Elasticsearch/Solr等の検索エンジンの運用・チューニング経験(特に歓迎)
・ SLI/SLOの策定・運用や、トイル削減などのSREプラクティスの実践経験
・ 大規模トラフィック(高負荷)環境下でのパフォーマンスチューニング経験
・ マイクロサービスアーキテクチャにおける可観測性(DistributedTracing等)の設計・導入経験
・ 機械学習パイプライン(MLOps)に関連するインフラ構築経験
- 雇用形態は
- 正社員
- どこで働くか
- 東京都
- 給与はどのくらい貰えるか
- 700~1000万円
- 待遇・福利厚生は
- 通勤手当 確定拠出年金制度 社内研修制度 社内英会話レッスン(本社ビルのみ) 保養所(ラフォーレ倶楽部) テーマパークチケット優待
- 休日休暇は
- 慶弔休暇 年末年始 夏期休暇 有給休暇 完全週休2日制(土日) 祝日 特別休暇
NEW
掲載期間26/06/17~26/06/30
求人No.GKL-41578120260612





