なぜ募集しているのか: 事業拡大に伴う増員となります。
どんな仕事か: 【職務内容】AI検索機能（キーワード検索、ベクトル検索、AIレコメンド等）を提供するプラットフォームの信頼性向上、パフォーマンス改善、開発効率化をリードしていただきます。
１．信頼性向上・スケーラビリティ確保（Reliability & Infrastructure）：40%　グローバル展開（10→100のスケール）に耐えうるインフラ基盤の設計・構築・運用をリードします。
コンテナ基盤の高度化: GKE (Kubernetes) / Cloud Run を活用した、高負荷に耐えうるオートスケーリング基盤の構築と運用。　SLI/SLOの導入・運用: サービスの信頼性を定義し、エラーバジェットに基づいた運用ルールの策定と、開発チームへの信頼性文化（Reliability Culture）の浸透。　グローバルインフラ設計: 各国のレイテンシ要件を満たすマルチリージョン構成やCDN戦略、ネットワーク設計の最適化。
２．パフォーマンス・エンジニアリング・可観測性（Performance & Observability）：40%　「AIの賢さ」と「検索エンジンの速さ」を両立させるためのチューニングと監視環境を整備します。
検索基盤の高速化: Elasticsearchやベクトル検索エンジンのインデックス設計、クエリパフォーマンスのボトルネック特定と解消。　分散トレーシングの確立: マイクロサービスとAIモデルを横断するリクエストフローを可視化し、障害発生時の原因特定時間を短縮する。　コスト最適化 (FinOps): クラウドコストやAIリソース（GPU等）の使用状況を監視し、性能を維持しつつのコスト削減を提案・実行する。
３．DevEx向上・チームマネジメント（Developer Experience & Management）：20%　開発チーム全体の生産性を最大化するための環境整備と、技術的なリードを行います
Toil（労苦）の削減：手作業によるオペレーションを自動化し、エンジニアが創造的な作業に集中できる時間を創出する。　CI/CDパイプラインの進化：テスト自動化、カナリアリリース等のデプロイ戦略を実装し、安全かつ高速なリリースサイクルを実現する。　技術共有・育成： SREプラクティスの勉強会実施やコードレビューを通じ、開発メンバーのインフラ・運用スキルの底上
求められるスキルは: 必須・パブリッククラウド(GCPまたはAWS)におけるインフラ設計・構築・運用経験(目安:3年以上)
・コンテナ技術(DockerKubernetes)を用いた本番環境の運用経験
・ Terraform等のIaCツールを用いたインフラ構成管理の経験
・ Webアプリケーションの開発・運用プロセス(CI/CD、バージョン管理)への深い理解
・スクリプト言語(PythonGoBash等)を用いた運用自動化の経験

【歓迎】
・ Elasticsearch/Solr等の検索エンジンの運用・チューニング経験(特に歓迎)
・ SLI/SLOの策定・運用や、トイル削減などのSREプラクティスの実践経験
・大規模トラフィック(高負荷)環境下でのパフォーマンスチューニング経験
・マイクロサービスアーキテクチャにおける可観測性(DistributedTracing等)の設計・導入経験
・機械学習パイプライン(MLOps)に関連するインフラ構築経験
雇用形態は: 正社員
どこで働くか: 東京都
給与はどのくらい貰えるか: 700～1000万円
待遇・福利厚生は: 通勤手当　確定拠出年金制度　社内研修制度　社内英会話レッスン(本社ビルのみ)　保養所（ラフォーレ倶楽部) 　テーマパークチケット優待
休日休暇は: 慶弔休暇　年末年始　夏期休暇　有給休暇　完全週休2日制（土日）　祝日　特別休暇

SRE（AI検索プラットフォームの高速化・自動化を推進するリーダー候補）

サーバ・ネットワークエンジニア