- なぜ募集しているのか
- 弊社からの入社実績20名以上あり 部門強化のため増員
退職金制度あり 平均残業20~30時間程度
平均年齢34.3歳 平均年収7,740千円 - どんな仕事か
-
部門概要
機械学習・深層学習工学部 (MDE) は、自然言語処理 (NLP)、検索、レコメンデーション システムを専門とするエンジニアと科学者のグループです。トランスモデル、高密度検索、分散GPU学習、大規模機械学習などの最先端技術を様々な楽天商品・サービスに適用し、最先端の研究を行っています。私たちは、機械学習の研究とエンジニアリングの情熱的な専門家を探しており、次世代のeコマース体験を定義する旅に参加してくれる人を探しています。
GPUエンジニアリングチームは、楽天内のさまざまなMLエンジニアや研究者のチーム間でのMLモデルの開発とデプロイを強化する堅牢なGPUインフラストラクチャと最先端のMLプラットフォームを提供する最前線にいます。 ユースケースには、セマンティック検索、ビジュアル検索、レコメンデーション、LLMなどがあります。
採用する理由
GPUエンジニアリングチームのMLOpsエンジニアとして 、楽天のML運用の中心にいて、MLモデルのデプロイ、監視、管理に注力していただきます。部門全体の ML エンジニアと緊密に連携して、迅速なモデル開発、トレーニング、デプロイをサポートする信頼性の高いインフラストラクチャを提供します。あなたの専門知識は、MLプロジェクトの効率性とスケーラビリティに貢献し、楽天の製品イノベーションとサービスの卓越性に直接影響を与えます。
業務内容
主な責任:
- 機械学習モデルの自動トレーニング、テスト、デプロイのための ML パイプラインを設計、実装、保守し、スケーラビリティと効率性を確保します。
- ML エンジニアと協力して、モデルのパフォーマンスのトラブルシューティングと最適化を行い、モデルが本番環境に対応し、定義された SLA を満たしていることを確認します。
- Kubernetes クラスターと関連インフラストラクチャを管理および監視して、大量の ML ワークロードをサポートし、セキュリティとレジリエンスに関するベスト プラクティスを実装します。
- ML インフラストラクチャ、ツール、ベスト プラクティスに関するドキュメントを作成および保守し、ML チームにガイダンスとサポートを提供します。
- 新しいテクノロジーとツールを継続的に評価して組み込み、ML プラットフォームの機能とパフォーマンスを強化します。 - 求められるスキルは
-
必須 必須の資格:
- 経験:MLOpsの経験が3年以上あり、MLインフラストラクチャの管理に実績のある方
- Kubernetesの習熟度:Kubernetes(K8s)インフラストラクチャとそのMLワークロードの管理への応用に関する深い理解
- プログラミングスキル:PythonまたはGolangの習熟度
- Linux OSの実績があり、システムパフォーマンスを維持し、適切な構成を確保し、ソフトウェア、ハードウェア、およびネットワーク関連の問題をトラブルシューティングするためのツールを活用する能力を備えています
- 学歴:コンピュータサイエンス、エンジニアリング、または関連する技術分野の学士号以上
- 優れたコミュニケーション能力とチームワーク能力
- テクノロジーへの情熱と困難な問題の解決
望ましい資格:
- MLフレームワーク(TensorFlow、PyTorchなど)とCUDAに精通していること
- CI/CDツール:CI/CDツール(GitHub Actions、Jenkins、GitLab CIなど)およびコンテナ技術(Dockerなど)の経験
- LLMを含む大規模モデルのトレーニング経験
言語:
English (総合 - 4 - 流暢) - 雇用形態は
- 正社員
- どこで働くか
- 東京都
- 給与はどのくらい貰えるか
- 900万円 ~ 1149万円
掲載期間24/11/18~24/12/01
求人No.GRAND-240920KNDR2