どんな仕事か: 【募集背景・ミッション】
ELYZAは、大規模言語モデル（LLM）の研究開発と社会実装において、国内トップクラスの実績を積み重ねてきました。私たちの次なる挑戦は、LLM/VLMが持つ高度な「意味理解」を物理世界へ接続し、現実空間の課題解決に挑むEmbodied AIの領域です。

物理空間のデータをAIで解析し、ロボットやデバイスの制御・自律化を行うPhysical AIの領域では、新たな技術革新の先駆けとして、特定の作業に縛られず多様な物理タスクをこなせるVLA（Vision-Language-Action）モデルが注目を集め始めています。

技術フェーズとしては、まさにLLMにおける2019?2020年頃に位置づけられ、今後1?3年で実用レベルへの進化が見込まれる重要なタイミングです。

しかし、これらのモデルをそのまま日本の製造業や物流といった現場に持ち込んでも、精度や特定ユースケースへの適応力には限界があり、真の社会実装には至りません。
本ポジションのミッションは、ELYZAがこれまで培ってきた知見を活かし、現場での実用に耐えうる「特定ユースケース特化型のEmbodied AIモデル」を開発することです。さらに、そのモデルを実際の顧客現場へ適合させ、価値証明（PoC）を完了するまでを一気通貫で牽引していただきます。

最大の魅力は、国内最大規模の計算基盤を活用した「基盤モデルの構築」と、現場のリアルなデータを高度な知能へと昇華させる「社会実装」の両輪を回せる点にあります。

【業務内容】
ご本人の志向性やプロジェクトの稼働状況に応じて、Embodied AIモデルの研究開発から、現場でのPoC推進まで、R&Dと社会実装の垣根を越えて幅広く活躍していただきます。

(1)Embodied AIモデルの開発：
既存のオープンモデルに対し、特定ユースケースに特化した学習を行い、精度と堅牢性を高める。模倣学習、強化学習（RL）、推論最適化などの技術を適用・拡張する。
(2)PoC案件の技術リードと社会実装：
顧客の現場課題に対し、どのようなロボット構成・AIモデルで解決可能かの技術検証を行う
現場特有のドメインデータを用いたファインチューニングやエッジデバイスへの実装を主導する
(3)ドメイン特化型マルチモーダル学習とデータル
求められるスキルは: 必須【必須スキル】
・機械学習 / 深層学習（Deep Learning）の実務経験：
PyTorch等のフレームワークを用いた深層学習モデルの開発、および学習パイプラインの構築実務経験。
・ソフトウェアエンジニアリングスキル：
PythonまたはC++を用いた実務でのソフトウェア開発経験。
・ロボティクスへの強い関心（実務経験不問）：
ロボティクスの実務経験・ROSの使用経験は不問です。ただし、AIモデルを物理世界に適用することへの強い関心と、座標変換などの基礎的な概念をキャッチアップする意欲があること。
・社会実装への強い意欲：
論文上のスコア改善ではなく、「現実のロボットが動くか、顧客の課題が解けるか」という実用性を最重視するマインドセット。

【歓迎スキル】
World Modelsや動画生成モデルに関する研究開発、またはそれらを活用した環境ダイナミクスの予測・プラニング（行動計画）に関する知見や経験。
Top-tierカンファレンス（NeurIPS, ICLR, CVPR, ICML, CoRL, ICRA, IROS等）での主著論文の採択実績。
ROS / ROS2等のミドルウェアの使用経験、またはPythonを用いたロボット制御・API連携経験。
ロボット操作の大規模データセット（Open X-Embodiment等）や、オープンVLAモデル (π0, OpenVLA) 、フレームワーク (openpi, lerobot)を扱った経験。
物理シミュレータ（NVIDIA Omniverse / Isaac Sim, MuJoCo, Habitat等）を用いた強化学習・模倣学習環境の構築経験。
特定のドメイン（製造、医療、金融など）に特化したLLM/VLMといったAIモデルを開発し、社会実装に取り組んだ経験。
雇用形態は: 正社員
どこで働くか: 関東/Kanto->東京都/Tokyo
給与はどのくらい貰えるか: 600万円~1500万円

【研究開発/Physical AI】シニアリサーチエンジニア（Embodied AIモデル開発）/松

機械学習エンジニア