- どんな仕事か
-
【ミッション】
Webから取得した世界中のビジネスデータから顧客に最適な情報を配信するための、データ収集およびコンテンツ抽出の技術検証及び製品開発を担っていただきます。
【主な業務内容】
■自然言語処理や画像処理を用いた、HTML/PDF/パワーポイント等の多種ドキュメントに対するコンテンツ抽出エンジンのアルゴリズム検証と製品パイプライン開発
■言語モデルを用いた、顧客配信用ニューステキストに対するクレンジング処理の精度向上
■顧客配信用コンテンツに対する同一記事判定やカテゴリー判定の精度向上によるPrecision/Recallの向上
■FaaS/CaaSを用いた機械学習モジュールの分散処理パフォーマンスチューニングと監視設計
■数万件規模のWebサイトを対象としたWebクローラーの異常検知及び自動復旧機構の検証と実装
■日本語LLMの学習データとなるクレンジング済みコーパスの作成
【開発環境】
開発言語:Python
コンテナ:Docker
IaC:Terraform
クラウド:AWS, GCP
【働き方】
■基本的にはフルリモート体制。
■リモート/出社をそれぞれの事情に合わせて使い分けながら勤務しています。(出社回数は定めていません。)
■仙台・京都・大阪などからフルリモートで働いている人、ワーケーションを楽しみながら働いている人、母国に数週間帰国して働いている外国籍社員など多様な働き方を実現しています。
【組織体制】
Opendata Team(8名)
内訳:Manager1名、サーバーサイドエンジニア2名、データエンジニア1名、機械学習エンジニア2名、MLOps1名、Data Reliability Engineer1名 - 求められるスキルは
-
必須 【必須スキル・経験】
※すべて必須※
■理工系大学院を修了
■機械学習を扱うエンジニアまたはリサーチャー経験3年以上
■Pythonを用いたアプリケーション開発経験験
【歓迎スキル・経験】
■コンピュータサイエンスに関連する技術分野の修士号または博士号
■顧客向け自社サービスにおける機械学習を用いた開発/運用経験
■自然言語処理やテキスト解析を扱う業務経験または研究実績
■クラウドサービスを用いた機械学習パイプラインの実装経験
■リーダーなどの立場で事業背景を理解し自ら短期施策を立案/実行した経験
【求める人物像】
■コンピュータサイエンス、分散処理が好き
■最新の理論や事例をフォロー、検証するのが好き
■与えられた課題だけでなく、自ら問いを立て、そのために必要な解決策を生み出せる
■ビジネスサイドとコミュニケーションしながら、いかにプロダクトに貢献できるかを考えられる
■前向きなチャレンジ精神 - 雇用形態は
- 正社員
- どこで働くか
- 東京都
- 給与はどのくらい貰えるか
- 700~1250万円
NEW
掲載期間24/11/29~24/12/12
求人No.MYN-10305760