- どんな仕事か
-
【業務内容】
■事業横断データ基盤の設計・運用
・複数の医療プロダクトにまたがる統合データ基盤の設計・構築
・事業横断で活用できるデータ基盤の構築
・各プロダクトのデータを集約し、信頼性の高いDWHを構築・運用
■データパイプラインの構築・最適化
・各プロダクトおよび基幹システムからデータを収集・変換・蓄積するパイプラインの設計・開発・運用
・クラウドDWH環境上で、大規模データ処理がスケーラブルかつ高パフォーマンスに実行できるよう最適化を実行
・dbtなどを活用したデータ変換フローの整備や、データパイプラインのスケジューリング・監視
■分析基盤・セマンティックレイヤーの整備
・ビジネス部門のデータ活用を支援する分析基盤の構築
・具体的には、用途別のデータマートの設計・実装やパフォーマンスチューニング、メタデータ管理とセマンティックレイヤーの整備による共通KPI定義の管理などを行い、社内のデータ分析環境を高度化します
■データガバナンス・セキュリティ強化
・医療データなど機微な個人情報を含むデータを安全に取り扱うため、データガバナンス体制を強化します
・具体的には、データの匿名加工やマスキング、アクセス権限設計などセキュリティポリシーに沿ったデータ管理を徹底します
・全社的なデータカタログやメタデータ管理ツールを導入・運用し、データの来歴や定義を一元管理することで、安心してデータを利活用できる基盤を構築します
・データ利用ログの収集基盤を整備し、利用状況のトラッキングやコンプライアンス対応に寄与します
■データ基盤の戦略企画・最新技術対応
・データエンジニアリング領域のテックリードとして、将来を見据えた基盤戦略の立案・実行
・ベクトルデータベースや機械学習モデル、合成データ生成等とも連携できる「AIReady」なデータ基盤を構想・構築
・社内のSREやデータサイエンティストとの協働。モデル学習や推論に必要な特徴量データの供給やフィードバック基盤の構築をリード
・データエンジニアリングチームの立ち上げ期メンバーとして、開発標準の策定や技術選定、後進育成にも関与していただきます。
▼主な技術スタック
・DWH:BigQuery
・ELT:trocco,Airflow,e - 求められるスキルは
-
必須 【必須】
以下、いずれか複数のご経験
・事業会社におけるデータ基盤またはデータウェアハウスの設計・開発・運用経験
・複数のデータソースを統合し、大規模データを扱ったELTパイプラインの構築
・SQLに関する実務経験とデータモデリングに関する知識
・データレイク、データウェアハウス、データマートの構築・管理運用の経験
・Python等のプログラミングによるデータ処理開発
・GCP、AWS、Azure等のクラウド環境でのデータ基盤構築・運用経験
・事業部門やプロダクトチームと協調し、ステークホルダーを巻き込んだプロジェクト推進のリーダー経験
・技術選定やアーキテクチャ設計において主体的に意思決定し、プロダクト価値向上のために継続的な改善を主導した経験
【歓迎】
・データエンジニアリングチームの立ち上げやテックリードの経験、メンバーのマネジメント経験
・全社規模でのメタデータ管理やデータガバナンスの仕組み構築・運用経験(特に個人情報を扱う基盤での実績)
・BIツール(Looker,Tableau,Metabase,Redash等)の導入選定や運用経験、およびセマンティックレイヤーやメトリクス定義の管理経験
・CI/CDパイプラインの構築・運用経験
・機械学習や統計分析に関する知見、もしくはAIプロジェクトへのデータ提供・協働経験
・医療分野への関心や、テクノロジーを通じて社会課題を解決することへの情熱 - 雇用形態は
- 正社員
- どこで働くか
- 東京都
- 給与はどのくらい貰えるか
- 1000~1500万円
NEW
掲載期間26/05/28~26/06/10
求人No.MYN-10647378





