RĂ´le
🎯 Objectif du poste
Rejoindre une cellule IA dédiée aux POC rapides, composée de 4 personnes (PM + 2 devs Python), pour tester et démontrer la valeur de modèles IA open-source dans des cas d’usage concrets à forte valeur ajoutée.
🔍 Missions principales
- Sélection de modèles (20 %) : analyser les modèles open-source (LLM, vision, audio…), évaluer performance, coût, licence.
- Déploiement de POC (50 %) : intégrer rapidement les modèles, optimiser les coûts, livrer des démonstrateurs fonctionnels.
- Veille technologique (10 %) : suivre les dernières avancées (vLLM, Hugging Face, Ollama, etc.) et enrichir la base interne.
- Acculturation interne (10 %) : former et sensibiliser les équipes métiers à l’IA générative.
- Conformité & gouvernance (10 %) : documenter licences, risques, RGPD, AI Act, etc.
‍
Profil
🧠Compétences requises
- Expérience concrète sur des modèles open-source (Llama, Mistral, Whisper, etc.)
- Maîtrise de frameworks : Hugging Face, LangChain, vLLM, ONNX, GGUF/GGML
- Connaissances en optimisation IA : quantization, distillation, multi-GPU, serverless inference
- Compétences en automatisation & déploiement : Docker, Kubernetes, CI/CD
- Très bon niveau en Python ; TypeScript/Node.js apprécié
- Connaissance des licences open-source et du coût total d’exploitation (TCO)
👤 Profil recherché
- 3+ ans d’expérience IA/ML, dont au moins 1 an sur des modèles pré-entraînés
- Capacité à livrer un POC en < 4 semaines
- Forte orientation résultat, pédagogie, curiosité, collaboration
- Aisance Ă vulgariser, arbitrer, structurer et travailler en transversal
💡 Soft skills clés
- Esprit d’arbitrage (ROI, coût, recommandations claires)
- Pédagogie (formation, vulgarisation)
- Résultat & exécution rapide
- Veille active & partagée
- Collaboration étroite avec les équipes métier et tech
‍