岗位职责:
1、运用MLOps最佳实践,包括但不限于持续集成/交付(CI/CD)、数据管道、模型部署和监控。
2、建立和维护可扩展的机器学习模型生命周期管理平台,包括模型的训练、验证、部署和监控。
3、优化机器学习工作流程,提高资源使用效率和生产率。
任职要求:
1、计算机科学、软件工程或相关领域的学士学位,3年以上MLOps或相关领域工作经验。
2、熟悉云计算、云原生开发的主流框架、语言、工具(如Go/Java/Python、Kubernetes、KubeFlow等)。
3、具备GPU资源的管理、调度、调优经验。了解深度学习训练、部署者优先。
4、具备大型分布式系统设计与实施经验者优先。
5、对新技术有热情,不惧挑战,具备良好的问题解决能力,具备良好的沟通与团队协作能力。