岗位职责:
1、构建和维护高可用、可扩展的AI平台及基础设施(涵盖模型训练与推理环境),为AI推理一体机/集群提供技术支撑;
2、实现大模型自动化部署、监控和管理,确保平台稳定高效运行;
3、探索并应用前沿AI技术和工具,持续优化平台性能;
4、编写和更新系统架构、操作手册、故障处理指南等技术文档;
5、参与技术交流和团队培训,推动整体技术能力提升;
岗位要求:
1、熟练掌握Golang/Python或其他开发语言,具备扎实的编程能力;
2、拥有负载均衡、分布式推理和系统优化的实际项目经验;
3、精通Linux系统及Shell脚本,熟悉Docker、Kubernetes等容器技术,同时了解网络与存储技术;
4、了解机器学习基本概念,并熟悉TensorFlow、PyTorch、vLLM、SGLang等常用框架;
5、具备较强的问题分析与解决能力,良好的沟通和团队协作精神;
公司福利:
1、 入职五险一金,补充个人意外险,下午茶,每月人均100团建费;
2、节日福利,生日福利,结婚礼金,生育礼金;
3、运动现金奖金,年度旅游,体检,新人导师一对一带教,年底丰厚奖金;
4、注:工厂岗位可提供住宿;