校内招聘
您当前位置: 首页 > 人才招聘 > 校内招聘 > 正文
招聘岗位:科学计算中心智算资源运营工程师

基本要求

  • 招聘部门:教育技术与计算中心
  • 招聘对象:不限制
  • 招聘人数:1人
  • 岗位待遇:遵照学校有关规定
  • 招聘类型:教辅岗招聘
  • 工作地点:上海- 同济大学
  • 聘用方式:双轨制
  • 发布日期:2024年02月29日

招聘条件、岗位职责

一、岗位职责
1、GPU计算资源的规划和管理:
负责单精度集群40台和双精度集群188台GPU服务器资源的规划和管理,包括GPU计算节点硬件的配置、安装、维护等,确保GPU计算节点之间能够高效访问数据存储和网络资源,GPU计算资源的正常可靠运行。
2、GPU软件平台的搭建:负责GPU软件平台的搭建和管理,包括CUDA和OpenCL等开发工具的安装和配置,各类脚本语言的编写和修改,为用户提供稳定可靠的GPU计算环境。
3、GPU计算节点的性能和负载管理:
负责GPU计算节点的性能和负载管理,包括GPU计算节点的资源分配和负载均衡,提供高效、稳定的GPU计算服务。
5、GPU计算节点的维护和故障排查:
负责GPU计算节点的维护和故障排查,及时处理GPU节点的故障和异常情况,包括节点硬件的更换和维修,节点软件的更新和调试等,以保证GPU计算服务的高可靠性。
6、关注并研究业界最新的技术趋势,跟踪验证并采用新的科学计算方法、优化算法提高运行效率。
7、完成领导交办的其他工作。

二、应聘条件:
1、符合《事业单位公开招聘人员暂行规定》要求;
2、具有良好的思想政治素质,政治立场坚定;遵守宪法和法律;具有良好的品行;
3、一般应具有全日制硕士研究生及以上学历;境外学位需在高水平大学获得并提供教育部学历学位认证书,所学专业需与应聘岗位相关;
4、原则上年龄在35周岁以下(1989年1月1日及以后出生);
5、身体健康,保障很好完成岗位工作的身体条件;
6、符合以下条件:
(1)拥有计算机类或相关领域的教育背景;
(2)熟练掌握Linux/Unix操作系统,包括系统安装、配置和维护。熟悉shell/python等脚本语言;
(3)对GPU硬件架构有深入理解并且具备实际操作经验,理解高性能计算集群的原理和设计。掌握并行计算中使用的各种模型,如CUDA,OpenCL,以及对相应的编程有一定的了解。对主流的GPU计算框架,如TensorFlow,PyTorch等有使用和优化经验;
(4)了解高速网络如InfiniBand等在HPC环境中的应用,了解并熟悉大规模存储系统,了解作业调度系并有实际操作经验;
(5)能够分析和诊断HPC系统包括硬件和软件、中出现的问题,并提出有效的解决方案;了解如何优化系统以得到最佳性能;
7、能熟练使用办公自动化软件;
8、英语听、说、读、写流利;
9、具备本岗位专业技术领域的技能及专业实践要求。具有公认的胜任岗位要求的良好专业技术能力,并能提供有效证明材料的应聘人员,经审议通过后可适当放宽要求。

联系方式

胡婕
65982840
92592@tongji.edu.cn