公告资讯详情

TRAINING NOTICE

首页 / 通知公告 / 通知公告 / 详情

高性能计算资源开放共享管理办法

发布单位: 统计生信平台                2023/2/28 11:35:18                4632

附件: 用户安全承诺书(V1).docx sentieon操作说明.txt 用户上机申请表(院内).docx 科研共享服务合同(自主方式).docx 用户使用手册(2024).docx

高性能计算资源开放共享管理办法(暂行)

北京协和医院高性能计算集群作为院级公共服务设施,共有180个计算节点,处理器采用Intel Xeon Gold 6336Y,共计8640处理器核,系统的理论浮点峰值计算性能达到800 TFlops,存储总容量达7.2 PB。另外,系统还配置34* Tesla A100 GPU节点,及42T大内存节点。2023年3月6日起正式开放使用,为用户提供充足的计算资源。

一、开放原则

高性能集群平台投入大、运行和维护费用高,为使其充分发挥效用,在对外开放过程中,将坚持为用户提供最为优质和便捷的计算资源使用服务。坚持并不断优化收费服务机制,通过合理收费维持平台的可持续运行。并始终坚持协商机制,对平台的建设发展中的重大问题和在平台上发生的利益矛盾经集体讨论,可向领导部门提出建议。本平台系统运维组将承担计算资源对外服务过程中产生的各项事宜。分析团队主要承担技术分析服务工作以及平台本身的技术研发工作。

二、计算平台硬件参数

计算节点参数:Intel 6336Y  2.4G 48C /384GB DDR4/960GB SSD/100Gb EDR

GPU节点参数:Intel 6336Y  2.4G 48C /4*NV TESLA A100 40G/1.92TB SSD/100Gb EDR

大内存节点参数:Intel 6336Y  2.4G 48C /2TB DDR4/1.92TB SSD/100Gb EDR

高性能并行存储:60GB/s聚合带宽7.3PBSAS/SATA

用户申请帐号时,请根据实际需求认真填写所需资源,计算资源使用方式分为独占和共享:

独占:用户申请独立节点进行作业,不与其他用户的作业共享节点,避免作业争抢CPU和内存资源的干扰。

共享:用户作业共享计算资源,作业调度系统根据提交作业申请的CPU、内存、GPU资源,以最优的方式分配到集群的计算节点运行。

三、管理规定

1、所有用户必须按照相关的规定使用计算机并提交作业,如发现有不按规定提交作业者,系统管理员有权停止不符合规范的任务,由此产生的额外的机时费,由项目组自行承担,并连续两次违规提交作业并经指导后仍不改正者,管理员有权锁定其账户。

2、出现以下情况时,产生的额外的机时费,由各项目组自行承担:

用户违规提交作业造成的计算机死机;

程序有缺陷或对程序估量不足时,耗尽系统资源而造成的计算机

死机;

用户存储空间耗尽,而导致的程序中断;

3、出现以下情况时,产生的额外的机时费,由管理部门承担:

意外断电或由于机房环境问题而造成的停机;

突发性的设备故障而造成的正在运行任务非正常结束。

4、为了防止网络拥塞,建议有超大数据(>5TB)导入的用户请拿硬盘找管理员进行本地导入。

5、实验数据安全提醒:请用户自行保存实验数据,平台不予保存。合同终止6个月后,用户所有数据将被删除。

四、收费标准及收取办法

收费标准待院内网公示后公布并执行。收费管理办法由北京协和医院高性能计算平台管理组负责具体执行。系统运维部按季度统计各项目组使用情况并生成报表,提交项目组确认后执行费用收缴。

五、奖励与优惠办法

1、院内及享受优惠用户在发布其科研成果或发表论文时,应标注本研究工作得到北京协和医院高性能计算平台支持“,并提交其成果报告或发表论文复印件。平台将根据申报成果,给予用户500-2000个核小时的机时奖励。

2、鼓励用户在国际顶级期刊(如naturesciencecell等)发表论文,并致谢北京协和医院高性能计算平台。如有论文发表,平台下一年度将给予该用户40%的费用优惠(优惠额度最高不超过8万元)。

3、奖励与优惠工作每半年组织一次,由管理组批准执行。

六、上机流程

1、初次接洽

可联系平台技术人员咨询相关事宜,了解平台服务内容,资源情况,使用流程,以及收费政策。

2、开设账号

登录《实验室信息管理系统LIMS》(https://transmedlims.pumch.cn/-首页-科研服务-生物信息,浏览《高性能计算资源对外开放共享管理办法》,下载并填写《用户上机申请表》用户安全承诺书》及《科研共享服务合同》,纸质版交到转化楼5038转化楼一层前台。审核通过后,24h内开通账号。用户上机前应仔细阅读《用户使用手册》,了解用户平台使用方法和注意事项,用户使用过程中,系统管理员为用户提供技术支持,协助用户熟悉平台环境。

备注:《用户上机申请表》用户安全承诺书》由实际上机人员填写,每人均需填写,另提交申请人身份证正反面复印件科研共享服务合同里课题负责人请填写PI信息,最末表格填写实际上机人员信息,默认该表格中所有用户为同项目组人员,最终经费账单将按项目组发送。

 附件中《用户使用手册》供大家阅读。更多更为详细的课件讲解视屏放置在云盘中,用户可自行下载。https://pan.baidu.com/s/1caWJbtNt7RHl9T5He0JhGA?pwd=x1hb (提取码x1hb)

3、正式上机

用户上机过程中可随时通过运行管理平台(网址待公布)查看作业运行和资源使用情况。根据双方协议,平台部会定期向用户发送资源使用清单,用户应及时支付机时费。上机过程中,平台提供必要的技术支持,包括上机指导、软件安装以及解决运行故障等工作。

4、结束上机

根据双方签署协议/合同规定的时间期限,用户完成预定的上机任务并确认暂无延续项目后,则进入结束上机程序,用户妥善处理各项数据后,账号将暂时封存,若用户再次申请上机并签署协议/合同,则重新启用。院内及其他享受平台优惠的用户有义务定期提交《用户成果报告》。

 

 

 

联系电话:

老师 69154531;

运维工程师:15201237229