平台概况

1.平台简介

上海科技大学高性能计算平台自2017年7月1日正式投入运行以来,截至2023年12月31日,已对接学校公共服务器资源(公共资源)和院所参与共享统筹的服务器资源共计658台。其中,物理CPU节点401台,物理GPU节点257台,虚拟CPU节点26。单精理论峰值处理能力方面,CPU节点处理能力0.76Pflops,GPU节点处理能力26.68Pflops,目前可用科研计算存储容量7.1PB,人工智能计算专用存储1.2PB。

2.硬件资源概况

目前,高性能计算平台对公共资源和院所统筹资源统一调度进行作业和资源管理,另有两套集群由院所独立运行维护管理。其中信息学院ai集群可通过e算平台访问使用,电镜后处理集群由院所自行管理。

参与统筹的硬件资源情况如下:

 

 

3.软件资源软件使用及管理

平台通过预装软件,并提供ENVIRONMENT MODULES的方式帮助用户快速切换和管理科学计算软件所需要的应用模块,同时,面向python等的应用,用户通过Anaconda可以快速部署和调用运行环境。

ENVIRONMENT MODULES

ENVIRONMENT MODULES可以帮助用户在公共平台上调用预装的软件包或切换拟调用的版本。每个ENVIRONMENT MODULES都是可以加载或卸载环境设置。用户也可以根据自己需要编写自己的模块配置文件。

命令

功能

module use [PATH]

将[PATH]下的文件添加到模块列表中

module avail

列出所有模块

module load [MODULE]

加载[MODULE]

module unload [MODULE]

卸载[MODULE]

module whatis [MODULE]

显示有关[MODULE]的基本信息

module info [MODULE]

显示有关[MODULE]的详细信息

module display [MODULE]

显示有关[MODULE]的信息

module help

输出帮助信息


Anaconda

Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux、Mac、Windows, 包含了众多流行的科学计算、数据分析的 Python 包。其使用conda系统进行包管理。区别于 virtualenv(Python 环境管理工具) 的地方是 Conda 不仅可以管理环境,还可管理 Python 的版本,创建独立环境只是 conda 的一个功能,它还是可以安装库。Conda 在安装一些依赖 C、C++的 Python 库时特别方便与流畅。比如:Numpy、Pandas、等一些数据库驱动,直接通过命令就可以安装,不需要额外自行编译、安装 C 库。因此,Conda 在 Python 安装依赖于其它语言的 Python 库表现极佳,多用于 Python 的科学计算和数据分析的环境搭建、管理。

其他软件

平台目前配置的是Centos的操作系统,并提供了基础的运行环境和常用的运行编译环境(已预装的常用软件可参见:常用软件),用户可自行编译大多数的基于Linux操作系统的软件应用。

同时用户在部署和使用过程中,应遵守软件的授权协议进行使用,在部署安装过程中,如遇到问题,对于符合授权协议的软件,可联系管理员寻求协助。

(数据统计截至到2023年12月31日)


业务负责人:张迎冬

联系方式:20685418   zhangyd@shanghaitech.edu.cn

高性能工程师:孙思思

联系方式:20684830   sunss@shanghaitech.edu.cn

高性能工程师:孙颖彬

联系方式:20684819   sunyb@shanghaitech.edu.cn