平台概况

1.平台简介

2017年投入运行以来,上海科技大学高性能计算平台持续建设、迭代升级,现已建成覆盖全校的统一算力服务体系。平台已累计接入公共及院所共享算力资源共873台服务器,形成规模化、集约化的高性能计算基础设施,全面支撑教学、科研与人工智能创新应用。

平台通过统一资源管理、统一服务门户和统一调度机制,打破“资源孤岛”,实现跨部门、跨学科的高效协同,显著提升算力资源利用率与科研支撑能力。目前,平台具备强大的通用计算与智能计算双引擎能力,CPU算力持续增强,GPU算力实现跨越式增长,总体单精度理论峰值算力超60 Pflops,为材料科学、生命健康、人工智能、信息工程等领域的重大科研任务提供坚实支撑。

在全校算力基座,面向人工智能算力需求,平台已构建高性能智算集群,配备多类型先进加速卡,形成领先的AI算力基座,有力支持大模型训练、深度学习、科学智能等前沿探索。学校已完成“满血版”DeepSeek、Qwen、GLM等主流大模型的本地化部署,全面覆盖文本生成、长文本理解、图像识别、语音处理、向量化建模、文生图等多种能力,构建“模型即服务”(MaaS)新范式,推动AI能力便捷化、普惠化、安全化使用。

所有算力资源均通过科研计算自服务平台(简称“E算平台”)实现一站式访问与服务交付,支持异构资源的统一调度、按需使用与精细化管理。平台持续深化有偿使用机制,推动资源高效流转,并通过“智算通”智能服务体提供全天候在线支持,显著提升用户体验与服务响应效率。

作为学校数字化转型的核心基础设施,高性能计算平台正加速从“算力供给”向“智能服务”跃迁,为跨学科融合创新、高层次人才培养和重大科研突破持续赋能,助力上海科技大学建设世界一流的创新型大学。(数据统计截至到2025年12月31日)

2.软件使用

高性能计算共享服务平台基于Linux系统交付,提供了基础的运行环境和常用的运行编译环境(已预装的常用软件可参见:常用软件),用户可自行编译大多数的基于Linux操作系统的软件应用。提供软件运行环境交付或同软件多版本的切换功能。同时用户在部署和使用过程中,应遵守软件的授权协议进行使用,在部署安装过程中,如遇到问题,对于符合授权协议的软件,可联系管理员寻求协助。

2.1ENVIRONMENT MODULES

ENVIRONMENT MODULES可以帮助用户在公共平台上调用预装的软件包或切换拟调用的版本。每个ENVIRONMENT MODULES都是可以加载或卸载环境设置。用户也可以根据自己需要编写自己的模块配置文件。

命令

功能

module use [PATH]

将[PATH]下的文件添加到模块列表中

module avail

列出所有模块

module load [MODULE]

加载[MODULE]

module unload [MODULE]

卸载[MODULE]

module whatis [MODULE]

显示有关[MODULE]的基本信息

module info [MODULE]

显示有关[MODULE]的详细信息


2.2Anaconda

Anaconda 是一个用于科学计算的 Python 发行版,支持 LinuxMacWindows, 包含了众多流行的科学计算、数据分析的 Python 包。其使用conda系统进行包管理。区别于 virtualenvPython 环境管理工具) 的地方是 Conda 不仅可以管理环境,还可管理 Python 的版本,创建独立环境只是 conda 的一个功能,它还是可以安装库。Conda 在安装一些依赖 CC++ Python 库时特别方便与流畅。比如:NumpyPandas、等一些数据库驱动,直接通过命令就可以安装,不需要额外自行编译、安装 C 库。因此,Conda  Python 安装依赖于其它语言的 Python 库表现极佳,多用于 Python 的科学计算和数据分析的环境搭建、管理。

2.3 Singularity

当遇到基础环境入GLIBC等无法兼容或者程序依赖无法在对应集群系统上支持时,可通过容器方式进行运行。Singularity 是⼀种器技术,可让⽤户在不同的计算机上⾏相同的应⽤程,⽽不需担心环境差异。SingularityDocker功能相似,但是相比docker需要root权限,或者专门添加用户组,Singularity在非root时也可以使用,且轻量级、修改方便。

Singularity的主要概念包括:

1) ‌容器‌:一个包含用户软件和依赖的镜像系统,可以独立运行一条或多条命令。Singularity没有镜像的概念,用户创建和运行的都是一个一个容器‌。

2) ‌SIF‌:压缩后的只读Singularity镜像文件,是生产使用的主要形式。

3) ‌Sandbox‌:可写的容器存在形式,是文件系统中的一个目录,常用于开发或创建自己的容器。

常用操作指令如下:

命令

功能

singularity pull [library]://[image]

从[library]拉取镜像[image]

singularity build [image_file] [library]://[image]

从[library]下载[image]并保存成[image_file]的容器文件

Singularity run [image_file].sif

运行[image_file]的容器

singularity exec [image_file].sif [command]

在容器[image_file]中执行指令[command]

singularity exec [image_file].sif

以命令行交互方式运行容器

singularity run --nv -B /path/to/your/data:/data [image_file].sif  [command]

调用GPU容器[image_file],同时将系统/path/to/your/data目录映射为容器/data目录,执行命令[command]


业务负责人:张迎冬

联系方式:20685418   zhangyd@shanghaitech.edu.cn

高性能工程师:孙思思

联系方式:20684830   sunss@shanghaitech.edu.cn

高性能工程师:孙颖彬

联系方式:20684819   sunyb@shanghaitech.edu.cn