1.平台简介
自2017年投入运行以来,上海科技大学高性能计算平台持续建设、迭代升级,现已建成覆盖全校的统一算力服务体系。平台已累计接入公共及院所共享算力资源共873台服务器,形成规模化、集约化的高性能计算基础设施,全面支撑教学、科研与人工智能创新应用。
平台通过统一资源管理、统一服务门户和统一调度机制,打破“资源孤岛”,实现跨部门、跨学科的高效协同,显著提升算力资源利用率与科研支撑能力。目前,平台具备强大的通用计算与智能计算双引擎能力,CPU算力持续增强,GPU算力实现跨越式增长,总体单精度理论峰值算力超60 Pflops,为材料科学、生命健康、人工智能、信息工程等领域的重大科研任务提供坚实支撑。
在全校算力基座,面向人工智能算力需求,平台已构建高性能智算集群,配备多类型先进加速卡,形成领先的AI算力基座,有力支持大模型训练、深度学习、科学智能等前沿探索。学校已完成“满血版”DeepSeek、Qwen、GLM等主流大模型的本地化部署,全面覆盖文本生成、长文本理解、图像识别、语音处理、向量化建模、文生图等多种能力,构建“模型即服务”(MaaS)新范式,推动AI能力便捷化、普惠化、安全化使用。
所有算力资源均通过科研计算自服务平台(简称“E算平台”)实现一站式访问与服务交付,支持异构资源的统一调度、按需使用与精细化管理。平台持续深化有偿使用机制,推动资源高效流转,并通过“智算通”智能服务体提供全天候在线支持,显著提升用户体验与服务响应效率。
作为学校数字化转型的核心基础设施,高性能计算平台正加速从“算力供给”向“智能服务”跃迁,为跨学科融合创新、高层次人才培养和重大科研突破持续赋能,助力上海科技大学建设世界一流的创新型大学。(数据统计截至到2025年12月31日)
高性能计算共享服务平台基于Linux系统交付,提供了基础的运行环境和常用的运行编译环境(已预装的常用软件可参见:常用软件),用户可自行编译大多数的基于Linux操作系统的软件应用。提供软件运行环境交付或同软件多版本的切换功能。同时用户在部署和使用过程中,应遵守软件的授权协议进行使用,在部署安装过程中,如遇到问题,对于符合授权协议的软件,可联系管理员寻求协助。
2.1ENVIRONMENT MODULES
ENVIRONMENT MODULES可以帮助用户在公共平台上调用预装的软件包或切换拟调用的版本。每个ENVIRONMENT MODULES都是可以加载或卸载环境设置。用户也可以根据自己需要编写自己的模块配置文件。
命令 | 功能 |
module use [PATH] | 将[PATH]下的文件添加到模块列表中 |
module avail | 列出所有模块 |
module load [MODULE] | 加载[MODULE] |
module unload [MODULE] | 卸载[MODULE] |
module whatis [MODULE] | 显示有关[MODULE]的基本信息 |
module info [MODULE] | 显示有关[MODULE]的详细信息 |
2.2Anaconda
Anaconda 是一个用于科学计算的 Python 发行版,支持 Linux、Mac、Windows, 包含了众多流行的科学计算、数据分析的 Python 包。其使用conda系统进行包管理。区别于 virtualenv(Python 环境管理工具) 的地方是 Conda 不仅可以管理环境,还可管理 Python 的版本,创建独立环境只是 conda 的一个功能,它还是可以安装库。Conda 在安装一些依赖 C、C++的 Python 库时特别方便与流畅。比如:Numpy、Pandas、等一些数据库驱动,直接通过命令就可以安装,不需要额外自行编译、安装 C 库。因此,Conda 在 Python 安装依赖于其它语言的 Python 库表现极佳,多用于 Python 的科学计算和数据分析的环境搭建、管理。
2.3 Singularity
当遇到基础环境入GLIBC等无法兼容或者程序依赖无法在对应集群系统上支持时,可通过容器方式进行运行。Singularity 是⼀种器技术,可让⽤户在不同的计算机上⾏相同的应⽤程,⽽不需担心环境差异。Singularity与Docker功能相似,但是相比docker需要root权限,或者专门添加用户组,Singularity在非root时也可以使用,且轻量级、修改方便。
Singularity的主要概念包括:
1) 容器:一个包含用户软件和依赖的镜像系统,可以独立运行一条或多条命令。Singularity没有镜像的概念,用户创建和运行的都是一个一个容器。
2) SIF:压缩后的只读Singularity镜像文件,是生产使用的主要形式。
3) Sandbox:可写的容器存在形式,是文件系统中的一个目录,常用于开发或创建自己的容器。
常用操作指令如下:
命令 | 功能 |
singularity pull [library]://[image] | 从[library]拉取镜像[image] |
singularity build [image_file] [library]://[image] | 从[library]下载[image]并保存成[image_file]的容器文件 |
Singularity run [image_file].sif | 运行[image_file]的容器 |
singularity exec [image_file].sif [command] | 在容器[image_file]中执行指令[command] |
singularity exec [image_file].sif | 以命令行交互方式运行容器 |
singularity run --nv -B /path/to/your/data:/data [image_file].sif [command] | 调用GPU容器[image_file],同时将系统/path/to/your/data目录映射为容器/data目录,执行命令[command] |
业务负责人:张迎冬
联系方式:20685418 zhangyd@shanghaitech.edu.cn
高性能工程师:孙思思
联系方式:20684830 sunss@shanghaitech.edu.cn
高性能工程师:孙颖彬
联系方式:20684819 sunyb@shanghaitech.edu.cn