Q: 高性能平台有什么注意事项?

A: 可参考注意事项


Q用户账号没有root权限,无法使用sudo命令,无法使用root权限安装软件。

A用户可以在自己的目录下安装使用大部分软件。软件安装过程中有任何问题都可及时联系。


Q如何登录集群。

A登录集群演示由信息学院,叶崇南同学提供)。


Q如何提交一个作业。

A提交作业演示(由信息学院,叶崇南同学提供)。


Q: 能否实时看到项目进展?

A可通过命令qstat 来查看作业状态。


Q: 能否实时看到任务进展?

A可通过命令qstat 来查看作业状态。


Q: 为何提交作业后总是无法正常运行?

A建议先检查用户目录下的.ssh目录(删除或mv ~/.ssh ~/.ssh.bak如果还是提交任务后直接报错,请检查家目录(~/)所在路径的权限(不得设置为777),如还有问题请联系管理员。


Q: 提交作业出现如下错误:qsub: submit error (Job rejected by all possible destinations (check syntax, queue resources, ...) MSG=cannot route job 1541101.node1)

A一般情况队列名称出错,请核对计算队列名称。如需要确认队列名,请联系管理员进行排查。


Q: 脚本中的walltime的单位和qstat查看的时间单位是不是一样的?是不是HH:mm:SS?

A时间单位是一样的HH:MM:SS,但是qstat显示的是核小时,即单个核的运行时间*所使用核数,也就是作业实际运行时间*所使用核数。


Q如何使用集群的图形界面,有没有相关的教程资源?

A使用X11转发功能,只需选择合适的工具即可。

Windows下:

直接下载使用MobaXterm (https://mobaxterm.mobatek.net/)登陆工具,访问登录节点,即可使用X11转发功能。

Mac下:

下载安装配套软件XQuartz https://www.xquartz.org/,再使用自带的SSH登陆10.15.22.111,即可使用X11转发功能。

可参考X11转发设置演示(由信息学院,叶崇南同学提供)


Q如果课题组需要在服务器上安装软件包,是需自行安装还是请图信中心帮助安装呢?

A学校集群安装了基础的运行软件、编译器和数学库,用户可在自己目录下安装编译相关软件,安装过程中有任何问题可以及时联系平台管理员。


Q提交作业后为何队列名与实际运行队列名不同。

A是正常显现:

1) 队列属性可能为route队列的情况下,调度系统会根据提交作业资源需求,根据策略设置流转到合适资源的队列内进行计算;

2) 可能管理员,根据资源情况,调配相关排队任务到相对空闲的资源队列下,以保证整体资源的高效可用。


Q我自己编译的软件,需要在配置文件里写入队列信息,如何获取?

A可检查账号开设时的通知邮件,或联系管理员。

 

Q如何在hpc上使用matlab engine?

A1)登陆10.15.22.111

    2)module add apps/matlab/r2016

    3)module load apps/python/3.5.9

    4)cd /opt/MATLAB/R2016b/extern/engines/python

    5)python setup.py build --build-base=builddir install --prefix=installdir (路径自己设定)

    6)python

    7)import matlab.engine

    8)engine = matlab.engine.start_matlab()

 

Q编译或运行过程中提示:缺少'GLIBC_2.14' 版本库(或更高的GLIBC库)。

A可以加载module load apps/glib/2.14

如果依然报错,建议将作业参考一下的作业提交方式将作业提交到Centos7的计算节点上。

例:#pbs -l nodes=1:ppn=1:centos7

同样,这样的方法也可以适用于将作业提交到特定设备类型的节点上:

例:#pbs -l nodes=1:ppn=7:gpus=1:V100

具体属性参数,可通过pbsnode <节点名>了解具体内容。

 

Q如有大量数据样本需要处理,或者需要分析的任务规模很大,超出可用资源,如何开展计算任务?

A在任务设计方面,可以通过分割、串联等多种方式,将任务分解后进行。建议参考链接:https://hpc.llnl.gov/training/tutorials/introduction-parallel-computing-tutorial#DesignPartitioning


Q如何将计算相关文件上传集群。

A与集群传输文件演示(由信息学院,叶崇南同学提供)。


Qenvironment modules如何使用。

AEnvironment Modules的使用演示(由信息学院,叶崇南同学提供)。


Q如何在集群使用Matlab

A可参考:

集群版matlab使用介绍(由物质学院,魏旗同学提供)。


Q如何在Slurm集群使用Matlab

A可参考:

Slurm集群版MATLAB 2021B 使用步骤


Q: 如何编译安装VASP。

A编译配置文件可用makefile.include,替换源码包内对应的makefile.include。具体编译过程可参见物质学院常用软件编译及使用-vasp-2021(由物质学院,魏旗同学提供)。

GPU在部分体系下有运行效率的提升,具体可参见:GPU Accelerated VASP Test Report(由物质学院,魏旗同学和信息学院高龙同学合作完成测试)。


Q: 如何编译安装lammps

A具体编译过程可参见物质学院常用软件编译及使用-lammps-2021(由物质学院,刘晓迁同学提供)。


Q: VASP 6.1.0版本编译报错及解决

A: 可参考vasp6.1.0版本编译报错解决(由物质学院,魏旗同学提供)。


Q: Schrodinger如何使用。

A可参考Schrodinger Simple Manual-薛定谔使用基本介绍(由免疫化学所,王林同学提供)。


QTensorflow-GPU如何在集群上安装?

A可参考Tensorflow-GPU 集群安装指南-谢松杰(由信息学院,谢松杰同学提供)。


Q: 如何通过MAC登录集群?

A可参考高性能平台Mac登陆手册(由信息学院,谢松杰同学提供)。


Q: 生命学院常用软件介绍?

A可参考生命学院常用软件介绍(由生命学院,宋敏芳同学提供)。


Q: 生命学科单细胞分析经验分享?

A可参考生命学科单细胞分析经验分享(由生命学院,宋敏芳同学提供)。


Q: 集群安装R包?

A可参考Unix like R-4.1.1 install(由物质学院,刘晓迁同学提供)。


Q: 如何编译siesta

A可参考siesta编译(由物质学院,魏旗同学提供)。


Q:如何在集群上训练神经网络?

A可参考神经网络在HPC上的训练(由信息学院,谢松杰同学提供)。


Q:如何在集群上安装使用conda?

A可参考Conda在集群里的安装和基本使用(由信息学院,谢松杰同学提供)。


Q:  如何在集群上安装使用Rosetta?

A: 可参考Rosetta集群安装与使用(由生命学院,熊星宇同学提供)。


Q:  如何在集群上安装使用PyRosetta?

A: 可参考PyRosetta集群安装与使用简介(由生命学院,杨皓同学提供)。


Q:  Slurm调度系统如何使用

A: 可参考20230420-高性能集群的介绍与使用-slurm调度系统.pdf


Q:  如何在集群里使用Julia

A: 可参考Julia简易教程之BioStructures.pdf (由生命学院,杨皓同学提供)。


Q:  如何在集群上安装Pytorch

A: 可参考集群上安装Pytorch指南.pdf(由生命学院,杨皓同学提供)。


Q:  如何在集群上安装使用高斯

A: 可参考高性能常用软件高斯的介绍与使用.pdf(由物质学院,温馨同学提供)。


Q:  如何在集群上使用PWmat

A: 可参考高性能常用软件PWmat的介绍与使用.pdf(由物质学院,郑彩虹同学提供)。


Q:  如何在集群上使用QE

A: 可参考高性能常用软件QE的介绍与使用.pdf(由物质学院,谢天烨同学提供)。


Q:  如何在集群上使用gromacs

A: 可参考分子动力学模拟程序gromacs介绍与入门案例.pdf(由生命学院,杨皓同学提供)。


Q:  如何在集群上安装使用SCHRODINGER

A: 可参考SCHRODINGER在集群的安装与使用示例.pdf(由生命学院,杨皓同学提供)。


Q:  如何在集群上申请交互式节点使用jupyter notebook

A: 可参考在torque调度系统上申请交互式节点使用jupyter notebook.pdf


Q:  注意事项

A:1. 用户使用计算平台过程中,应教育和管理参与使用的所有人员,应自觉遵守平台管理办法、积极与平台沟通联系,共同维护平台环境。

2. 用户应自觉遵守有关保守国家机密的各项法律规定,不利用高性能计算资源泄露国家机密,或从事违法犯罪活动,原则上不在学校平台的公共存储空间上存放涉密数据。

3. 用户应妥善保管账号,不得向未经批准的任何第三方传递或泄漏账号,不得将账号用于与申请事项无关的活动。

4. 不使用软件的或硬件的方法窃取他人口令,非法入侵他人账户,阅读他人文件,窃取他人计算和研究成果或受法律保护的资源。

5. 自觉遵守国家有关保护知识产权的各项法律规定,不在学校集群上擅自复制和使用未经授权的程序和文件,擅自传播或拷贝享有版权的软件,责任自负。

6. 用户应当具备数据备份的意识,应及时对关键数据进行备份。

7. 用户提交的作业的资源申请,应尽可能保证提请的作业资源需求合理,避免无效占用资源。

8. 用户在使用中遇到软硬件方面问题或运行环境的其他问题,可及时与管理员沟通,一同改善系统。

9. 登录节点用于提供用户上载文件、管理文件、编辑脚本以及检查或管理作业用途。在使用登录节点时,应避免在登录节点运行高资源占用的任务(如:直接运行计算作业等),以避免对其他用户的任务开展造成影响。

10. 对于严重违反规定、严重影响其他用户使用或造成重大损害的用户或行为,图书信息中心保留终止服务的权利;对造成重大损失或事故的用户或行为,将按相关规定进行处理。