Q: 高性能平台有什么注意事项?
A: 可参考注意事项
Q: 用户账号没有root权限,无法使用sudo命令,无法使用root权限安装软件。
A: 用户可以在自己的目录下安装使用大部分软件。软件安装过程中有任何问题都可及时联系。
Q: 如何登录集群。
A: 登录集群演示(由信息学院,叶崇南同学提供)。
Q: 如何提交一个作业。
A: 提交作业演示(由信息学院,叶崇南同学提供)。
Q: 能否实时看到项目进展?
A: 可通过命令qstat 来查看作业状态。
Q: 能否实时看到任务进展?
A: 可通过命令qstat 来查看作业状态。
Q: 为何提交作业后总是无法正常运行?
A: 建议先检查用户目录下的.ssh目录(删除或mv ~/.ssh ~/.ssh.bak),如果还是提交任务后直接报错,请检查家目录(~/)所在路径的权限(不得设置为777),如还有问题请联系管理员。
Q: 提交作业出现如下错误:qsub: submit error (Job rejected by all possible destinations (check syntax, queue resources, ...) MSG=cannot route job 1541101.node1)
A: 一般情况队列名称出错,请核对计算队列名称。如需要确认队列名,请联系管理员进行排查。
Q: 脚本中的walltime的单位和qstat查看的时间单位是不是一样的?是不是HH:mm:SS?
A: 时间单位是一样的HH:MM:SS,但是qstat显示的是核小时,即单个核的运行时间*所使用核数,也就是作业实际运行时间*所使用核数。
Q: 如何使用集群的图形界面,有没有相关的教程资源?
A: 使用X11转发功能,只需选择合适的工具即可。
Windows下:
直接下载使用MobaXterm (https://mobaxterm.mobatek.net/)登陆工具,访问登录节点,即可使用X11转发功能。
Mac下:
下载安装配套软件XQuartz https://www.xquartz.org/,再使用自带的SSH登陆10.15.22.111,即可使用X11转发功能。
可参考X11转发设置演示(由信息学院,叶崇南同学提供)
Q: 如果课题组需要在服务器上安装软件包,是需自行安装还是请图信中心帮助安装呢?
A: 学校集群安装了基础的运行软件、编译器和数学库,用户可在自己目录下安装编译相关软件,安装过程中有任何问题可以及时联系平台管理员。
Q: 提交作业后为何队列名与实际运行队列名不同。
A: 是正常显现:
1) 队列属性可能为route队列的情况下,调度系统会根据提交作业资源需求,根据策略设置流转到合适资源的队列内进行计算;
2) 可能管理员,根据资源情况,调配相关排队任务到相对空闲的资源队列下,以保证整体资源的高效可用。
Q: 我自己编译的软件,需要在配置文件里写入队列信息,如何获取?
A: 可检查账号开设时的通知邮件,或联系管理员。
Q: 如何在hpc上使用matlab engine?
A: 1)登陆10.15.22.111
2)module add apps/matlab/r2016
3)module load apps/python/3.5.9
4)cd /opt/MATLAB/R2016b/extern/engines/python
5)python setup.py build --build-base=builddir install --prefix=installdir (路径自己设定)
6)python
7)import matlab.engine
8)engine = matlab.engine.start_matlab()
Q: 编译或运行过程中提示:缺少'GLIBC_2.14' 版本库(或更高的GLIBC库)。
A: 可以加载module load apps/glib/2.14
如果依然报错,建议将作业参考一下的作业提交方式将作业提交到Centos7的计算节点上。
例:#pbs -l nodes=1:ppn=1:centos7
同样,这样的方法也可以适用于将作业提交到特定设备类型的节点上:
例:#pbs -l nodes=1:ppn=7:gpus=1:V100
具体属性参数,可通过pbsnode <节点名>了解具体内容。
Q: 如有大量数据样本需要处理,或者需要分析的任务规模很大,超出可用资源,如何开展计算任务?
A: 在任务设计方面,可以通过分割、串联等多种方式,将任务分解后进行。建议参考链接:https://hpc.llnl.gov/training/tutorials/introduction-parallel-computing-tutorial#DesignPartitioning
Q: 如何将计算相关文件上传集群。
A: 与集群传输文件演示(由信息学院,叶崇南同学提供)。
Q: environment modules如何使用。
A: Environment Modules的使用演示(由信息学院,叶崇南同学提供)。
Q: 如何在集群使用Matlab?
A: 可参考:
集群版matlab使用介绍(由物质学院,魏旗同学提供)。
Q: 如何在Slurm集群使用Matlab?
A: 可参考:
Q: 如何编译安装VASP。
A: 编译配置文件可用makefile.include,替换源码包内对应的makefile.include。具体编译过程可参见物质学院常用软件编译及使用-vasp-2021(由物质学院,魏旗同学提供)。
GPU在部分体系下有运行效率的提升,具体可参见:GPU Accelerated VASP Test Report(由物质学院,魏旗同学和信息学院高龙同学合作完成测试)。
Q: 如何编译安装lammps。
A: 具体编译过程可参见物质学院常用软件编译及使用-lammps-2021(由物质学院,刘晓迁同学提供)。
Q: VASP 6.1.0版本编译报错及解决。
A: 可参考vasp6.1.0版本编译报错解决(由物质学院,魏旗同学提供)。
Q: Schrodinger如何使用。
A: 可参考Schrodinger Simple Manual-薛定谔使用基本介绍(由免疫化学所,王林同学提供)。
Q: Tensorflow-GPU如何在集群上安装?
A: 可参考Tensorflow-GPU 集群安装指南-谢松杰(由信息学院,谢松杰同学提供)。
Q: 如何通过MAC登录集群?
A: 可参考高性能平台Mac登陆手册(由信息学院,谢松杰同学提供)。
Q: 生命学院常用软件介绍?
A: 可参考生命学院常用软件介绍(由生命学院,宋敏芳同学提供)。
Q: 生命学科单细胞分析经验分享?
A: 可参考生命学科单细胞分析经验分享(由生命学院,宋敏芳同学提供)。
Q: 集群安装R包?
A: 可参考Unix like R-4.1.1 install(由物质学院,刘晓迁同学提供)。
Q: 如何编译siesta?
A: 可参考siesta编译(由物质学院,魏旗同学提供)。
Q:如何在集群上训练神经网络?
A: 可参考神经网络在HPC上的训练(由信息学院,谢松杰同学提供)。
Q:如何在集群上安装使用conda?
A: 可参考Conda在集群里的安装和基本使用(由信息学院,谢松杰同学提供)。
Q: 如何在集群上安装使用Rosetta?
A: 可参考Rosetta集群安装与使用(由生命学院,熊星宇同学提供)。
Q: 如何在集群上安装使用PyRosetta?
A: 可参考PyRosetta集群安装与使用简介(由生命学院,杨皓同学提供)。
Q: Slurm调度系统如何使用?
A: 可参考20230420-高性能集群的介绍与使用-slurm调度系统.pdf。
Q: 如何在集群里使用Julia?
A: 可参考Julia简易教程之BioStructures.pdf (由生命学院,杨皓同学提供)。
Q: 如何在集群上安装Pytorch?
A: 可参考集群上安装Pytorch指南.pdf(由生命学院,杨皓同学提供)。
Q: 如何在集群上安装使用高斯?
A: 可参考高性能常用软件高斯的介绍与使用.pdf(由物质学院,温馨同学提供)。
Q: 如何在集群上使用PWmat?
A: 可参考高性能常用软件PWmat的介绍与使用.pdf(由物质学院,郑彩虹同学提供)。
Q: 如何在集群上使用QE?
A: 可参考高性能常用软件QE的介绍与使用.pdf(由物质学院,谢天烨同学提供)。
Q: 如何在集群上使用gromacs?
A: 可参考分子动力学模拟程序gromacs介绍与入门案例.pdf(由生命学院,杨皓同学提供)。
Q: 如何在集群上安装使用SCHRODINGER?
A: 可参考SCHRODINGER在集群的安装与使用示例.pdf(由生命学院,杨皓同学提供)。
Q: 如何在集群上申请交互式节点使用jupyter notebook?
A: 可参考在torque调度系统上申请交互式节点使用jupyter notebook.pdf。
Q:如何在集群上使用RNA测序数据比对软件STAR
A:可参考RNA测序数据比对软件STAR原理及应用.pdf (由生命学院 马帅同学提供)。
Q: 注意事项?
A:1. 用户使用计算平台过程中,应教育和管理参与使用的所有人员,应自觉遵守平台管理办法、积极与平台沟通联系,共同维护平台环境。
2. 用户应自觉遵守有关保守国家机密的各项法律规定,不利用高性能计算资源泄露国家机密,或从事违法犯罪活动,原则上不在学校平台的公共存储空间上存放涉密数据。
3. 用户应妥善保管账号,不得向未经批准的任何第三方传递或泄漏账号,不得将账号用于与申请事项无关的活动。
4. 不使用软件的或硬件的方法窃取他人口令,非法入侵他人账户,阅读他人文件,窃取他人计算和研究成果或受法律保护的资源。
5. 自觉遵守国家有关保护知识产权的各项法律规定,不在学校集群上擅自复制和使用未经授权的程序和文件,擅自传播或拷贝享有版权的软件,责任自负。
6. 用户应当具备数据备份的意识,应及时对关键数据进行备份。
7. 用户提交的作业的资源申请,应尽可能保证提请的作业资源需求合理,避免无效占用资源。
8. 用户在使用中遇到软硬件方面问题或运行环境的其他问题,可及时与管理员沟通,一同改善系统。
9. 登录节点用于提供用户上载文件、管理文件、编辑脚本以及检查或管理作业用途。在使用登录节点时,应避免在登录节点运行高资源占用的任务(如:直接运行计算作业等),以避免对其他用户的任务开展造成影响。
10. 对于严重违反规定、严重影响其他用户使用或造成重大损害的用户或行为,图书信息中心保留终止服务的权利;对造成重大损失或事故的用户或行为,将按相关规定进行处理。