일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- Docker
- AMD
- Linux
- 1.9
- GPU
- CUDA
- v1.9
- version
- 1.10
- Cray
- Singularity
- Source
- nvidia
- HPCM
- client
- gpfs
- ubuntu
- HPE
- infiniband
- patch
- build
- HPFSS
- java
- top500
- hpcm패치
- rhel
- CPU
- LUSTRE
- PFSS
- SLURM
- Today
- Total
목록분류 전체보기 (92)
HPE CRAY 자료 공유
ABRT는 AUTOMATIC BUG REPORTING TOOL로 애플리케이션이 충돌하거나 커널 오류가 감지되면 자동으로 분석 정보를 수집합니다. 하지만 HPC 계산노드에서는 잘못된 연산으로 segmentation fault와 out of memory 같은 오류가 자주 발생하고, 빈번한 정보 수집이 시스템 성능에 영향을 주게되어 ABRT 삭제를 권장합니다. 1. 설치 상태 조회 # yum list | grep abrt abrt.x86_64 2.1.11-60.el7.centos @anaconda abrt-addon-ccpp.x86_64 2.1.11-60.el7.centos @anaconda abrt-addon-kerneloops.x86_64 2.1.11-60.el7.centos @anaconda abrt-a..
CrayKorea 서버, CentOS 7.5.1804, root 권한 필요 1. yum-utils 설치 (yum-config-manager 유틸리티 제공) yum install -y yum-utils 2. yum-config-manger 를 이용해 docker 저장소 설정 yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo 3. docker engine 설치(docker-ce, docker-ce-cli, containerd.io) yum install docker-ce docker-ce-cli containerd.io (GPG key 확인: 060A 61C5 1B55 8A7F 742B 77AA C52F ..
IBS aleph (XC50), GNU compiler 이용 1. ThirdParty application 설치 boost, cmake (따로 설치 후 module load 로 이용) cgal, gmp, mpc, mpfr, scotch (ThirdParty directory에 위치) 2. etc/bashrc 수정 export WM_MPLIB=CRAY-MPICH (XC 환경에 맞게 cray-mpich 선택) 3. etc/config.sh/settings (cc, CC wrapper 사용을 위해 새로이 WM_ARCH 설정) WM_ARCH='crayxc' export WM_COMPILER_LIB_ARCH=64 # Target with lib64 export WM_CC='cc' export WM_CXX='CC'..
1. Commands User Commands PBS Slurm Job submission qsub [script_file] sbatch [script_file] Job deletion qdel [job_id] scancel [job_id] Job status (by job) qstat [job_id] squeue [job_id] Job status (by user) qstat -u [user_name] squeue -u [user_name] Job hold qhold [job_id] scontrol hold [job_id] Job release qrls [job_id] scontrol release [job_id] Queue list qstat -Q squeue Node list pbsnodes -l ..
1. Front panel Item Description 비고 1 Drive bays 2 Slot 9 PICe3 x 16 3 Slot 10 PICe3 x 16 4 NIC port 2 5 NIC port 1 6 Dedicated iLO port(optional) 7 Serial number and iLO label pull tab 8 USB 3.0 connector 9 SUV connector - Chassis and Accelerator Trays Item Description 비고 1 HPE Apollo 6500 Chassis (4U) 2 Low profile PCIe Gen3 x16 slot 3 Embedded 1Gb NIC 2 4 Embedded 1Gb NIC 1 5 Dedicated iLO Por..
nvidia-smi 실행 화면 1. Driver Version - 현재 설치되어 있는 nvidia driver version을 확인 할 수 있습니다. Driver Version: 460.27.04 2. CUDA Version - 현재 드라이버 버전과 맞는 cuda 추천 버전(주의: 절대 현재 설치되어 있는 버전이 아님) CUDA Version: 11.2 3. GPU/FAN 설치되어 있는 GPU number FAN N/A(Not Available) fan이 없는 Tesla 모델. ※ RTX 계열의 팬이 있는 모델을 사용하면 56%같은 숫자와 %로 표기. 4. Name Nvidia GPU Model(A100-SXM-80GB) 5. Temp GPU의 현재 온도를 표시 합니다. 41C 6. Perf(Perfor..
sinfo 명령을 이용하여 "idle" 상태의 노드를 확인 합니다. $ sinfo PARTITION AVAIL TIMELIMIT NODES STATE NODELIST short* up 4:00:00 11 down* gpu_a100n[01-06],gpu_v100n[01-05] short* up 4:00:00 1 alloc node43 short* up 4:00:00 6 idle gpu_v100n[06-08],node[44-46] normal up 1-00:00:00 11 down* gpu_a100n[01-06],gpu_v100n[01-05] normal up 1-00:00:00 1 alloc node43 normal up 1-00:00:00 6 idle gpu_v100n[06-08],node[44-46] ..
1. ssh-keygen 실행 예제 $ ssh-keygen -t rsa Generating public/private rsa key pair. Enter file in which to save the key (/home/leesangy/.ssh/id_rsa): Created directory '/home/leesangy/.ssh'. Enter passphrase (empty for no passphrase): Enter same passphrase again: Your identification has been saved in /home/leesangy/.ssh/id_rsa. Your public key has been saved in /home/leesangy/.ssh/id_rsa.pub. The ke..
1. MLNX-OS Software Versions - 최신버전 : MLNX-OS v3.9.3302 (2021-10 기준) - 경로 : https://docs.mellanox.com > software > Switch Software > MLNX-OS (InfiniBand) 2. Mellanox Quantum Firmware - 최신버전 : Mellanox Quantum Firmware v27.2008.3328 (출시일 : 2021-09-20) - 경로 : https://docs.mellanox.com > software > Switch Firmware > NVIDIA Quantum
1. dependencies openssl-devel wget cryptsetup libuuid-devel libseccomp-devel squashfs-tools 2. install golang - Linux 2.6.23 binary version $ wget https://golang.org/dl/go1.16.5.linux-amd64.tar.gz - golang 환경 설정 $ export PATH=/home/sylee/go/bin:$PATH 3. install singularity # wget https://github.com/sylabs/singularity/releases/download/v3.8.0/singularity-ce-3.8.0.tar.gz # tar xvzf singularity-ce-..