일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- SLURM
- CUDA
- LUSTRE
- Docker
- PFSS
- nvidia
- infiniband
- CPU
- Singularity
- rhel
- hpcm패치
- HPFSS
- patch
- HPCM
- 1.9
- AMD
- Cray
- top500
- rocm
- conda
- Linux
- Kernel
- 1.10
- build
- gpfs
- Source
- GPU
- ubuntu
- HPE
- java
- Today
- Total
목록SYSTEMS/GPU (7)
HPE CRAY 자료 공유
- OS: RHEL 9.4- GPU: Radeon PRO W6800 1. Redhat OS local repo 생성[root@cray ~]# cat /etc/yum.repos.d/local.repo [media-baseos]name=BaseOSbaseurl=file:///data/REPO/rhel9.4/BaseOSgpgcheck=1enabled=1gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release[media-appstream]name=AppStreambaseurl=file:///data/REPO/rhel9.4/AppStreamgpgcheck=1enabled=1gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-rel..
일반 사용자 계정으로 rocminfo 명령 실행 시 오류 해결 방법 오류 내용[sylee@cray ~]$ rocminfo ROCk module is loaded Unable to open /dev/kfd read-write: Permission denied sylee is not member of "video" group, the default DRM access group. Users must be a member of the "video" group or another DRM access group in order for ROCm applications to run successfully.- 일반계정(예: sylee)으로 AMD GPU의 rocminfo 명령 실행 시 /dev/kfd 디바이스에 권한..
- 소스코드 다운 $ wget -O cuda-samples-12.4.1.tar.gz https://github.com/NVIDIA/cuda-samples/archive/refs/tags/v12.4.1.tar.gz$ tar xvzf cuda-samples-12.4.1.tar.gz $ cd cuda-samples-12.4.1 $ cd Samples/1_Utilities/bandwidthTest - 빌드 방법:$ CUDA_PATH=/usr/local/cuda-11.8 make TARGET_ARCH=x86_64 1. bandwidthTest# ./bandwidthTest [CUDA Bandwidth Test] - Starting... Running on... Device 0: NVIDIA A100-SXM4..
GPU HBM 자료 공유 - 출처: Press Center | TrendForce - Market research, price trend of DRAM, NAND Flash, LEDs, TFT-LCD and green energy, PV
1. GPU 용도별 분류 구분 설명 비고 Radeon RX 게이밍 제품군 NVIDIA의 GeForce 대응 Radeon PRO (구. AMD FirePro) 워크스테이션 제품군 NVIDIA의 Quadro 대응 Instinct GPU 가속기 제품군 NVIDIA의 Tesla 대응 2. GPU ARCHITECTURE History 구분 설명 비고 TeraScale GCN(Graphics Core Next) RDNA(Radeon DNA) 게이밍 CDNA(Compute DNA) 컴퓨팅 (1) TeraScale 이후 GPU Architecture 출시 코드명(공정) 주요 제품 종류 gfx3 / TeraScale 1 R600, R700 HD 2000 Series, HD 3000 Series, HD 4000 Serie..
1. GPU 용도별 분류 구분 설명 비고 Tesla Server용 Quadro Workstaion용 GeForce PC용 2. GPU ARCHITECTURE History GPU Architecture 출시 GPU archs 주요 제품 종류 비고 Fermi 2010 sm_20 Kepler 2012 sm_30, sm_35, sm_37 Quadro: K2000, K4000, K4200, K5000, K5200, K6000 Tesla: K10, K20, K20x, K20Xm, K20c, K20s, K40m, K40c, K40s, K40st, K40t, K80, K520 Maxwell 2014 sm_50, sm_52, sm_53 Quadro: K2200, M2000, M4000, M5000, M6000 Tesl..
nvidia-smi 실행 화면 1. Driver Version - 현재 설치되어 있는 nvidia driver version을 확인 할 수 있습니다. Driver Version: 460.27.04 2. CUDA Version - 현재 드라이버 버전과 맞는 cuda 추천 버전(주의: 절대 현재 설치되어 있는 버전이 아님) CUDA Version: 11.2 3. GPU/FAN 설치되어 있는 GPU number FAN N/A(Not Available) fan이 없는 Tesla 모델. ※ RTX 계열의 팬이 있는 모델을 사용하면 56%같은 숫자와 %로 표기. 4. Name Nvidia GPU Model(A100-SXM-80GB) 5. Temp GPU의 현재 온도를 표시 합니다. 41C 6. Perf(Perfor..