일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- CPU
- rhel
- Linux
- 1.9
- java
- ubuntu
- LUSTRE
- 1.10
- HPFSS
- PBS
- gpfs
- patch
- Cray
- GPU
- client
- HPE
- build
- Singularity
- Source
- HPCM
- SLURM
- Docker
- v1.9
- AMD
- PFSS
- version
- CUDA
- hpcm패치
- infiniband
- nvidia
- Today
- Total
목록nvidia (6)
HPE CRAY 자료 공유
GPU HBM 자료 공유 - 출처: Press Center | TrendForce - Market research, price trend of DRAM, NAND Flash, LEDs, TFT-LCD and green energy, PV
1. GPU 용도별 분류 구분 설명 비고 Tesla Server용 Quadro Workstaion용 GeForce PC용 2. GPU ARCHITECTURE History GPU Architecture 출시 GPU archs 주요 제품 종류 비고 Fermi 2010 sm_20 Kepler 2012 sm_30, sm_35, sm_37 Quadro: K2000, K4000, K4200, K5000, K5200, K6000 Tesla: K10, K20, K20x, K20Xm, K20c, K20s, K40m, K40c, K40s, K40st, K40t, K80, K520 Maxwell 2014 sm_50, sm_52, sm_53 Quadro: K2200, M2000, M4000, M5000, M6000 Tesl..
- Switch Management Software for NVIDIA InfiniBand NDR 64-port OSFP Managed Power to Connector Airflow Switch (HPE Part Number P45692-B21) 날짜 MLNX-OS 버전 경로 2023.10.03 3.11.1014 https://support.hpe.com/connect/s/softwaredetails?language=en_US&softwareId=MTX_1488dac1f95b4d4a84b4ec264c - NDR Switch ※참고: 전면 사진은 Unmanaged Switch ※ 실제 32개의 OSFP port를 가지고 있음. - NDR Cables - 참고자료: https://docs.nvidia.co..
- 원인: Nvidia HPC Sdk에서 "libatomic.so.1" 라이브러리를 필요로 하지만 RedHat 8의 "Development Tools" group에 libatomic 라이브러리 미포함 - 오류 내용#1 # mpicc --version /apps/nvidia/hpc_sdk/Linux_x86_64/22.11/comm_libs/openmpi/openmpi-3.1.5/bin/.bin/mpicc: error while loading shared libraries: libatomic.so.1: cannot open shared object file: No such file or directory - 오류 내용#2 # ldd /apps/nvidia/hpc_sdk/Linux_x86_64/22.11/co..
1. 테스트 환경 HPE HPC Partner Lab znode44 2. Dockerfile 작성 및 build Dockerfile 예시 FROM tensorflow/tensorflow:latest-gpu RUN pip install tensorflow_dataset 후술하겠지만 docker 를 사용자 계정으로 실행하면 docker image에 python 패키지 설치가 용이하지 않음. 먼저 Dockerfile 을 작성하고 빌드 $ docker build -t 이미지:태그 3. slurm interactive 할당 $ srun -p short -N 1 -n 1 -w znode44 --pty bash 4. (nvidia) docker command (znode44 에서) $ docker run -u $(i..
nvidia-smi 실행 화면 1. Driver Version - 현재 설치되어 있는 nvidia driver version을 확인 할 수 있습니다. Driver Version: 460.27.04 2. CUDA Version - 현재 드라이버 버전과 맞는 cuda 추천 버전(주의: 절대 현재 설치되어 있는 버전이 아님) CUDA Version: 11.2 3. GPU/FAN 설치되어 있는 GPU number FAN N/A(Not Available) fan이 없는 Tesla 모델. ※ RTX 계열의 팬이 있는 모델을 사용하면 56%같은 숫자와 %로 표기. 4. Name Nvidia GPU Model(A100-SXM-80GB) 5. Temp GPU의 현재 온도를 표시 합니다. 41C 6. Perf(Perfor..