SYSTEMS/GPU
[NVIDIA] GPU 내용 정리
CRAY KOREA Blog
2024. 1. 13. 17:10
1. GPU 용도별 분류
구분 | 설명 | 비고 |
Tesla | Server용 | |
Quadro | Workstaion용 | |
GeForce | PC용 |
2. GPU ARCHITECTURE History
GPU Architecture | 출시 | GPU archs | 주요 제품 종류 | 비고 |
Fermi | 2010 | sm_20 | ||
Kepler | 2012 | sm_30, sm_35, sm_37 |
Quadro: K2000, K4000, K4200, K5000, K5200, K6000 Tesla: K10, K20, K20x, K20Xm, K20c, K20s, K40m, K40c, K40s, K40st, K40t, K80, K520 |
|
Maxwell | 2014 | sm_50, sm_52, sm_53 |
Quadro: K2200, M2000, M4000, M5000, M6000 Tesla: M60, M40, M6, M4 |
|
Pascal | 2016 | sm_60, sm_61, sm_62 |
Quadro: P2000, P4000, P5000, P6000, GP100 Tesla: P100, P40, P4 |
|
Volta | 2017 | sm_70, sm_72 |
V100 | |
Turing | 2018 | sm_75 | T4, T4G | |
Ampere | 2020 | sm_80, sm_86 |
A800, A100, A40, A30, A16, A10, A10G, A2, AX800 | |
Hopper | 2022 | sm_90 | H100, H800 | |
Grace Hopper | 2023 | GH200 | ||
Ada Lovelace | 2023 | L40, L4 | ||
Blackwell | 2024 | B100 |
구분 | 설명 | 비고 |
SM(Streaming Multiprocessors) | 8개의 SP로 구성 | |
SP(Scalar Processor) | GPU의 기본단위, GPU architecture에 따라 n개의 threads로 구성 | CUDA Core |
- A100 (GA100) SM architecture
※ 사진 출처 : https://developer.nvidia.com/blog/nvidia-ampere-architecture-in-depth
구분 | 설명 | 비고 |
GRID | Thread Block의 묶음 | |
Thread Block | Thread의 묶음 | |
Thread | 최소 명령어 처리 단위 |
- 폼 팩터 구분
A100 SXM | A100 PCIe |
※ 사진 출처 : https://www.nvidia.com/ko-kr/data-center/a100
- HPE용 NVIDIA A100 HGX x8 GPU 공랭식 베이스보드
3. CUDA 버전 확인 방법
$ nvcc --version |
4. NVIDIA 드라이버 버전 확인
$ cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 450.51.06 Sun Jul 19 20:02:54 UTC 2020 GCC version: gcc version 7.5.0 (Ubuntu 7.5.0-3ubuntu1~18.04) |
$ nvidia-smi --query-gpu=driver_version --format=csv,noheader 450.51.06 450.51.06 450.51.06 450.51.06 450.51.06 450.51.06 450.51.06 450.51.06 |