[NVIDIA] GPU 내용 정리

SYSTEMS/GPU

[NVIDIA] GPU 내용 정리

CRAY KOREA Blog 2024. 1. 13. 17:10

1. GPU 용도별 분류

구분	설명	비고
Tesla	Server용
Quadro	Workstaion용
GeForce	PC용

2. GPU ARCHITECTURE History

GPU Architecture	출시	GPU archs	주요 제품 종류	비고
Fermi	2010	sm_20
Kepler	2012	sm_30, sm_35, sm_37	Quadro: K2000, K4000, K4200, K5000, K5200, K6000 Tesla: K10, K20, K20x, K20Xm, K20c, K20s, K40m, K40c, K40s, K40st, K40t, K80, K520
Maxwell	2014	sm_50, sm_52, sm_53	Quadro: K2200, M2000, M4000, M5000, M6000 Tesla: M60, M40, M6, M4
Pascal	2016	sm_60, sm_61, sm_62	Quadro: P2000, P4000, P5000, P6000, GP100 Tesla: P100, P40, P4
Volta	2017	sm_70, sm_72	V100
Turing	2018	sm_75	T4, T4G
Ampere	2020	sm_80, sm_86	A800, A100, A40, A30, A16, A10, A10G, A2, AX800
Hopper	2022	sm_90	H100, H800
Grace Hopper	2023		GH200
Ada Lovelace	2023		L40, L4
Blackwell	2024		B100

구분	설명	비고
SM(Streaming Multiprocessors)	8개의 SP로 구성
SP(Scalar Processor)	GPU의 기본단위, GPU architecture에 따라 n개의 threads로 구성	CUDA Core

- A100 (GA100) SM architecture

※ 사진 출처 : https://developer.nvidia.com/blog/nvidia-ampere-architecture-in-depth

구분	설명	비고
GRID	Thread Block의 묶음
Thread Block	Thread의 묶음
Thread	최소 명령어 처리 단위

- 폼 팩터 구분

A100 SXM	A100 PCIe

※ 사진 출처 : https://www.nvidia.com/ko-kr/data-center/a100

- HPE용 NVIDIA A100 HGX x8 GPU 공랭식 베이스보드

3. CUDA 버전 확인 방법

$ nvcc --version

4. NVIDIA 드라이버 버전 확인

$ cat /proc/driver/nvidia/version
NVRM version: NVIDIA UNIX x86_64 Kernel Module 450.51.06 Sun Jul 19 20:02:54 UTC 2020
GCC version: gcc version 7.5.0 (Ubuntu 7.5.0-3ubuntu1~18.04)

$ nvidia-smi --query-gpu=driver_version --format=csv,noheader
450.51.06
450.51.06
450.51.06
450.51.06
450.51.06
450.51.06
450.51.06
450.51.06