SYSTEMS/GPU

[NVIDIA] GPU 내용 정리

CRAY KOREA Blog 2024. 1. 13. 17:10

1. GPU 용도별 분류

구분 설명 비고
Tesla Server용  
Quadro Workstaion용  
GeForce PC용  

 

2. GPU ARCHITECTURE History

GPU Architecture 출시 GPU archs 주요 제품 종류 비고
Fermi 2010 sm_20    
Kepler 2012 sm_30,
sm_35,
sm_37
Quadro: K2000, K4000, K4200, K5000, K5200, K6000
Tesla: K10, K20, K20x, K20Xm, K20c, K20s, K40m, K40c, 
           K40s, K40st, K40t, K80, K520
 
Maxwell 2014 sm_50,
sm_52,
sm_53
Quadro: K2200, M2000, M4000, M5000, M6000
Tesla: M60, M40, M6, M4
 
Pascal 2016 sm_60,
sm_61,
sm_62
Quadro: P2000, P4000, P5000, P6000, GP100
Tesla: P100, P40, P4
 
Volta 2017 sm_70,
sm_72
V100  
Turing 2018 sm_75 T4, T4G  
Ampere 2020 sm_80,
sm_86
A800, A100, A40, A30, A16, A10, A10G, A2, AX800  
Hopper 2022 sm_90 H100, H800  
Grace Hopper 2023   GH200  
Ada Lovelace 2023   L40, L4  
Blackwell 2024   B100  

 

구분 설명 비고
SM(Streaming Multiprocessors)  8개의 SP로 구성  
SP(Scalar Processor) GPU의 기본단위,  GPU architecture에 따라 n개의 threads로 구성 CUDA Core

 

- A100 (GA100) SM architecture

※ 사진 출처 : https://developer.nvidia.com/blog/nvidia-ampere-architecture-in-depth

 

구분 설명 비고
GRID Thread Block의 묶음  
Thread Block Thread의 묶음  
Thread 최소 명령어 처리 단위  

 

- 폼 팩터 구분

A100 SXM A100 PCIe

※ 사진 출처 : https://www.nvidia.com/ko-kr/data-center/a100

 

 

- HPE용 NVIDIA A100 HGX x8 GPU 공랭식 베이스보드

 

3. CUDA 버전 확인 방법

 $ nvcc --version

 

4. NVIDIA 드라이버 버전 확인

 $ cat /proc/driver/nvidia/version 
 NVRM version: NVIDIA UNIX x86_64 Kernel Module  450.51.06  Sun Jul 19 20:02:54 UTC 2020
 GCC version:  gcc version 7.5.0 (Ubuntu 7.5.0-3ubuntu1~18.04)

 

 $ nvidia-smi --query-gpu=driver_version --format=csv,noheader
 450.51.06
 450.51.06
 450.51.06
 450.51.06
 450.51.06
 450.51.06
 450.51.06
 450.51.06