2022. 11. 16. 20:29ㆍCUDA
스트리밍 프로세서(SP)
SP는 GPU에서 사실상의 연산을 하는 코어 유닛. SP에는데이터를 연산하기 위한 레지스터와 실수 계산을 하기 위한 FPU(FP), 정수 계산을 하는 ALU(int), 데이터를 load/store 하기 위한 LSU(move,cmp)를 갖추고 있음. 하나의 SP는 CUDA프로그램에서 4개의 스레드를 동작시킴.
스트리밍 멀티프로세서(SM)
여러 SP가 모여 SM을 구성함. SM은 SP를 제어하고 명령어 캐시와 데이터 캐시를 가지고 있음. 공유 메모리는 SP가 서로 데이터를 공유하고 빠르게 사용할 수 있는 메모리로 L1 캐시의 성능을 발휘함. SM하나에 담긴 특수 기능 유닛(SFU, Special Function Unit)은 2개다. SFU는 사인, 코사인, 역수, 제곱근 등의 특수 연산을 수행하며 Graphic interpolation 기능 또한 SFU에서 수행함. MT issue 는 SM 내에 있는 SP와 SFU에 명령을 전달함.
텍스처/프로세서 클러스터(TPC)
TPC는 SM을 제외하고 텍스처 캐시와 지오메트리 엔진을 담고 있음.
그래픽 프로세서 유닛(GPU)
SM당 SP의 수 * SM의 수 *TPC 수 = 코어의 수
On chip processor, Off chip processor
L1 캐시 : On chip processor. 빠르게 동작하며 용량이 작음
DRAM : Off chip processor. 느리게 동작하며 용량이 큼
'CUDA' 카테고리의 다른 글
메모리 아키텍처 (0) | 2022.11.22 |
---|---|
스레드 스케줄링 Thread Scheduling (0) | 2022.11.22 |
스레드 블록 아키텍처 Thread Block Architecture (0) | 2022.11.16 |
CUDA C (0) | 2022.11.16 |
CUDA 기본 (0) | 2022.11.15 |