엔비디아에서 만든 Simba 라는 multi-chip 딥러닝 가속 아키텍쳐에 관한 논문이다. Multi-chip과 AI 가속기의 개념이 결합되어 있다는 점이 특징이다. 논문 읽으면서 정리한 노트를 사진으로 첨부했다.

Introduction (이론적 배경 및 problem suggestion)

simba_1

Structure of Simba

simba_2 simba_3

Characterization: Sensitivity

simba_4 simba_5

Non-uniform tiling methods of Simba

(아래 사진에서 Non-uniform tiling methods 라 되어 있는 곳 이전 부분은 위의 chapter에 속함) simba_6 simba_7

Implementation

Simba의 실제 implementation과 그에 대한 data를 제시한 논문은 아래의 논문이다. 아래 논문은 특별히 정리할 건 없고 implementation을 함축적으로 정리해놓은 짧은 논문이다. simba_8

Leave a comment