미국 AMD는 HPC 시스템 전용의 GPU 액셀러레이터 "Radeon Instinct MI25/MI8/MI6"의 사양을 공개했다.


머신 러닝과 딥 러닝 훈련 및 추론 처리 이용을 상정한 액셀러레이터로 2016년 말에 발표된 제품이지만 서버용 프로세서 "EPYC"의 사양 공개에 맞추어 사양의 상세 내용이 밝혀졌다.


최상위 Radeon Instinct MI25는 "Vega10" 코어를 채용하여 단정밀도 부동 소수점 연산(FP32)에서 12.3 TFLOPS, 반정밀도 부동 소수점 연산(FP16)에서 24.6 TFLOPS의 처리 성능을 강조한다.


5월에 발표되고 있는 "Radeon Vega Frontier Edition"도 Vega10 코어를 채용하지만 FP32는 13 TFLOPS로 되어 있어 근소하게 클럭 등에 차이가 있다고 보인다.


Radeon Instinct MI8 및 MI6은 각각 Fiji 아키텍처와 Polaris 아키텍처를 채용하고 있다. 세부 사양은 다음 표 참조.


출처 - http://pc.watch.impress.co.jp/docs/news/1066581.html


모델Radeon Instinct MI25Radeon Instinct MI8Radeon Instinct MI6Radeon Vega Frontier EditionTesla V100 PCIeTesla P100 PCIe (16GB 버전)
아키텍처Vega10FijiPolarisVega10VoltaPascal
코어 수4,0962,3044,0965,1203,584
배정밀도 성능(FP64)768 GFLOPS512 GFLOPS358 GFLOPS?7 TFLOPS4.7 TFLOPS
단정밀도 성능(FP32)12.3 TFLOPS8.2 TFLOPS5.7 TFLOPS13 TFLOPS14 TFLOPS9.3 TFLOPS
반정밀도 성능(FP16)24.6 TFLOPS8.2 TFLOPS5.7 TFLOPS25 TFLOPS-18.7 TFLOPS
메모리2,048-bit HBM2 16GB4,096-bit HBM1 4GB256-bit GDDR5 16GBHBM2 16GB4,096-bit HBM2 16GB4,096-bit HBM2 16GB
메모리 대역484 GB/s512 GB/s224 GB/s480 GBs/s900 GB/s732 GB/s
인터페이스PCI Express 3.0 x16PCI Express 3.0PCI Express 3.0PCI Express 3.0PCI Express 3.0
폼 팩터PCIe FHFL/2슬롯PCIe FHHL/2슬롯PCIe FHFL/1슬롯PCIe FHFL/2슬롯PCIe FHFL
소비전력300W175W150W?250W


반응형
Posted by 랩터 인터내셔널