'Tesla V100'에 해당되는 글 2건

  1. 2018.06.03 NVIDIA, Tesla V100 기반 고성능 GPU 서버 HGX-2 발표 by 랩터 인터내셔널
  2. 2017.06.24 엔비디아 볼타 Tesla V100의 PCI Ex 버전 연내 투입 by 랩터 인터내셔널


미국 엔비디아(NVIDIA)는 GTC Taiwan에서 신형 GPU 서버 플랫폼 HGX-2를 발표했다.


발표된 HGX-2는 기존 HGX-1가 Tesla V100을 8기 탑재했으나 HGX-2는 Tesla V100 16기를 12기의 NVSwtich로 네트워크 연결하여 2.4TB/s의 대역폭을 실현하는 것이 특징으로, CUDA 코어 수는 총 81920, 텐서 코어는 총 10240코어, GPU 메모리 용량은 512GB에 육박하며 부동 소수점 연산 성능은 250TFLOPS, 배정밀도 125TFLOPS, Tensor 연산에서 2PFLOPS의 연산 성능을 실현하며 INT8 연산도 대응한다.





엔비디아는 인텔의 제온 골드 6140(18코어/36스레드, 듀얼 소켓)과 비교해 300배의 성능을 강조하고 있으며 인공지능 학습에 관한 ResNet-50 벤치마크에서 초당 15500 처리 속도를 달성했다고 밝혔다. 

반응형
Posted by 랩터 인터내셔널

미국 NVIDIA는 19일(미국 시간) PCI Express 카드 버전 GPU 액셀러레이터 "Tesla V100"을 발표했다.


이미 SXM2 버전과 함께 PCIe 버전이 존재하는 것이 발표됐으며 이번 발표에서 사양의 상세 내용이 밝혀졌다.


CUDA 코어과 딥 러닝 연산에 특화된 Tensor 코어의 수는 PCIe/SXM2 버전과 공통이지만 PCIe 버전은 소비 전력이 SXM2 버전의 300W에서 250W로 감소되고 연산 성능도 SXM2에서 약간 떨어졌다. 이는 Pascal 아키텍처를 채용한 "Tesla P100"과 같은 구성이다.


PCIe 버전 Tesla V100의 발매 시기를 NVIDIA는 Hewlett Packard Enterprise 등의 리셀러 파트너부터 올해 안에 제공된다고 밝혔다.



모델Tesla V100 PCIeTesla V100 SXM2Tesla P100 PCIeTesla P100 SXM2
아키텍처VoltaPascal
프로세스12 nm FFN16 nm FinFET+
트랜지스터 수21.1억15.3억
CUDA 코어 수5,1203,584
Tensor 코어 수640-
베이스 클럭?1,126MHz1,328MHz
부스트 클럭?1,455 MHz1,303MHz1,480 MHz
배정밀도 성능(FP64)7 TFLOPs7.5 TFLOPs4.7 TFLOPs5.3TFLOPs
단정밀도 성능(FP32)14 TFLOPs15 TFLOPs9.3 TFLOPs10.6 TFLOPs
반정밀도 성능(FP16)-18.7 TFLOPs21.2 TFLOPs
Tensor 연산 성능112 TFLOPs120 TFLOPs-
메모리4,096-bit HBM2 16GB3,072-bit HBM2 12GB
4,096-bit HBM2 16GB
4,096-bit HBM2 16GB
메모리 대역900 GB/s549 GB/s (12GB HBM2)
732 GB/s (16GB HBM2)
732 GB/s
접속 인터페이스PCI Express 3.0NVLinkPCI Express 3.0NVLink
폼 팩터PCIe FHFLSXM2PCIe FHFLSXM2
소비 전력250W300W250W300W


반응형
Posted by 랩터 인터내셔널