'볼타'에 해당되는 글 2건

  1. 2018.03.28 NVIDIA, Volta 아키텍처 기반 프로 GPU "Quadro GV100" 발표 by 랩터 인터내셔널
  2. 2017.06.24 엔비디아 볼타 Tesla V100의 PCI Ex 버전 연내 투입 by 랩터 인터내셔널

NVIDIA는 인공지능/딥러닝(심층 학습) 관련 테크놀로지 이벤트 "GTC 2018"을 미국 캘리포니아주 새너제이에 있는 산호세 컨벤션 센터에서 3월 26일~29일 4일간 개최하고 있다.


2일째인 3월 27일에는 CEO 젠슨황의 기조 강연이 열리며 프로페셔널을 대상으로 하는 GPU인 쿼드로(Quadro)의 최신 제품 "Quadro GV100"이 발표됐다.


그 동안의 하이엔드 모델은 Pascal 아키텍처의 GP100을 바탕으로 한 Quadro GP100이었으나 Quadro GV100에서는 후계 아키텍처 "Volta"를 채용, 32GB HBM2 메모리를 탑재한 GV100기반의 제품이다. 가격은 8,999달러.


Quadro 시리즈는 3D CAD 등의 프로페셔널에게 판매하는 GPU. Quadro의 기존 하이엔드 제품은 Pascal 기반의 Quadro GP100으로 3,584CUDA 코어, 16GB HBM2로 FP16(반정밀도)의 처리 능력이 20.7TFLOPS, FP32(단정밀도)의 처리 능력이 10.3TFLOPS 였다.


그것에 비해 Quadro GV100은 지난해(2017년) GTC에서 발표된 Volta 아키텍처의 GV100 기반으로 되어 있어며 이번 GTC에 Tesla V100 32GB GPU로 발표된 GV100의 32GB 버전이 바탕이 되는 프레임 버퍼는 Quadro GP100의 16GB에서 32GB로 강화됐다.


또 Quadro GP100과 같이 NVLink를 지원. 최대 2기의 GPU를 페어로 구성하여 1기의 GPU로 다루는 구조를 지원해 그때는 합계 64GB의 프레임 버퍼를 공통의 메모리 공간으로 활용할 수 있다.


처리 능력은 FP16(반정밀도)의 처리 능력이 29.6TFLOPS, FP32(단정밀도)의 성능이 14.8TFLOPS. 또 1장시 32GB, 2장시 64GB의 대용량 메모리를 이용할 수 있는 이점도 있다.


Quadro GP100Quadro GV100
CUDA 코어3,5845,120
메모리16GB(HBM2)32GB(HBM2)
FP1620.7TFLOPS29.6TFLOPS
FP3210.3TFLOPS14.8TFLOPS


Quadro GV100에서는 GDC에서 발표한 실시간 광선 추적 기능인 "NVIDIA RTX기술"도 지원된다. 광선 추적이란 현실적인 라이팅, 반사를 재현하면서 통상적인 3D 렌더링을 초월하는 사실감을 표현할 수 있다. 광선 추적은 부하가 높아 렌더링에는 레이턴시를 고려할 필요가 있는데 실시간 광선 추적이 사실적 묘사를 실시간으로 표시한다.


가전 전용에서는 3D 게임 등에서, 프로용의 경우에는 가령 자동차 메이커라는 제조업에서 설계시 RTX를 이용해 실차와 같은 외형의 표시 품질로 CAE(Computer Aided Engineering)를 하고 현실과 같은 자연 환경(날씨 등)을 재현하여 표시시키는 사용법이 가능하게 된다.


Quadro GV100의 판매는 앞으로 NVIDIA의 다이렉트 판매 사이트에서 시작된다. 4월부터는 Dell EMC, HP, Lenovo, 후지쯔 등의 워크스테이션 업체 등에서 판매되며 미국에서는 PNY, 일본에서는 ELSA나 료요 등의 AIC 파트너 및 판매 대리점 경유로도 제공할 예정이다.


출처 - https://pc.watch.impress.co.jp/docs/news/event/1113769.html

반응형
Posted by 랩터 인터내셔널

미국 NVIDIA는 19일(미국 시간) PCI Express 카드 버전 GPU 액셀러레이터 "Tesla V100"을 발표했다.


이미 SXM2 버전과 함께 PCIe 버전이 존재하는 것이 발표됐으며 이번 발표에서 사양의 상세 내용이 밝혀졌다.


CUDA 코어과 딥 러닝 연산에 특화된 Tensor 코어의 수는 PCIe/SXM2 버전과 공통이지만 PCIe 버전은 소비 전력이 SXM2 버전의 300W에서 250W로 감소되고 연산 성능도 SXM2에서 약간 떨어졌다. 이는 Pascal 아키텍처를 채용한 "Tesla P100"과 같은 구성이다.


PCIe 버전 Tesla V100의 발매 시기를 NVIDIA는 Hewlett Packard Enterprise 등의 리셀러 파트너부터 올해 안에 제공된다고 밝혔다.



모델Tesla V100 PCIeTesla V100 SXM2Tesla P100 PCIeTesla P100 SXM2
아키텍처VoltaPascal
프로세스12 nm FFN16 nm FinFET+
트랜지스터 수21.1억15.3억
CUDA 코어 수5,1203,584
Tensor 코어 수640-
베이스 클럭?1,126MHz1,328MHz
부스트 클럭?1,455 MHz1,303MHz1,480 MHz
배정밀도 성능(FP64)7 TFLOPs7.5 TFLOPs4.7 TFLOPs5.3TFLOPs
단정밀도 성능(FP32)14 TFLOPs15 TFLOPs9.3 TFLOPs10.6 TFLOPs
반정밀도 성능(FP16)-18.7 TFLOPs21.2 TFLOPs
Tensor 연산 성능112 TFLOPs120 TFLOPs-
메모리4,096-bit HBM2 16GB3,072-bit HBM2 12GB
4,096-bit HBM2 16GB
4,096-bit HBM2 16GB
메모리 대역900 GB/s549 GB/s (12GB HBM2)
732 GB/s (16GB HBM2)
732 GB/s
접속 인터페이스PCI Express 3.0NVLinkPCI Express 3.0NVLink
폼 팩터PCIe FHFLSXM2PCIe FHFLSXM2
소비 전력250W300W250W300W


반응형
Posted by 랩터 인터내셔널