'볼타' 태그의 글 목록

'볼타'에 해당되는 글 2건

2018.03.28 NVIDIA, Volta 아키텍처 기반 프로 GPU "Quadro GV100" 발표 by 랩터 인터내셔널
2017.06.24 엔비디아 볼타 Tesla V100의 PCI Ex 버전 연내 투입 by 랩터 인터내셔널

NVIDIA, Volta 아키텍처 기반 프로 GPU "Quadro GV100" 발표

글로벌 IT 뉴스 : 2018. 3. 28. 16:48

NVIDIA는 인공지능/딥러닝(심층 학습) 관련 테크놀로지 이벤트 "GTC 2018"을 미국 캘리포니아주 새너제이에 있는 산호세 컨벤션 센터에서 3월 26일~29일 4일간 개최하고 있다.

2일째인 3월 27일에는 CEO 젠슨황의 기조 강연이 열리며 프로페셔널을 대상으로 하는 GPU인 쿼드로(Quadro)의 최신 제품 "Quadro GV100"이 발표됐다.

그 동안의 하이엔드 모델은 Pascal 아키텍처의 GP100을 바탕으로 한 Quadro GP100이었으나 Quadro GV100에서는 후계 아키텍처 "Volta"를 채용, 32GB HBM2 메모리를 탑재한 GV100기반의 제품이다. 가격은 8,999달러.

Quadro 시리즈는 3D CAD 등의 프로페셔널에게 판매하는 GPU. Quadro의 기존 하이엔드 제품은 Pascal 기반의 Quadro GP100으로 3,584CUDA 코어, 16GB HBM2로 FP16(반정밀도)의 처리 능력이 20.7TFLOPS, FP32(단정밀도)의 처리 능력이 10.3TFLOPS 였다.

그것에 비해 Quadro GV100은 지난해(2017년) GTC에서 발표된 Volta 아키텍처의 GV100 기반으로 되어 있어며 이번 GTC에 Tesla V100 32GB GPU로 발표된 GV100의 32GB 버전이 바탕이 되는 프레임 버퍼는 Quadro GP100의 16GB에서 32GB로 강화됐다.

또 Quadro GP100과 같이 NVLink를 지원. 최대 2기의 GPU를 페어로 구성하여 1기의 GPU로 다루는 구조를 지원해 그때는 합계 64GB의 프레임 버퍼를 공통의 메모리 공간으로 활용할 수 있다.

처리 능력은 FP16(반정밀도)의 처리 능력이 29.6TFLOPS, FP32(단정밀도)의 성능이 14.8TFLOPS. 또 1장시 32GB, 2장시 64GB의 대용량 메모리를 이용할 수 있는 이점도 있다.

	Quadro GP100	Quadro GV100
CUDA 코어	3,584	5,120
메모리	16GB(HBM2)	32GB(HBM2)
FP16	20.7TFLOPS	29.6TFLOPS
FP32	10.3TFLOPS	14.8TFLOPS

Quadro GV100에서는 GDC에서 발표한 실시간 광선 추적 기능인 "NVIDIA RTX기술"도 지원된다. 광선 추적이란 현실적인 라이팅, 반사를 재현하면서 통상적인 3D 렌더링을 초월하는 사실감을 표현할 수 있다. 광선 추적은 부하가 높아 렌더링에는 레이턴시를 고려할 필요가 있는데 실시간 광선 추적이 사실적 묘사를 실시간으로 표시한다.

가전 전용에서는 3D 게임 등에서, 프로용의 경우에는 가령 자동차 메이커라는 제조업에서 설계시 RTX를 이용해 실차와 같은 외형의 표시 품질로 CAE(Computer Aided Engineering)를 하고 현실과 같은 자연 환경(날씨 등)을 재현하여 표시시키는 사용법이 가능하게 된다.

Quadro GV100의 판매는 앞으로 NVIDIA의 다이렉트 판매 사이트에서 시작된다. 4월부터는 Dell EMC, HP, Lenovo, 후지쯔 등의 워크스테이션 업체 등에서 판매되며 미국에서는 PNY, 일본에서는 ELSA나 료요 등의 AIC 파트너 및 판매 대리점 경유로도 제공할 예정이다.

출처 - https://pc.watch.impress.co.jp/docs/news/event/1113769.html

저작자표시 비영리 변경금지

'글로벌 IT 뉴스' 카테고리의 다른 글

모바일 커피레이크 Core i7-8750H 탑재, 에이수스 Zephyrus GX501 출시 (0)	2018.04.01
에이서, 게이밍 수퍼 노트북 "뉴 프레데터 헬리오스 500" 출시 (0)	2018.04.01
NVIDIA 인공지능 딥러닝 추론 가속기 및 TensorRT4 정보 (0)	2018.03.28
애플, 9.7인치 신형 아이패드 발표 - 애플 펜슬 지원 (0)	2018.03.28
화웨이, 트리플 수퍼 카메라 탑재 P20 Pro 발표 (0)	2018.03.28

Posted by 랩터 인터내셔널

Trackback() : Comment ()

엔비디아 볼타 Tesla V100의 PCI Ex 버전 연내 투입

글로벌 IT 뉴스 : 2017. 6. 24. 16:12

미국 NVIDIA는 19일(미국 시간) PCI Express 카드 버전 GPU 액셀러레이터 "Tesla V100"을 발표했다.

이미 SXM2 버전과 함께 PCIe 버전이 존재하는 것이 발표됐으며 이번 발표에서 사양의 상세 내용이 밝혀졌다.

CUDA 코어과 딥 러닝 연산에 특화된 Tensor 코어의 수는 PCIe/SXM2 버전과 공통이지만 PCIe 버전은 소비 전력이 SXM2 버전의 300W에서 250W로 감소되고 연산 성능도 SXM2에서 약간 떨어졌다. 이는 Pascal 아키텍처를 채용한 "Tesla P100"과 같은 구성이다.

PCIe 버전 Tesla V100의 발매 시기를 NVIDIA는 Hewlett Packard Enterprise 등의 리셀러 파트너부터 올해 안에 제공된다고 밝혔다.

모델	Tesla V100 PCIe	Tesla V100 SXM2	Tesla P100 PCIe	Tesla P100 SXM2
아키텍처	Volta		Pascal
프로세스	12 nm FFN		16 nm FinFET+
트랜지스터 수	21.1억		15.3억
CUDA 코어 수	5,120		3,584
Tensor 코어 수	640		-
베이스 클럭	?		1,126MHz	1,328MHz
부스트 클럭	?	1,455 MHz	1,303MHz	1,480 MHz
배정밀도 성능(FP64)	7 TFLOPs	7.5 TFLOPs	4.7 TFLOPs	5.3TFLOPs
단정밀도 성능(FP32)	14 TFLOPs	15 TFLOPs	9.3 TFLOPs	10.6 TFLOPs
반정밀도 성능(FP16)	-		18.7 TFLOPs	21.2 TFLOPs
Tensor 연산 성능	112 TFLOPs	120 TFLOPs	-
메모리	4,096-bit HBM2 16GB		3,072-bit HBM2 12GB 4,096-bit HBM2 16GB	4,096-bit HBM2 16GB
메모리 대역	900 GB/s		549 GB/s (12GB HBM2) 732 GB/s (16GB HBM2)	732 GB/s
접속 인터페이스	PCI Express 3.0	NVLink	PCI Express 3.0	NVLink
폼 팩터	PCIe FHFL	SXM2	PCIe FHFL	SXM2
소비 전력	250W	300W	250W	300W

저작자표시 비영리 변경금지

'글로벌 IT 뉴스' 카테고리의 다른 글

이매지네이션 테크놀로지, 그룹 전체의 매각 검토 (0)	2017.06.24
엔씨소프트 리니지M, 국내 모바일 게임 시장의 "새로운 역사" (0)	2017.06.24
AMD Vega10 채용 Radeon Instinct MI25 사양 공개 (0)	2017.06.24
마이크로소프트 서피스 랩톱 분해, 스펙 확인하기 (0)	2017.06.17
아이픽스잇, 신형 서피스 프로 분해 사진 공개 (0)	2017.06.17