인텔이 8월 15일 공식 Twitter에서 2020년에 발표 예정의 그래픽카드(디스크 리트 GPU) 소개 동영상을 공개했다.


AMD에서 라데온을 총괄하던 라자 코두리가 AMD를 퇴사하고 인텔로 이직하여 그가 이끄는 팀이 선보일 제품이며 세부적인 정보는 아직 공개되지 않았다.

반응형
Posted by 랩터 인터내셔널


세계 최정상 GPU 기업 엔비디아(NVIDIA)가 SIGGRAPH 기조 강연에서 새로운 GPU 아키텍처 Turing을 공식 발표했다. CEO 젠슨황은 Turing은 NVIDIA의 GeForce와 Quadro를 위한 새로운 GPU이며 과거 GTX 8800과 같이 혁신적인 제품이라고 설명했다.


엔비디아는 발표와 함께 Turing 아키텍처의 프로페셔널 제품으로 Quadro RTX를 공개했다. Quadro RTX의 최대 포인트는 세이더 프로세싱만 아니라 다른 처리 기능을 부가한 것으로서 CUDA 코어의 개수는 4608개로 연산 성능은 FP32에서 16TFLOPS, 딥러닝 텐서 코어(Tensor Core)의 성능은 INT4 500TOPS, 새로운 레이 트레이싱 액셀러레이터 RT 코어(RT Core)는 10Giga Rays/s, 또한 멀티 GPU를 위한 NVLink 2링크를 지원한다.


Turing 세대에서 레이 트레이싱 지원 하드웨어의 성능은 예상을 뛰어넘는다. 10Giga Rays/s라는 엄청난 성능으로 실시간 레이 트레이싱을 전통적 3D 렌더링과 같은 수준으로 실현해 버린다. 또한 RT 코어의 개요는 아직 정확하게 밝혀지지 않았으며 슬라이드에는 Ray Triangles Intersection, Bounding Volume Hierarchy Traversal로 설명하고 있다.


Project Sol: A Real-Time Cinematic Scene Powered by NVIDIA RTX


이러한 요소는 레이 트레이싱에서 처리량이 많은 부분을 액셀러레이터에서 처리하는 것을 의미하며 엔비디아가 본격적인 레이 트레이싱 액셀러레이터를 구현한 것이다. 엔비디아 자체적으로 실시간 레이 트레이싱에서 Turing은 기존 Pascal 아키텍처 대비 6배 고속이라고 밝혔다. 6배라는 차이는 전체 처리 시간을 비교한 것으로 딥러닝 기반의 DLAA를 포함한 시간이며 이 비교는 Microsoft의 DirectX Ray Tracing에서 비교됐다.


새로운 튜링 아키텍처는 12나노 프로세스가 적용되고, 186억 트랜지스터, 강력한 RT 코어를 갖추며 다이 사이즈는 754mm2로 기존 GP102의 471mm2 다이 사이즈보다 더 커지고 있다. CUDA 코어는 4608개로 연산 성능은 FP32에서 16TFLOPS, SM(Streaming Multiprocessor)은 64개의 CUDA 코어로 갖춰져 있다. SM 또한 새로운 설계가 적용되고 있는데 부동 소수점 연산 유닛과 정수 연산 유닛을 병렬로 동작시킬 수 있도록 변경되고 있기 때문에 기존의 SM 구성과 단순 성능 비교가 힘들다. 또, Turing은 처음으로 텐서 코어를 탑재하고 있다. 텐서 코어는 FP16, INT8, INT4, 추론 성향으로 8-bit 정수와 4-bit 정수가 지원됐다. INT8과 INT4는 SIMD(Single Instruction, Multiple Data)로 연산 성능은 각각 FP16의 2배와 4배나 많다.



메모리는 GDDR6가 탑재되어 전송 속도는 14Gbps, 메모리 인터페이스는 384-bit, 메모리 대역은 672GB/s로 확인됐다. 메모리 용량은 최대 48GB로 이는 GDDR6에서는 16Gb 용량의 칩이 양산되고 있기 때문이며 온 다이 L2 캐시를 6MB 탑재한다. 메모리 스펙도 레이 트레이싱에 유리한데 이는 레이 트레이싱에서 렌더링 하는 3D스페이스가 커지기 때문에 더 큰 메모리가 필요하며 메모리 접근 패턴이 보다 디테일하게 되는 경우가 많아 메모리 입도가 작은 쪽이 좋기 때문이다.


엔비디아는 칩 간 접속 기술로 NVLink를 개발했다. Turing에도 NVLink가 2링크 탑재되고 있으며 1링크에 50GB/s 쌍방향 대역으로 합계 100GB/s의 대역을 지원한다. Quadro RTX는 NVLink 인터페이스가 탑재되고 있어 NVLink 브리지를 연결해 2개의 카드를 100GB/s 대역으로 접속할 수 있다. 호스트와의 접속은 기존과 같이 PCI Express이며 2장의 카드에 의한 시스템의 메모리 용량은 최대 96GB 라는 계산이 된다. 디스플레이는 8K DisplayPort 지원 외 Virtuallink 지원이 추가됐다. 주로 VR(가상현실)용으로 USB type-C 경유로 비디오 출력과 제어의 단일화가 가능한 규격이다. 때문에 USB type-C의 PHY를 다이에 싣고 있다.


Turing은 GPU 진화가 새로운 단계로 접어든 것을 나타내고 있다. Turing 아키텍처를 보면 전통적인 CUDA 코어 보다 레이 트레이싱을 위한 RT 코어 하드웨어와 딥러닝을 위한 텐서 코어, 그리고 칩 간 접속을 위한 NVLink PHY 등을 보다 더 강화하고 있다. 이러한 방향은 그래픽 GPU의 진화 방향은 이제 단순히 세이더 프로세싱 성능 강화가 큰 의미가 없다는 것을 의미한다. 엔비디아는 전통적인 래스터 라이즈 파이프 라인의 증량이 아닌 레이 트레이싱과 딥러닝을 통합한 하이브리드 그래픽 파이프 라인 아키텍처 확립으로 새로운 GPU 방향을 제시하기 시작했다. 

반응형
Posted by 랩터 인터내셔널


AMD가 새롭게 발표한 라이젠 스레드리퍼2 시리즈의 벤치마크 자료입니다. (탐스 하드웨어)





Cores /
Threads
Base /
Boost (GHz)
L3 Cache
(MB)
PCIe 3.0
DRAM
TDP
MSRP
Price
Per Core
AMD
TR 2990WX
32 / 64
3.0 / 4.2
64
64 (4 to PCH)
Quad DDR4-2933
250W
$1,799$56
AMD
TR 2970WX
24 / 48
3.0 / 3.2
64
64 (4 to PCH)Quad DDR4-2933250W
$1,299
$54
Intel
Core i9-7980XE
18 / 36
2.6 / 4.4
24.75
44
Quad DDR4-2666
140W
$1,999
$111
AMD
TR 2950X
16 / 32
3.5 / 4.4
32
64 (4 to PCH)Quad DDR4-2933180W
$899
$56
AMD
TR 1950X
16 / 32
3.4 / 4.4
64
64 (4 to PCH)
Quad DDR4-2667
180W
$750
$47
Intel
Core i9-7960X
16 / 32
2.8 / 4.4
22
44
Quad DDR4-2666
140W
$1,699
$106
Intel
Core i9-7940X
14 / 28
3.1 / 4.3
19.25
44
Quad DDR4-2666165W
$1,199
$86
AMD
TR 2920X
12 / 24
3.5 / 4.3
32
64 (4 to PCH)Quad DDR4-2933180W
$649
$54
AMD
TR 1920X
12 / 24
3.5 / 4.2
64
64 (4 to PCH)
Quad DDR4-2667
180W
$399
$33
Intel
Core i9-7920X
12 / 24
2.9 / 4.4
16.50
44
Quad DDR4-2666
140W
$1,199
$100
Intel
Core i9-7900X
10 / 20
3.3 / 4.3
13.75
44
Quad DDR4-2666
140W
$999
$99
Intel
Core i7-7820X
8 / 16
3.6 / 4.3
11
28
Quad DDR4-2666
140W
$599
$75
AMD
TR 1900X
8 / 16
3.8 / 4.2
20
64 (4 to PCH)
Quad DDR4-2677
180W
$340
$42.5
Intel
Core i7-7800X
6 / 12
3.5 / 4.0
8.25
28
Quad DDR4-2400
140W
$389
$65
Intel
Core i7-7740X (EOL)
4 / 8
4.3 / 4.5
8
16
Dual DDR4-2666
112W
$350
$87.5
Intel
Core i5-7640X (EOL)
4 / 4
4.0 / 4.2
6
16
Dual DDR4-2666
112W
$243
$61


최상위 2990WX는 32코어 64스레드 구성, 베이스/부스트 클럭은 각각 3.0 / 4.2, L3 캐시는 64MB, PCIE 64레인 쿼드채널 DDR4-2933 메모리, TDP 250W 가격은 $1799


2970WX는 24코어 48스레드 구성, 베이스/부스트 클럭은 각각 3.0 / 3.2, L3 캐시는 64MB, PCIE 64레인 쿼드채널 DDR4-2933 메모리, TDP 250W 가격은 $1299


2950X는 16코어 32스레드 구성, 베이스/부스트 클럭은 각각 3.5 / 4.4, L3 캐시는 32MB, PCIE 64레인 쿼드채널 DDR4-2933 메모리, TDP 180W 가격은 $899


Image1

Image2

image002


image002


image002


image002


image002


image002


image002


image002


image004


image002


image006


image003


image005


image007


image009


image009


image008


image014


image011


image015


image016


image017


image023


image010


03-03 Workstation Compute Blender Rendering


03-06 Workstation Compute Luxrender Benchmark Console


출처 - https://www.tomshardware.com/

반응형
Posted by 랩터 인터내셔널


대만의 기술 사이트 BenchLife.info는 유출 된 문서를 통해 곧 출시 될 인텔의 프리미엄 LGA1151 프로세서에 대한 세부 정보를 공개했다.


지난번 뉴스보다 좀 더 흥미로운 것은 내장 그래픽을 탑재하고 있다는 점과 두 모델의 클럭 속도에 대한 중요한 정보를 제공하고 있는 것으로서 두 칩 모두 3.60GHz의 공칭 클럭 속도를 갖지만 터보 부스트 클럭이 다르다. i7-9700K는 1코어 최대 터보 부스트 (Turbo Boost) 클럭으로 4.90GHz를 제공하며 이 칩은 하이퍼 스레딩을 지원하지 않는 최초의 코어 i7 SKU모델이다. 이 칩의 2코어 부스트 클럭은 4.80GHz, 4코어 부스트는 최대 4.70GHz, 모든 코어는 4.60GHz를 제공한다. i9-9900K는 1코어 및 2 코어 모두 최대 5.00GHz의 부스트 클럭을 제공하며 4코어 부스트 상태는 4.80GHz, 모든 코어는 4.70GHz를 제공하기 때문에 상당히 높은 클럭으로 강력한 메리트를 제공할 것이다.


해당 정보는 인텔의 공식 정보가 아닌 "루머" 임을 참고

반응형
Posted by 랩터 인터내셔널


해외 어낸드텍(www.anandtech.com) 사이트에서 인텔의 최신 CPU 로드맵을 공개했다.

 

공개 내용에 따르면 인텔은 이미 알려진 캐스케이드 레이크(Cascade Lake)와 아이스 레이크(Ice Lake) 사이에 향상된 14나노 공정을 사용하는 새로운 쿠퍼 레이크(Cooper Lake)를 추가하고 있다. 쿠퍼 레이크는 BFLOAT16 (반 정밀도 부동 소수점 명령어)를 비롯하여 몇 가지 새로운 명령어가 보강되는 Deep Learning Boost 기능 세트가 탑재되며 전체적인 동작 클럭도 향상 될 것으로 보이고 있다.


인텔은 금년 말에 위스키 레이크(Whisky Lake, Coffee Lake Refresh)를 발표하고, 엔터프라이즈 부문에서는 캐스케이드 레이크 (Cascade Lake)를 발표한다. Cascade Lake는 옵테인 퍼시스턴트 메모리 지원, 보안 취약성에 대한 실리콘 레벨의 대응이 적용된다. 또한 VNNI(가변 길이 신경망 명령)으로 통칭되는 하드웨어 가속 신경망 네트워크 구축 / Deep Learning Boost 기능이 강화된다.


Data Type Representations
TypeBitsExponentFractionPrecisionRangeSpeed
float3232823HighHighSlow
float1616510LowLow2x Fast
bfloat161687LowerHigh2x Fast


출처 - https://www.anandtech.com/show/13194/intel-shows-xeon-2018-2019-roadmap-cooper-lakesp-and-ice-lakesp-confirmed

반응형
Posted by 랩터 인터내셔널

구글은 미국 시간으로 2018년 7월 24일부터 26일까지 샌프란시스코에서 Google Cloud Next 2018 행사를 개최했다. 이번 행사에서 주요 내용으로는 Google Kubernetes Engine, GCP의 BigQuery에 인공지능 머신러닝을 추가한 BigQuery ML, 에지 디바이스 딥러닝 전용 칩 Edge TPU 등이 주요 내용으로 발표됐다.


발표 내용 중 BigQuery ML은 GCP의 DWH 서비스인 BigQuery에 커스텀 머신러닝 모델 개발과 DWH 내부 데이터에 대한 추론을 실행하는 머신러닝 기능을 추가한 서비스로써 DWH 내부의 구조화 또는 반 구조화 된 데이터 세트를 대상으로 SQL 문을 사용하여 매출 예측이나 고객 세그먼트 작성 등의 예측 분석을 진행할 수 있다.




발표를 진행한 Rajen Sheth(Google Cloud Director of Product Management)는 DWH에서 머신러닝을 실행할 수 있기 때문에 데이터를 다른 프레임워크로 이동시킬 필요가 없다고 설명했다. 또 BigQuery ML은 단순한 SQL 문으로 머신러닝 모델을 구축, 배포할 수 있는 것이 특징이다. 데이터 분석가(과학자)는 적지만 SQL 문을 다루는 개발자는 많다. 세계에 존재하는 2000만명 정도의 개발자가 딥러닝이나 머신러닝을 활용할 수 있게 된다는 것.


BigQuery ML의 선행 도입 사례로는 미국 영화 회사 20th Century Fox가 소개됐다. Fox는 SQL로 선형 회귀 모델을 작성하고, BigQuery 내의 청중 데이터에서 프로그램별 시청 예측을 실행하고 있다. 추론 계산을 BigQuery 내에 몇 분만에 결과를 얻을 수 있다. 





BigQuery ML은 발표 당일부터 베타 버전을 사용할 수 있게 됐다. 또한 BigQuery 업데이트로 클러스터화 된 테이블을 작성하는 BigQuery clustering(베타), Google Earth 지리 공간 데이터와 BigQuery의 기능을 통합한 BigQuery GIS(퍼블릭 알파)가 발표되고 있다.





한편 에지 디바이스 딥러닝 전용 칩으로 Edge TPU가 발표됐다. Edge TPU는 구글이 지금까지 자사 데이터 센터의 서버에 탑재한 딥러닝 커스텀 칩 TPU(Tensor Processing Unit)을 에지 디바이스 기기용으로 소형화, 저전력화 것으로 심층 학습 프레임워크 TensorFlow의 경량 버전인 TensorFlow Lite를 이용하여 에지 디바이스 상에서 딥러닝 추론을 실행할 수 있다.


발표에서는 Edge TPU 실제품을 선보이며 컴플리언스와 사생활 관점에서 데이터를 클라우드로 보내지 않고 수집한 장소에서 처리하는 경우, 또는 네트워크가 필요없는 데이터를 위해 개발했다고 밝혔다. 




Edge TPU의 사이즈는 1센트에 4개 정도를 올릴수 있을 정도로 작고 2W 소비 전력으로 4TOPS의 연산 성능을 발휘한다. 네덜란드 NXP의 Arm CPU, Wi-Fi 모듈, I/O 포트 등을 탑재한 개발 키트에 포함한 형태로 2018년 10월부터 일반 발매될 예정이다.


또한 Edge TPU 전용 소프트웨어 스택으로 Cloud IoT Edge도 발표됐다. OS는 Android Things와 리눅스에 대응하고 TensorFlow Lite의 런타임 Edge ML, 게이트 웨이 기능으로 Edge IoT Core 2개의 컴포넌트로 구성된다. Edge IoT Core는 Edge TPU 탑재 장치를 GCP에 접속하는 기능으로 GCP 측에서 학습한 머신러닝 모델을 Edge TPU로 내보내고 Edge TPU 탑재 장치를 GCP에 접속하여 소프트웨어 및 펌웨어를 갱신할 수 있다.

반응형
Posted by 랩터 인터내셔널

세계 1위 소프트웨어 기업 미국 마이크로소프트(Microsoft)는 지난 6월, Project Natick 테스트를 공식적으로 발표했다. 이 테스트는 육지에 위치한 현행의 데이터 센터를 바다속에 구현하여 실증하는 것으로써 안정적인 운영이 검증 될 경우 전 세계 데이터 센터의 패러다임을 변화시킬수 있는 중요한 테스트로써 업계가 주목하고 있다. 


 

Project Natick은 길이 12.2m, 직경 2.8m 사이즈의 본체 내부에 864대의 서버(스토리지) 구성으로 합계 27.6PB 용량을 구현하고 있으며 내부를 건조한 상태로 유지하기 위해 질소가 채워졌다.


테스트는 스코틀랜드에서 떨어진 북해에서 진행되고 있으며 이 프로젝트의 핵심은 현행의 데이터 센터를 운용하기 위해서는 임대 비용, 전기 비용, 냉각 시스템 비용, 운영 인력 비용 등 막대한 비용이 필요하지만 이것을 차가운 바다속에 구축하고 인공지능 시스템을 도입 함으로써 "극적인 효율 향상"을 통한 "극적인 비용 절감"을 실현하는 것이다. 현재 정비성, 환경성, 경제성 등을 평가하는 단계로써  마이크로소프트에 따르면 5년 정도의 기간에 걸쳐 유지보수가 불 필요한 운용이 가능하다고 밝혔다.  


 


최근 마이크로소프트는 테스트 중인 장비에 장착한 카메라를 통해 바다속 상태의 실시간 라이브 영상을 공개했다. 카메라를 통해 장비의 실시간 상태와 환경적 영향을 관측하기 위함이다.


실시간 영상 보기 - https://natick.research.microsoft.com/


미래의 데이터 센터 방향에 영향을 줄 수 있는 마이크로소프트의 Project Natick 실증 실험에 전 세계가 주목할 필요성이 있다. 

반응형
Posted by 랩터 인터내셔널


ASUS는 중량 1.9kg의 게이밍 노트북 "FX570UD"를 8월 10일에 발매한다.


검은색에 빨간선이 엑센트가 된 디자인이 특징인 게이밍 노트북으로 두께를 21.9mm, 무게를 약 1.9kg로 휴대도 가능하다. 선반의 힌지부를 사다리꼴로 자르고 배열을 방해하지 않는 구조로 하여 방열성을 높이고, 독자적인 "IceCool" 기술에 의해 팜레스트 표면의 평균 온도를 36℃ 미만으로 막았다.


키보드는 스트로크 1.4mm를 확보하고 게임에서 사용 빈도가 높은 W/A/S/D 키를 강조 표시하는 동시에 악센트 컬러인 적색 LED 백 라이트를 탑재한다. 또 49분에 0부터 60%까지 급속 충전하는 기능, "SonicMaster"에 의한 음질을 향상시키는 기술도 탑재한다.


하위 FX570UD-I5S2RO는 CPU에 Core i5-8250U(1.6GHz), 스토리지 256GB SSD, 상위 FX570UD-I7H1S1RO는 CPU에 Core i7-8550U(1.8GHz), 스토리지 128GB SSD+1TB HDD를 탑재한다.


그 외 다른 사양은 공통으로 메모리 8GB, GPU에 GeForce GTX 1050(NVIDIA Optimus 대응, 하위는 메모리 2GB, 상위는 메모리 4GB) 1920×1080 표시 대응 15.6형, 광택 액정 디스플레이 OS에 Windows 10 Home을 탑재한다.


인터페이스는 microSD 카드 리더, USB 3.0 ×2(1기는 Type-C), USB 2.0 ×2, HDMI 출력, IEEE 802.11ac 대응 무선 LAN, Bluetooth 4.1, Gigabit Ethernet, 30만 화소 Web 카메라, 음성 입출력 등을 갖춘다.


배터리는 3셀 리튬 이온으로 구동 시간은 하위 모델이 약 8.2시간, 상위 모델이 약 6.3시간. 본체 크기는 374.6×256×21.9mm(폭×두께×높이)


출처 - https://pc.watch.impress.co.jp/docs/news/1137134.html

반응형
Posted by 랩터 인터내셔널


중국 Lenovo는 3일(현지 시간) 8세대 Core를 탑재한 게이밍 노트북 "LEGION Y7000P", "LEGION Y7000"을 발표했다.


Y7000P는 144Hz 리프레시 레이트를 가진 액정 디스플레이를 탑재하고 GPU는 GeForce GTX 1050 Ti(4GB) 또는 GeForce GTX 1060(6GB), Y7000은 60Hz 디스플레이에 GPU는 GeForce GTX 1060만 채택되고 있다.


디스플레이 양쪽 모두 NTSC 72%의 색 영역을 실현하며 해상도는 1920×1080. 작은 액자 설계에 의한 화면 점유율 84%를 강조하며 흰색 LED 백 라이트 키보드, 8mm 히트 파이프, 듀얼 블레이드 듀얼 팬 배열 장치, Harman 스피커 및 Dolby Audio Premium 탑재도 특징으로 한다.


Y7000P는 4종류, Y7000은 3종류의 구성이 있으며 가격은 아래표 참조


모델Y7000PY7000
CPUCore i5-8300HCore i7-8750HCore i5-8300HCore i7-8750H
메모리8GB16GB8GB16GB
스토리지128GB SSD+1TB HDD512GB SSD512GB SSD+2TB HDD128GB SSD+1TB HDD512GB SSD
GPUGeForce GTX 1050 Ti(4GB)GeForce GTX 1060(6GB)
가격6,899위안8,199위안8,999위안10,499위안7,499위안8,299위안9,299위안


OS는 Windows 10 Home, Office 2016 Home and Student을 탑재하며 인터페이스는 USB 3.0 ×4(1기는 Type-C), HDMI 출력, IEEE 802.11ac 대응 무선 LAN, Bluetooth 4.2, 720p 대응 Web 카메라, 음성 입출력 등을 갖춘다.


본체 크기 및 중량은 Y7000P가 361×267×26.9mm(폭×두께×높이)/2.35kg, Y7000이 360×267×23.9mm(동)/2.3kg.


출처 - https://pc.watch.impress.co.jp/docs/news/1136785.html

반응형
Posted by 랩터 인터내셔널

미국 AMD는 8월 6일(현지 시간) Ryzen Threadripper 2세대 모델 4제품을 발표했다. 32코어/64스레드 동작을 실현하는 최상위 "Ryzen Threadripper 2990WX"는 최초 8월 13일부터 발매된다. 가격은 1,799달러.


지난해(2017년)에 등장한 Ryzen Threadripper의 최신 모델로 프로세스는 12nm의 ZEN+ 코어 아키텍처를 채용한다. 소켓은 1세대와 같은 Socket TR4 이며 현행 X399 메인보드와 호환성을 갖고 있다.


각 모델별 스펙은 아래표 참조.


[표] 2세대 Ryzen Threadripper 라인업
모델코어/스레드베이스 클럭부스트 클럭L3 캐시TDPPCIe 3.0 레인수가격발매일
2990WX32/643GHz4.2GHz64MB250W641,799달러8월13일
2970WX24/483GHz4.2GHz64MB250W641,299달러10월
2950X16/323.5GHz4.4GHz32MB180W64899달러8월31일
2920X12/243.5GHz4.3GHz32MB180W64649달러10월


AMD에 따르면 최상위 2990WX는 액체 질소 냉각 오버클럭으로 5.1GHz 이상의 클럭을 달성하는 동시에 CINEBENCH R15의 멀티 성능에서 스코어 7618점을 기록해 싱글 소켓 CPU 범주에서는 세계 기록이다. 또한 라이벌인 인텔의 Core i9-7980XE(18코어/36스레드, 2.6~4.2GHz)의 스코어는 5828.


출처 - https://pc.watch.impress.co.jp/docs/news/1136550.html




반응형
Posted by 랩터 인터내셔널