소니 플레이스테이션5 SoC 다이가 촬영됐다.

 

AMD와 소니가 차세대 콘솔 칩을 만들기 위해 협력했을 때 AMD는 내부적으로 코드 명을 Flute로 지정했고, 소니는 코드 명을 Oberon 또는 Ariel로 지정했다. 이 PlayStation 5 SoC 다이가 Fritzchens Fritz 덕분에 촬영됐으며 다이 내부를 자세히 살펴볼 수 있게 됐다. 

 

최대 3.5GHz의 주파수에 도달 할 수있는 8개의 AMD Zen2 코어를 특징으로하는 CPU는 RDNA 2 기술을 기반으로하는 36CU GPU와 쌍을 이룬다. GPU는 최대 2.23GHz의 속도로 실행할 수 있으며 SoC는 모든 하드웨어를 수용하고 IO를 통해 모든 하드웨어를 연결하도록 만들어졌다.

 

트위터 사용자 @Locuza가 강조한 몇 가지 뚜렷한 영역이 있다. 촬영된 다이에는 CPU 콤플렉스가 있는 특수 섹터와 레이 트레이싱을 위한 많은 작업 그룹과 추가 구성 요소가있는 GPU 매트릭스를 확인할 수 있다.

 

Locuza에 따르면 Sony는 부동 소수점 파이프 라인을 256비트에서 128비트로 줄였고, 또 다른 중요한 점은 Xbox Series X SoC와 마찬가지로 L3 캐시(Infinity Cache)가 없다.

 

출처 - https://www.techpowerup.com/278524/sony-playstation-5-soc-die-has-been-pictured

반응형
Posted by 랩터 인터내셔널

중국에서 개최 된 GPU 기술 컨퍼런스(GTC)에서 NVIDIA의 수석 과학자이자 연구 SVP, Bill Dally는 회사가 HPC, AI(인공지능), 그래픽, 의료 및 엣지 컴퓨팅의 미래를 추진할 계획에 대해 흥미로운 내용을 발표했다. Dally는 NVIDIA의 연구 노력과 제품의 미래 비전을 제시했으며 가장 흥미로운 것 중 하나는 표준적인 전기 데이터 전송을 버리고 빛의 속도를 사용하여 노드 통신을 확장하고 발전시키는 계획이다.

 

회사가 제안한 계획은 광학 NVLink를 사용하는 것으로 현재 NVLink 2.0 칩은 비트당 8개의 피코 줄(8pJ / b)을 사용하고 리피터 없이 0.3 미터까지만 신호를 보낼 수 있지만, 광학 방식은 전력의 절반을 소비하면서 20 ~ 100 미터의 데이터를 전송할 수 있다.( 4pJ / b) NVIDIA는 트레이에 4개의 GPU가 있는 시스템을 개념화했으며 모두 광학으로 연결된다. 이러한 설정에 전력을 공급하기 위해 8-10개의 파장을 생성하는 레이저가 있고, 이러한 파장은 링 공진기를 사용하여 파장 당 25Gbit / s의 속도로 변조된다. 수신 측에서는 링 광 검출기가 파장을 픽업하여 광 검출기로 보내며 이 기술은 장거리에서도 빠른 데이터 전송을 보장한다.

 

그리고 그것이 전부는 아니다. 모든 것을 통합하기 위해 NVIDIA는 이를 칩 패키징 기술과 결합해야 한다. 아래 그림은 GPU와 메모리 조합이 유기 패키지 위에 있는 실리콘 인터포저에 있는 설정이다. 이 유기 패키지는 포토닉 집적 회로 (PIC)에 연결되며 또한 공진기를 사용하여 GPU에서 나오는 전기 신호를 광학 신호로 변환하는 전기 인터페이스 칩 (EIC)이 있다. 광 인터커넥트는 측면에 유사하게 구축 된 스위치가 필요하다.

 

이러한 기술을 사용하여 NVIDIA는 향후 1,000개의 상호 연결 GPU가 있는 시스템이 가능하며 각 GPU는 빛의 속도를 사용하여 서로 통신 할 수 있다고 밝혔다. 기술이 시장에 출시되는 것은 시간 문제지만 현재로서는 연구 프로젝트 일 뿐이므로 보장 할 수 없다.

 

출처 - https://www.techpowerup.com/276139/nvidia-is-preparing-co-packaged-photonics-for-nvlink

 

 

반응형
Posted by 랩터 인터내셔널

인텔이 새로운 CEO로 가상화 기업 VMWare의 CEO였던 팻 겔싱어(Pat Gelsinger)를 2월 15일부터 임명했다.

 

업계 베테랑인 Gelsinger는 VMWare, EMC와 같은 회사에서 40년 이상을 일했으며 그 이전에는 Intel에서 30년을 지내며 최고 기술 책임자(CTO) 자리에 올랐다. 그는 80486의 설계자이면서 USB, Wi-Fi와 같은 표준 생성 등을 주도했다. 

 

반응형
Posted by 랩터 인터내셔널

퀄컴(Qualcomm)이 14억 달러에 NUVIA를 인수한다고 발표했다. 

 

NUVIA는 2019년 2월에 설립된 스타트업으로, 업계 베테랑인 Gerard Williams III, John Bruno, Manu Gulati에 의해 설립됐다. Apple의 고성능 CPU 코어를 개발하였으며 Google, Apple, Arm, Broadcom, AMD 등에서 광범위한 경력을 보유하고 있다.

 

그 중 Gerard Williams III는 Apple에서 10년 넘게 수석 아키텍트로 지내오며 A13의 Lightning 코어까지 모든 Apple CPU 설계의 수석 아키텍트였으며 최신 Apple A14 및 Apple M1 Firestorm 코어도 그의 지휘하에 설계됐다.

 

반응형
Posted by 랩터 인터내셔널

엔비디아가 마침내 새로운 30 시리즈를 출시했습니다.

 

 

새로운GA102 아키텍처는 삼성의 8N 프로세스를 사용하여 제조됩니다. TSMC의 N7 노드가 전반적으로 더 좋지만 Nvidia의 A100을 포함하여 비용이 더 많이 들고 현재 수요가 매우 많아 결국 삼성에서 제조하게 된 것입니다. GA102는 크고 강력한 칩으로 628.4mm 크기의 다이에 283억 트랜지스터가 탑재되어 있습니다. RTX 2080 Ti에 사용 된 TU102 칩보다 트랜지스터가 52% 더 많지만 면적은 17% 더 작은 것입니다.

 

Ampere 아키텍처 중 GA100과 GA102 및 기타 소비자 칩에는 상당한 차이가 있습니다. GA100은 과학 워크로드를 위한 FP64 성능에 훨씬 더 초점을 맞추고, 딥 러닝 하드웨어가 두 배 입니다. 반면 GA102는 대부분의 FP64 기능을 삭제하고 대신 레이 트레이싱 하드웨어와 기타 아키텍처 개선 사항을 포함합니다.

 

 

3080은 기존 2080 Super에서 스펙이 대폭 강화되어 8704 쿠다코어, 68 RT 코어로 구성되며, VRAM은 320비트의 10GB를 탑재합니다.

 

 

 

HDMI 2.1포트와 3개의 DisplayPort 1.4a 포트가 있으며 VirtualLink 포트는 없습니다. 또한 다양한 포트는 모두 시각적 무손실 기술인 DSC(Display Stream Compression)를 사용하여 8K 60을 지원합니다.

 

 

 

 

GA102는 최대 12개의 32비트 메모리 채널을 지원하며 이 중 10개가 RTX 3080에서 활성화됩니다. Nvidia는 Micron과 협력하여 GDDR6X 메모리를 사용합니다. 이 메모리는 PAM4 신호를 사용하여 이전보다 훨씬 더 높은 데이터 속도를 제공합니다. RTX 20 시리즈 카드가 2080 Super에서 15.5Gbps, 다른 RTX 카드에서 14Gbps로 최고를 기록했지만 GDDR6X는 RTX 3080에서 19Gbps로 더 빠릅니다. 320비트 인터페이스와 결합하여 760GBps의 대역폭을 제공하며 RTX 2080에 비해 70% 향상 되었습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

출처 - https://www.tomshardware.com/

반응형
Posted by 랩터 인터내셔널

 

바로 하단 게시물 3080 리뷰에 이어 상위 모델인 3090의 리뷰입니다.

 

 

3090은 3080 대비 GPU 코어(FP32/INT32), 텐서 코어, RT 코어가 각각 10496 / 5248 / 328개로 증가하였으며 VRAM 도 384비트의 24GB로 증가하고 있습니다. 

 

 

 

 

 

 

 

 

 

 

출처 - https://www.tomshardware.com/

 

엔비디아 지포스 RTX 3090은 3080 마저 압도해버리는 "절대 황제" GPU 입니다.

반응형
Posted by 랩터 인터내셔널

 

AMD 신형 젠3 아키텍처, 라이젠 5950X, 5900X, 5600X 성능 테스트

 

 

- AMD 라이젠 9 5950X는 16코어 32스레드, 베이스 클럭 3.4, L3 캐시 64MB, TDP 105W, 799달러

- AMD 라이젠 9 5900X는 12코어 24스레드, 베이스 클럭 3.7, L3 캐시 64MB, TDP 105W, 549달러

- AMD 라이젠 7 5800X는 8코어 16스레드, 베이스 클럭 3.8, L3 캐시 32MB, TDP 105W, 449달러

- AMD 라이젠 5 5600X는 6코어 12스레드, 베이스 클럭 3.7, L3 캐시 32MB, TDP 65W, 299달러

 

 

AMD 라이젠 9 5950X의 CPU-Z 스펙

 

 

 

2020년 4분기 인텔 VS AMD CPU 라인업 비교. 라이젠 5950X는 인텔 10980XE를, 라이젠 5900X는 인텔 10900K를, 라이젠 5800X는 10850K와 10700K를, 라이젠 5600X는 10600K를 상대한다.

 

[ 테스트 시스템 ]

 

AnandTech Example
Processors
Motherboard DRAM PSU SSD
AMD
Zen 3 CPU Ryzen 9 5950X MSI X570
Godlike
(1.B3T13)
Corsair RGB
Dominator Pro
32 GB
DDR4-3200
OCZ Gold
1250W
Crucial
MX500
2 TB
Ryzen 9 5900X
Ryzen 7 5800X
Ryzen 5 5600X
Zen 2 CPU Ryzen 9 3950X GIGABYTE
X570 Aorus I
Pro (F30a)
ADATA
32 GB
DDR4-3200
Corsair
AX860i
Crucial
MX500
2 TB
Ryzen 9 3900X
Ryzen 7 3800XT
Ryzen 7 3700X
Ryzen 5 3600
Zen+ CPU Ryzen 7 2700X GIGABYTE
X570 Aorus I
Pro (F30a)
ADATA
32 GB
DDR4-3200
Corsair
AX860i
Crucial
MX500
2 TB
Intel
Comet Lake
CPU
Core i9-10900K ASRock Z490
PG Velocia
Corsair RGB
Dominator Pro
32 GB
DDR4-2933
OCZ Gold
1250 W
Crucial
MX500
2 TB
Core i9-10850K
Core i7-10700K
Core i5-10600K

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Legacy Tests

 

 

 

 

 

 

 

 

 

 

 

 

 

출처 - https://www.anandtech.com/

반응형
Posted by 랩터 인터내셔널

 

AMD가 엔비디아를 위협할 새로운 라데온 RX 6800 XT를 발표했다.

 

Radeon RX 6800 XT Market Segment Analysis PriceShaderUnitsROPsCoreClockBoostClockMemoryClockGPUTransistorsMemoryRX Vega 64GTX 1080 TiRX 5700 XTRTX 2070RTX 2070 SuperRadeon VIIRTX 2080RTX 2080 SuperRTX 2080 TiRTX 3070RX 6800RX 6800 XTRTX 3080RTX 3090

$400 4096 64 1247 MHz 1546 MHz 953 MHz Vega 10 12500M 8 GB, HBM2, 2048-bit
$650 3584 88 1481 MHz 1582 MHz 1376 MHz GP102 12000M 11 GB, GDDR5X, 352-bit
$370 2560 64 1605 MHz 1755 MHz 1750 MHz Navi 10 10300M 8 GB, GDDR6, 256-bit
$340 2304 64 1410 MHz 1620 MHz 1750 MHz TU106 10800M 8 GB, GDDR6, 256-bit
$450 2560 64 1605 MHz 1770 MHz 1750 MHz TU104 13600M 8 GB, GDDR6, 256-bit
$680 3840 64 1802 MHz N/A 1000 MHz Vega 20 13230M 16 GB, HBM2, 4096-bit
$600 2944 64 1515 MHz 1710 MHz 1750 MHz TU104 13600M 8 GB, GDDR6, 256-bit
$690 3072 64 1650 MHz 1815 MHz 1940 MHz TU104 13600M 8 GB, GDDR6, 256-bit
$1000 4352 88 1350 MHz 1545 MHz 1750 MHz TU102 18600M 11 GB, GDDR6, 352-bit
$500 5888 96 1500 MHz 1725 MHz 1750 MHz GA104 17400M 8 GB, GDDR6, 256-bit
$580 3840 96 1815 MHz 2105 MHz 2000 MHz Navi 21 26800M 16 GB, GDDR6, 256-bit
$650 4608 128 2015 MHz 2250 MHz 2000 MHz Navi 21 26800M 16 GB, GDDR6, 256-bit
$700 8704 96 1440 MHz 1710 MHz 1188 MHz GA102 28000M 10 GB, GDDR6X, 320-bit
$1500 10496 112 1395 MHz 1695 MHz 1219 MHz GA102 28000M 24 GB, GDDR6X, 384-bit

 

RX 6800과 함께 Radeon RX 6800 XT는 7nm "Navi 21" RDNA2 실리콘을 기반으로 하며 RX 5700 XT에 비해 컴퓨팅 단위가 80% 증가했다. 이러한 각 RDNA2 컴퓨팅 유닛에는 레이트레이싱 하드웨어가 있다. AMD는 메모리 버스가 여전히 256비트이며 JEDEC 표준 16Gbps GDDR6 (512GB/s)을 사용하고 있지만 메모리 용량을 16GB로 늘렸고, Infinity Cache라는 새 구성 요소를 도입하여 전술을 변경했다.

 

 

AMD는 원래 RDNA 아키텍처와 "Navi"를 사용하여 15개월 전에 7nm GPU를 최초로 출시했다. 프로세스 노드를 변경하지 않았지만 노드에 대한 경험을 쌓아 새로운 기술을 맣이 구현했다. Radeon RX 6800 XT 및 RX 6800의 중심에는 7nm "Navi 21" 실리콘이 있으며 이는 지난 1년 동안 "Big Navi"로 잘 알려져 있다. 이것은 268억개의 트랜지스터가 있는 거대한 519.8mm² 다이로, NVIDIA의 8nm "GA102"(628.4mm² 다이에 283억 트랜지스터)와 거의 같은 수준이다. 다이는 256비트 폭의 GDDR6 메모리 인터페이스, PCI-Express 4.0 x16 호스트 인터페이스 및 DSC로 4K 또는 8K 디스플레이를 지원한다.

 

새로운 설계 방법론과 새로운 전력 관리 기능으로 실리콘 전체의 구성 요소 최적화를 통해 AMD는 합리적인 전력 범위 내에서 이전 세대에 비해 컴퓨팅 유닛 수를 두 배로 늘릴 수 있는 두 가지 혁신을 달성했다고 밝혔다.

 

 

전반적으로 "Navi 21" 실리콘은 기본적으로 "Navi 10"과 동일한 구성 요소 계층 구조를 갖고 있다. Infinity Fabric 상호 연결은 모든 구성 요소를 하나로 묶는 링크로 가장 바깥 쪽 수준에는 칩의 256비트 GDDR6 메모리 컨트롤러, PCI-Express 4.0 x16 호스트 인터페이스, 멀티미디어 및 디스플레이 엔진이 있으며 내부에는 칩의 128 메가바이트 인피니티 캐시가 있다. 이 캐시는 GPU의 고속 4MB L2 캐시와 4개의 셰이더 엔진 사이에 워크로드를 전달하는 그래픽 명령 프로세서의 중앙으로 이러한 각 셰이더 엔진은 업데이트 된 백엔드 및 L1 캐시와 함께 10개의 RDNA2 듀얼 컴퓨팅 유닛(또는 20개의 CU)을 포함하며 결합 된 실리콘에는 80개의 CU, 80개의 Ray Accelerator(CU 당 1개), 320 TMU 및 128개의 ROP에 걸쳐 5120개의 스트림 프로세서로 구성된다.

 

 

 

 

 

 

 

- 테스트 시스템

 

Test System

Test System - VGA Rev. 2020.2Processor:Motherboard:Memory:Cooling:Storage:Power Supply:Case:Operating System:Drivers:

Intel Core i9-9900K @ 5.0 GHz
(Coffee Lake, 16 MB Cache)
EVGA Z390 DARK
Thermaltake TOUGHRAM, 16 GB DDR4
@ 4000 MHz 19-23-23-42
Corsair iCue H100i RGB Pro XT
240 mm AIO
Crucial MX500 2 TB SSD
Seasonic Prime Ultra Titanium 850 W
darkFlash DLX22
Windows 10 Professional 64-bit
Version 2004 (May 2020 Update)
AMD: Radeon 20.8.3 WHQL
RX 6800 & 6800 XT: 20.45.01.12-11.6 Press Driver
NVIDIA: 452.06 WHQL
GeForce RTX 3080 & 3090: 456.55 WHQL
GeForce RTX 3070: 456.96 Press Driver

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

출처 - https://www.techpowerup.com/

반응형
Posted by 랩터 인터내셔널

 

이번에 테스트한 것은 최신작 "사이버 펑크 2077". 올 겨울 주목된 최신 타이틀로 3세대 9종류의 CPU를 최신 하이엔드 GPU "GeForce RTX 3080"과 조합할 경우의 퍼포먼스를 체크한다.

 

테스트 CPU와 기타 기자재는 이하대로.

 

【표1】테스트 CPU 주요 사양프로세서 넘버Core i9-10900KCore i5-10600Core i3-10100Core i7-6700KCore i5-6600KCore i3-6100Core i7-2600KCore i5-2500KCore i3-2105

세대 10세대 6세대 2세대

CPU

아키텍처

Comet Lake Skylake Sandy Bridge
프로세스 14nm 14nm 32nm
코어 수 10 6 4 4 4 2 4 4 2
스레드 수 20 12 8 8 4 4 8 4 4
베이스 클럭 3.7GHz 3.3GHz 3.6GHz 4.0GHz 3.5GHz 3.7GHz 3.4GHz 3.3GHz 3.1GHz
최대 부스트 클럭 5.3GHz 4.8GHz 4.3GHz 4.2GHz 3.9GHz 3.8GHz 3.7GHz
L3 캐시 20MB 12MB 6MB 8MB 6MB 3MB 8MB 6MB 3MB
대응 메모리 DDR4-2933 (2ch) DDR4-2666 (2ch) DDR4-2133/DDR3L-1600 (2ch) DDR3-1333 (2ch)
PCI Express PCIe 3.0 x16 PCIe 3.0 x16 PCIe 2.0 x16
TDP 125W 65W 65W 91W 91W 51W 95W 95W 65W
인터페이스 LGA1200 LGA1151 LGA1155

 

[표2] 테스트 장비 목록CPUCore i9-10900KCore i5-10600Core i3-10100Core i7-6700KCore i5-6600KCore i3-6100Core i7-2600KCore i5-2500KCore i3-2105

코어/쓰레드수 10/20 6/12 4/8 4/8 4/4 2/4 4/8 4/4 2/4
파워 리미트(PL1) 125W 65W 65W 95W 95W 51W 95W 95W 65W
파워 리미트(PL2) 250W 134W 90W 118.75W 118.75W 63.75W 118.75W 118.75W 81.25W
파워 리미트(Tau) 56秒 28秒 28秒 8秒 8秒 8秒 1秒 1秒 1秒
마더보드 ASUS TUF GAMING Z490-PLUS (WI-FI) [UEFI:1001] ASUS Z170-A [UEFI:3802] ASUS P8Z68-V PRO [UEFI:3603]
메모리 DDR4-2933 8GB×2 (2ch、21-21-21-47、1.20V) DDR4-2133 8GB×2 (2ch、15-15-15-36、1.20V) DDR3-1333 8GB×2 (2ch、9-9-9-24、1.50V)
비디오 카드 GeForce RTX 3080 Founders Edition
시스템용 SSD Crucial MX500 500GB (SSD/6Gbps SATA)
애플리케이션용 SSD SanDisk Ultra 3D SSD 1TB (SSD/6Gbps SATA)
파워 CORSAIR RM850 CP-9020196-JP (850W/80PLUS Gold)
그래픽 드라이버 GeForce Game Ready Driver 457.30 (27.21.14.5730)
OS Windows 10 Pro 64bit (Ver 2004 / build 19041.329)
전원 관리 고성능
실온 25℃

 

레이 트레이싱을 이용하는 초고화질 설정으로 테스트

 

사이버 펑크 2077의 그래픽 설정 퀵 프리셋을 "광선 추적:울트라", 텍스처 퀄리티를 "고"로 설정하고, 4K해상도(3840×2160)와 FHD 해상도(1920×1080)에서 프레임 레이트 측정을 실시했다. (게임 버전은 1.05)

 

4K 해상도에서는 GPU가 병목이 되어 60fps은 얻지 못했지만 Core i9-10900K를 비롯한 10세대 Core 프로세서는 48.1~51.1fps를 기록하여 문제없는 플레이가 가능한 프레임 레이트는 확보하고 있다. 한편 10세대 Core 프로세서 이외의 CPU는 평균 40fps를 넘은 것은 Core i7-6700K 뿐 다른 CPU는 플레이 중 30fps을 유지하는 것도 힘든 결과를 나타냈다.

 

FHD 해상도로 평균 60fps를 넘어선 것은 75.1fps를 기록한 Core i9-10900K와 62.9fps의 Core i5-10600 뿐이었다.

 

 

실시간 광선 추적(레이 트레이싱)을 이용한 초 고해상도 설정을 적용한 사이버 펑크 2077이 요구하는 CPU 성능은 최신 세대의 4코어 8스레드 CPU을 사용해도 평균 60fps에는 역부족이었다. 모처럼 GeForce RTX 30시리즈 같은 고성능 GPU를 사용한다면 적어도 6코어의 Core i5-10600 이상, 가능하면 8코어 Core i7과 10코어의 Core i9를 추천하고 싶다.

 

이번 사이버 펑크 2077이 그렇듯, 최신 게임에서는 GPU 성능 뿐만 아니라 CPU 성능에 대한 요구도 높아지고 있다. 빅 타이틀이 속속 투입되는 겨울 게이밍 PC 업그레이드를 한다면 GPU 뿐만 아니라 CPU 업그레이드도 아울러 검토하기 바란다.

 

출처 - https://pc.watch.impress.co.jp/docs/column/kikidokoro/1297132.html

반응형
Posted by 랩터 인터내셔널