신형 지포스GTX 1080TI와 8코어 16스레드 CPU 조합 성능 테스트


선수 1번은 인텔의 8코어 16스레드 Core i7 5960X + 지포스GTX 1080TI 조합

선수 2번은 AMD의 8코어 16스레드 라이젠 1800X + 지포스GTX 1080TI 조합


각각의 조합으로 여러 부문에서 성능 비교


index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=292

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291

index.php?ct=articles&action=file&id=291



출처 - http://www.guru3d.com


테스트한 모든 부문에서 인텔 5960X + 지포스GTX 1080TI 조합이 높은 성능을 발휘하며 일부 게임은 1800X에 상당한 GPU 병목현상이 나타나고 있다.

반응형
Posted by 랩터 인터내셔널



엔비디아가 새롭게 발표한 지포스GTX 1080TI 리뷰


GeForce
GTX 980 Ti
Radeon R9
Fury X
GeForce
GTX 1070
GeForce
GTX 1080
GeForce
GTX 1080 Ti
GeForce
Titan XP
Shader Units281640961920256035843584
ROPs966464648896
Graphics ProcessorGM200FijiGP104GP104GP102GP102
Transistors8000M8900M7200M7200M12000M12000M
Memory Size6 GB4 GB8 GB8 GB11 GB12 GB
Memory TypeGDDR5HBMGDDR5GDDR5XGDDR5XGDDR5X
Memory Bus Width384 bit4096 bit256 bit256 bit352 bit384 bit
Core Clock1000 MHz+1050 MHz1506 MHz+1607 MHz+1481 MHz+1418 MHz+
Memory Clock1750 MHz500 MHz2002 MHz1251 MHz1376 MHz1251 MHz
Price$390$380$350$500$700$1200



엔비디아의 지포스 하이엔드 제품군 스펙표


지포스GTX 1080TI는 파스칼 타이탄X와 같은 코어 스펙에 ROP가 96개에서 88개로 감소, 메모리 용량이 12GB에서 11GB로 감소, 메모리 인터페이스가 384비트에서 352비트로 감소, 동작 클럭은 1418MHz에서 1481MHz로 향상, 메모리 클럭도 1251MHz에서 1376MHz로 향상


contents.jpg


지포스GTX 1080TI 구성품



outputs.jpg


3개의 풀사이즈 디스플레이포트와 하나의 HDMI 포트. DVI 포트 제거



[ 테스트 시스템 ]


Test System - VGA Rev. 47
Processor:Intel Core i7-7700K @ 4.8 GHz
(Kaby Lake, 8192 KB Cache)
Motherboard:ASUS Maximus IX Code
Intel Z270
Memory:G.SKILL 16 GB Trident-Z DDR4
@ 3000 MHz 15-16-16-35
Storage:2x Patriot Ignite 960 GB SSD
Power Supply:Antec HCP-1200 1200W
Cooler:Cryorig R1 Universal 2x 140 mm fan
Software:Windows 10 64-bit Anniversary Edition
Drivers:NVIDIA: 376.33 WHQL
AMD: Catalyst 16.12.2 WHQL
GTX 1080 Ti, GTX Titan X Pascal: 378.78
Display:Acer CB240HYKbmjdpr 24" 3840x2160



























[ 전력소모 ]






출처 - https://www.techpowerup.com


엔비디아의 신형 지포스GTX 1080TI는 파스칼 타이탄X에서 ROP와 메모리 인터페이스, 메모리 용량이 소폭 감소했으나 향상된 코어클럭과 메모리클럭으로 파스칼 타이탄X보다 높은 성능 발휘. 전력소모는 아이들시 동일한 10와트, 풀로드시에도 파스칼 타이탄X와 비슷한 수준

반응형
Posted by 랩터 인터내셔널


라이젠 스펙 및 기본 정보들은 바로 아래 게시글들을 확인해주시기 바라며 벤치마크 데이터만 업데이트 합니다. 각각의 테스트 부문으로 인텔과 AMD CPU의 장단점을 비교해보시기 바랍니다.


출처 - 탐스 하드웨어 (http://www.tomshardware.com)


테스트 환경


Test Systems and Measurement Setups
Systems
Germany AMD 1
Ryzen 7 1080X
MSI RX370 XPower Gaming Titanium
2x Corsair Vengeance LPX DDR4-2666

Germany AMD 2
AMD FX-9590
Asus Crosshair Hero V
2x Corsair Dominator Platinum DDR3 2133

Germany All
1x 1 TB Toshiba OCZ RD400 (M.2, System SSD)
2x 960GB Toshiba OCZ TR150 (Storage, Images)
be quiet Dark Power Pro 11, 850W
Windows 10 Pro (All Updates)

US AMD 1
Ryzen 7 1800X
ASUS Crosshair VI Hero
2x Corsair Vengeance LPX DDR4-2666

US AMD 2
AMD FX-8350
MSI 970 Gaming
2x Kingston HyperX DDR3 2133

USA Intel 1
Intel Core i7-7700K
MSI Gaming M7
2x Corsair Vengeance LPX DDR4-2666

USA Intel 2
Core i7-6900K
ASRock Extreme4
4x Crucial DDR4 2400

US All
1TB Samsung PM863
Silverstone ST1500, 1500W
Windows 10 Pro (All Updates)
Cooling
Germany
- Alphacool Eispumpe VPP755 Pump
- Alphacool NexXxoS UT60 Full Copper 240mm
- Alphacool Eisblock XPX CPU
- 2x be quiet! Silent Wings 3 PWM
- Thermal Grizzly Kryonaut

US
-Corsair H100iv2
-Noctua NH-U12S SE-AM4
-Arctic MX-4
Case
Lian Li PC-T70 with Expansion Kit and Mods

Power Consumption Measurements
- Contact-free DC Measurement at PCIe Slot (Using a Riser Card)
- Contact-free DC Measurement at External Auxiliary Power Supply Cable
- Direct Voltage Measurement at Power Supply
- 2 x Rohde & Schwarz HMO 3054, 500MHz Digital Multi-Channel Oscilloscope with Storage Function
- 4 x Rohde & Schwarz HZO50 Current Probe (1mA - 30A, 100kHz, DC)
- 4 x Rohde & Schwarz HZ355 (10:1 Probes, 500MHz)
- 1 x Rohde & Schwarz HMC 8012 Digital Multimeter with Storage Function
Thermal Measurements
- 1 x Optris PI640 80Hz Infrared Camera
- PI Connect Analysis Software with Profiles
Noise Measurements
- NTI Audio M2211 (with Calibration File)
- Steinberg UR12 (with Phantom Power for Microphones)
- Creative X7, Smaart v.7
- Custom-Made Proprietary Measurement Chamber, 3.5 x 1.8 x 2.2m (L x D x H)
- Perpendicular to Center of Noise Source(s), Measurement Distance of 50cm
- Noise Level in dB(A) (Slow), Real-time Frequency Analyzer (RTA)
- Graphical Frequency Spectrum of Noise



02



image047


02


02


02


image047


02


image047


image047


image047


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


02 Handbrake Default


02 Decompress


01 Python NumPy



aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


01 Solidworks GPU Composite


02 Solidworks CPU Composite


01 Creo GPU Composite


02 Creo CPU Composite


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS81


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS81


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


02 Blender Loop 1


06 Blender Loop 5


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


01 3ds CPU Composite


05 3ds CPU Rendering


01 Rodinia


01 Lammps LJ


05 Rhodo



01 NAMD



03 NAMD


01 NAMD


03 FFTW 3D


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y



aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y



aHR0cDovL21lZGlhLmJlc3RvZm1pY3JvLmNvbS9Y


반응형
Posted by 랩터 인터내셔널
i01_s.png

Ryzen 7 1800X


ZEN 마이크로 아키텍처를 채용한 AMD의 새로운 CPU "Ryzen 7". 그 최상위 모델인 "Ryzen 7 1800X"를 발매 전 차용 기회를 얻어 벤치마크 테스트로 그 실력을 확인했다.


8코어 16스레드 CPU "Ryzen 7 1800X"

Ryzen 7 1800X는 새로운 CPU 브랜드인 Ryzen 7로 먼저 투입되는 CPU 3가지 제품의 정점에 위치하는 모델이다. Ryzen 7 브랜드의 CPU 3제품은 모두 ZEN 마이크로 아키텍처를 바탕으로 14nm FinFET 프로세스에서 제조된 8코어 16스레드의 CPU다.


2011년 투입한 "Bulldozer" 마이크로 아키텍처를 개량하면서 CPU를 설계한 AMD는 "Summit Ridge" Ryzen 7에서 채용한 "Zen" 마이크로 아키텍처는 Bulldozer와는 연결선이 없는 완전히 새롭게 설계된 CPU 마이크로 아키텍처다.


Bulldozer의 마지막 CPU 마이크로 아키텍처인 "Excavator"부터 동작 클럭당 명령 실행 수(IPC)를 52% 향상시키고 싱글스레드 성능을 크게 향상시키면서 동시에 멀티스레딩 기능(SMT)을 채용하여 1스레드에서 2스레드 처리가 가능하며 멀티 쓰레드 성능도 향상시켰다.


Ryzen 7 1800X의 동작 클럭은 베이스 클럭이 3.6GHz, 부스트시 최대 4GHz에 이른다. CPU 내장 메모리 컨트롤러는 최대 DDR4-2666 듀얼 채널 동작을 지원한다.


TDP는 95W지만 이는 CPU의 tCase 온도(다이와 히트 스프레더 접합부 최대 온도)에서 tAmbient 온도(CPU 냉각팬의 공기 장치 최대 온도)를 뺀 수치를 AMD가 정한 CPU 쿨러의 열 저항으로 나눈 것으로 소비 전력과는 관계 없는 수치다. 또한 부스터 동작 동작 기준이 되는 CPU의 소비 전력 기준(파워 리미트)는 128W로 설정되어 있다.


Ryzen 7의 주요 사양
모델 넘버Ryzen 7 1800XRyzen 7 1700XRyzen 7 1700
제조 프로세스14nm FinFET
마이크로 아키텍쳐ZEN
개발 코드 네임Summit Ridge
코어 개수8
스레드 수16
베이스 클럭3.6GHz3.4GHz3GHz
부스터 클럭4GHz3.8GHz3.7GHz
대응 메모리DDR4-2666
TDP95W65W
대응 소켓Socket AM4
i02_s.jpg
i03_s.jpg
i04.png


이번에 AMD에게 차용한 Ryzen 7 1800X의 리뷰어용 테스트 키트는 Ryzen 7 1800X 본체와 ASUS의 AMD X370 칩셋 탑재 메인보드 "ROG CROSSHAIR VI HERO", Corsair DDR4-3000 대응 메모리 "CMK16GX4M2B3000C15", 녹투아 CPU 쿨러 "NH-U12S SE-AM4".


여기에 그래픽 카드로 ZOTAC "GeForce GTX 1080 AMP Extreme"을 추가하고 벤치마크 테스트를 진행했다.



i05_s.jpg
ASUS ROG CROSSHAIR VI HERO
i06_s.jpg
Corsair CMK16GX4M2B3000C15
i07_s.jpg
NH-U12S SE-AM4
i08_s.jpg
ZOTAC GeForce GTX 1080 AMP Extreme


또한 Corsair CMK16GX4M2B3000C15 메모리는 본래 "DDR4-3000/15-17-17-35/1.35V"라는 사양의 메모리지만 AMD에서 "DDR4-2666/16-16-16-36/1.30V" 라는 권장 설정이 제시됐기 때문에 AMD 권장 설정으로 테스트를 진행했다.


Ryzen 7 1800X의 비교 대상에는 Haswell-E 기반의 8코어 16스레드 CPU, Intel "Core i7-5960X Extreme Edition"을 준비했다.


최신 세대의 Broadwell-E를 준비하지 못했기 때문에 사용했지만 기본적인 아키텍처가 공통적인 Haswell-E와 Broadwell-E는 동작 클럭의 차이가 성능 차이의 주요 요소다. 클럭의 차이를 감안하면 Broadwell-E 기반의 8코어 16스레드 CPU인 Core i7-6900K과의 차이를 평가할때 참고할 수 있을 것이다.


또한 이번 테스트는 AMD의 요청에 따라 Windows 10의 "전원 관리" 설정을 표준 "균형"에서 "고성능"으로 변경했다. 이는 CPU의 부스터 기능을 효과적으로 하는 것을 목적으로 한 것으로 형평성을 위해 Core i7-5960X 환경에서도 같은 설정을 했다.


테스트 장비 목록
CPURyzen 7 1800XCore i7-5960X
메인보드ASUS ROG CROSSHAIR VI HEROASUS X99-A II
메모리DDR4-2666 8GB×2 (2ch/16-16-16-36/1.3V)DDR4-2133 CL15 4GB×4 (4ch/15-15-15-35/1.2V)
GPUZOTAC GeForce GTX 1080 AMP Extreme
스토리지OCZ VTR180-25SAT3-480G (480GB SSD/SATA 6Gbps)
파워KRPW-TI700W/94+ (700W 80PLUS Titanium)
그래픽 드라이버GEFORCE GAME READY DRIVER 378.66
OSWindows 10 Pro 64bit (1607)


벤치마크 결과

이번에 진행한 벤치마크 테스트는 "CINEBENCH R15", "x264 FHD Benchmark", "HWBOT x265 Benchmark", "TMPGEnc Video Mastering Works 6", "PCMark 8", "SiSoftware Sandra 2016 SP3", "3DMark", "파이널 판타지 XIV 벤치마크", "Ashes of the Singularity", "오버워치", "Watch Dogs 2".


우선 CPU의 성능을 체크하는 벤치마크 소프트웨어의 결과부터 확인한다.


CPU로 3DCG 렌더링을 했을 때의 성능을 측정하는 CINEBENCH R15는 Ryzen 7 발표시 점수가 공개된 벤치마크 테스트로 Core i7-6900K를 능가하는 스코어로 많은 주목을 끌었다.


이번 테스트 환경에서도 Core i7-5960X의 싱글스레드로 약 16%, 멀티쓰레드에서는 약 23% 차이로 제쳐 싱글스레드, 멀티스레드 모두 뛰어난 성능을 나타냈다.


l01_s.png
CINEBENCH R15


H.264 형식으로 동영상 인코딩 성능을 측정한 x264 FHD Benchmark에서도 Ryzen 7 1800X가 Core i7-5960X을 약 21% 웃도는 속도로 테스트를 마쳐 CINEBENCH R15에서 보였던 멀티스레드 성능의 우위를 유감 없이 발휘하고 있다.


l02_s.png
x264 FHD Benchmark v1.0.1


H.265에 대한 동영상 인코딩 성능을 측정한 HWBOT x265 Benchmark에서는 앞의 x264 FHD Benchmark와는 달라져 Ryzen 7 1800X가 Core i7-5960X에 밀리는 결과가 됐다. 그 차이는 불과 2% 정도지만 CINEBENCH R15 등에서 보였던 20%의 성능 차이가 뒤집힌 것은 놀랍다.


l03_s.png
HWBOT x265 Benchmark v2.0.0


"x264 FHD Benchmark"과 "HWBOT x265 Benchmark"에서 다루는 동영상 형식이 다른 것 외에 AVX2 확장 명령에 대한 대응의 유무라고 하는 차이가 있고 AVX2는 x264 FHD Benchmark에서는 지원되지 않았다.


거기서 TMPGEnc Video Mastering Works 6에서는 H.264 형식과 H.265 형식으로 동영상 인코딩 테스트 외에 AVX2 확장 명령을 이용한 경우와 무효화한 경우의 성능을 측정했다.


테스트 결과 AVX2를 유효하게 한 상태에서도 H.264 형식의 인코딩에서는 Ryzen 7 1800X가 약 17% 고속의 결과를 보였는데 H.265 형식 인코딩에서는 Core i7-5960X가 약 4% 고속을 나타냈다.


한편 AVX2 확장 명령을 무효화한 경우 H.264, H.265 모두 Ryzen 7 1800X가 고속이며 약 21~25% 정도의 차이가 있다.


흥미로운 것은 AVX2를 무효화함으로써 H.265 형식으로 인코딩 시간이 현저하게 증가한 Core i7-5960X에 비해 Ryzen 7 1800X는 어떤 형식의 인코딩이라도 AVX2 유효시보다 고속으로 처리를 완료하고 있다는 점이다.


l04_s.png
TMPGEnc Video Mastering Works 6 (er.6.2.0.27)


이어 PC의 종합 성능 체크하는 PCMark 8의 결과다. 여기에서는 Ryzen 7 1800X가 Core i7-5960X을 약 3~5% 넘는 스코어를 기록했다. 단순히 CPU 성능 차이만이 스코어에 반영되는 테스트가 아니기 때문에 점수 차이는 비교적 작은 것이다.


l05_s.png
PCMark 8 (version 2.7.613)


CPU의 계산 능력을 측정하는 Sandra의 "Processor Arithmetic"에서는 정수 연산에서 약 13~17%, 부동 소수 점 연산에서는 12~20%의 차이로 Ryzen 7 1800X가 앞섰다. 이는 CINEBENCH R15의 다중 스레드 테스트의 결과에 가까운 모습이다.


그런데 CPU가 갖춘 확장 명령 세트를 활용하여 멀티 미디어 처리 성능을 측정하는 "Processor Multi-Media"에서는 Ryzen 7 1800X가 Core i7-5960X에 20% 가까이 뒤지고 있다. 일단 4배 정도의 연산에서는 Ryzen 7 1800X가 역전하고 있지만 이 부분의 성능 특성이 AVX2 확장 명령 이용시 인코딩 성능이 부진한 원인이 되고 있을 가능성이 높다.


암호화 처리 성능을 측정하는 "Cryptography"에서는 Hashing Bandwidth의 스코어로 Core i7-5960X에 2배 이상의 차이를 내며 압도했다. 이는 Ryzen 7 1800X가 HSA 확장 명령을 지원한데 따른 것이다.


l06_s.png
l07_s.png
l08_s.png


메인 메모리 대역폭을 측정하는 "Memory Bandwidth"에서는 DDR4-2666 메모리의 듀얼 채널 동작을 지원하는 Ryzen 7 1800X가 약 31GB/s라는 속도를 달성하고 있다.


DDR4-2133 메모리의 쿼드 채널에 대응하는 Core i7-5960X의 46~47GB/s라는 대역을 넘지 못하지만 어느정도 메모리 대역이 확보되어 있다.


l09_s.png
Sandra 2016 SP3 (22.35) - Memory Bandwidth


Sandra Cache Bandwidth에서는 CPU가 내장하는 캐시 메모리 대역폭을 측정하는데 AMD에 따르면 Sandra와 AIDA64 등의 벤치마크 소프트웨어로는 ZEN 마이크로 아키텍처의 캐시 대역을 적절히 측정할 수 없다며 독자적으로 측정한 결과를 보내왔다.


i09.png


AMD가 측정한 데이터와 Sandra의 결과를 비교하면 확실히 AMD가 공표하는 속도와 차이가 있지만 L2에서 L3캐시 영역에는 Core i7-5960X 보다 넓은 대역이 확보되어 있어 보인다. 현재 AMD는 Sandra와 AIDA64의 개발원과 협력하여 ZEN 마이크로 아키텍처에서 캐시 속도를 제대로 측정하는 방법을 준비중이라고 하며 차세대 버전에서는 보다 정확한 벤치마크가 가능할 것이다.


l10_s.png
Sandra 2016 SP3 (22.35) - Cache Bandwidth
l11_s.png
Sandra 2016 SP3 (22.35) - Cache & Memory Latency(nsec)
l12_s.png
Sandra 2016 SP3 (22.35) - Cache & Memory Latency(Clock)


이번엔 게임 벤치마크 결과를 확인한다.


단골 3DMark에서는 DirectX 12대응 "Time Spy"와 DirectX 11대응 "Fire Strike"에서 스코어를 취득했다. Fire Strike에서는 4K 해상도(3840×2160)의 "Fire Strike Ultra"와 풀HD 해상도(1920×1080)의 "Fire Strike" 2가지를 실행했다.


결과로서 Time Spy의 스코어는 거의 호각. Fire Strike Ultra와 Fire Strike에서는 종합 스코어는 호각이면서 CPU 스코어인 Physics Score에서는 약 15~19% 앞서고 있다.


l13_s.png
3DMark - Time Spy
l14_s.png
3DMark - Fire Strike Ultra
l15_s.png
3DMark - Fire Strike


파이널 판타지 XIV에서는 DirectX 11 최고 품질 설정에서 4K와 풀HD 2해상도에서 테스트를 실행했다. 4K 해상도의 스코어는 거의 막상막하지만 풀HD 해상도에서는 Core i7-5960X에 약 13% 뒤지고 있다.


l16_s.png


Ashes of the Singularity에서 화면 해상도는 풀HD, API는 DirectX 12로 설정하고 2종류의 렌더링 품질로 테스트를 실행했다.


"Average Framerate"은 실제로 벤치마크 중에 기록된 프레임 레이트의 평균치로 "Average CPU Framerate"는 GPU가 병목이 되지 않으면 CPU가 어디까지 프레임 레이트를 높일 수 있느냐는 가정의 평균치다.


Ryzen 7 1800X는 실제 프레임 레이트와 가정 CPU 프레임 레이트의 차이가 거의 없는데 이는 CPU가 GPU의 병목이 되고 있음을 의미하며 실제 프레임 레이트는 Core i7-5960X에 15~33% 정도 뒤지고 있다.


l17_s.png
Ashes of the Singularity: Benchmark


FPS 게임인 오버워치에서는 풀HD 해상도에서 렌더링 품질을 표준적인 Normal과 최대한의 Epic에서 프레임 레이트의 측정을 실행했다. 결과로서 Normal과 Epic에서 거의 호각의 프레임 레이트를 기록했으며 여기에서는 두 CPU사이에 차이는 없다.


l18_s.png


Watch Dogs 2에서는 풀HD 해상도에서 렌더링 품질을 "중"과 "최대"에서 프레임 레이트를 측정했다. Watch Dogs 2는 최대 12스레드를 활용하여 다중 스레드로 최적화된 게임 타이틀이기에 Ryzen 7 1800X의 멀티 쓰레드 성능이 발휘될 것으로 기대됐지만 결과로는 Core i7-5960X에 렌더링 품질 "중"에서 약 30%, "최대"에서는 약 18% 뒤지고 있다.


l19b.png
Watch Dogs 2


마지막으로 소비 전력 측정 결과를 소개한다.


아이들시 소비전력은 Ryzen 7 1800X 환경이 43W로 Core i7-5960X 환경의 57W보다 10W 이상 낮은 것으로 나타났다. 메인보드의 사양이나 메모리의 매수/동작 전압의 차이 등도 있기 때문에 모든 것이 CPU의 차이라는 것은 아니지만 낮은 전력을 기록하는 것은 좋은 것이다.


한편, 벤치마크 실행 중인 피크 전력은 160W 정도가 한계인 Ryzen 7 1800X와 달리 Core i7-5960X는 160~190W에 육박하고 있다. 테스트에 의해서 성능 차이는 다르지만 대체로 Ryzen 7 1800X의 전력 효율은 Core i7-5960X 보다 뛰어나다.


3D계 벤치마크 실행 중인 피크 전력에서도 Core i7-5960X 쪽이 높아지고 있지만 이는 GPU의 성능을 더 끌어낸 결과 높은 전력이 되고 있는 점도 있으므로 일률적으로 Ryzen 7 1800X가 유리하다고 설명하기 어렵다.


l20_s.png


인텔의 하이엔드 CPU와 경쟁할 실력을 가진 Ryzen 7 1800X

이상과 같이 Ryzen 7 1800X와 Core i7-5960X의 비교를 진행했다. CINEBENCH R15 나 H.264 형식 동영상 인코딩에서 뛰어난 성능을 발휘하는 한편 AVX2 확장 명령 이용이나 게임에서는 Core i7-5960X에게 밀리는 등 테스트에 따라 장단점이 나뉘는 결과가 나타났다.


하지만 Ryzen 7 1800X는 완전히 새롭게 설계된 CPU 마이크로 아키텍처인 "ZEN"을 채용하고, 동시 멀티 스레딩 기능에 의해 8코어 16스레드를 실현한 CPU로써 당연히 기존 게임이나 벤치마크 테스트에서는 어플리케이션 측에서 최적화된 것이 없는 상황에서 Ryzen 7 1800X의 성능이 주춤한 부분도 앞으로 최적화가 진행된다면 본래의 성능을 발휘하게 될수도 있을 것이다.


주변 환경이 갖추어지지 않은 상황에서 Ryzen 7 1800X가 이만한 성능을 499달러라는 가격으로 실현하고 있다는 사실은 경이롭고 Ryzen 7의 등장은 인텔의 제품 라인업에 영향을 미치며 고성능 CPU 시장에 경쟁을 가져오는 존재가 될 것이다.


출처 - http://pc.watch.impress.co.jp/docs/topic/review/1047474.html

반응형
Posted by 랩터 인터내셔널


AMD Ryzen SKUs
 Cores/
Threads
Base/
Turbo
L3TDPCostLaunch Date
Ryzen 7 1800X8/163.6/4.016 MB95 W$4993/2/2017
Ryzen 7 1700X8/163.4/3.816 MB95 W$3993/2/2017
Ryzen 7 17008/163.0/3.716 MB65 W$3293/2/2017


AMD가 마침내 신형 프로세서 "라이젠" 공식 발표

먼저 출시된 모델은 라이젠 7 시리즈 1800X, 1700X, 1700 3가지 모델로 각각 8코어 16스레드, 16MB의 L3 캐시 탑재

동작 클럭은 1800X가 베이스 3.6 - 터보 4.0, 1700X가 베이스 3.4 - 터보 3.8, 1700이 베이스 3.0 - 터보 3.7

TDP는 1800X / 1700X 95와트, 1700 모델이 65와트


Comparison: Ryzen 7 1800X vs Core i7-6900K
AMD
Ryzen 7 1800X
FeaturesIntel
Core i7-6900K
8 / 16Cores/Threads8 / 16
3.6 / 4.0 GHzBase/Turbo3.2 / 3.7GHz
16PCIe 3.0 Lanes40
16 MBL3 Cache20 MB
95 WTDP140 W
$499Price (MSRP)$1049



인텔의 8코어 16스레드 6900K와 라이젠 1800X 스펙비교

베이스 - 터보 클럭은 6900K가 3.2 / 3.7, 라이젠 1800X는 3.6 / 4.0

PCIE 3.0 레인수는 6900K가 40레인, 1800X가 16레인

L3 캐시는 6900K가 20MB, 1800X가 16MB

가격은 1800X가 499달러, 6900K 1049달러


Comparison: Ryzen 7 1700 vs Core i7-7700K
AMD
Ryzen 7 1700
FeaturesIntel
Core i7-7700K
8 / 16Cores/Threads4 / 8
3.0 / 3.7 GHzBase/Turbo4.2 / 4.5 GHz
16PCIe 3.0 Lanes16
16 MBL3 Cache8MB
65 WTDP91 W
$329Price (MSRP)$350



라이젠 1700과 카비레이크 7700K 스펙비교

1700은 8코어 16스레드, 7700K는 4코어 8스레드

1700 클럭은 베이스 3.0 - 터보 3.7, 7700K 클럭은 베이스 4.2 - 터보 4.5

PCIE 레인수는 두 모델 모두 16레인

L3캐시는 1700이 16MB, 7700K가 8MB

TDP는 1700이 65와트, 7700K가 91와트

가격은 1700이 329달러, 7700K가 350달러



CPU uArch Comparison
 AMDIntel
 Zen
8C/16T
2017
Bulldozer
4M / 8T
2010
Skylake
Kaby Lake
4C / 8T
2015/7
Broadwell
8C / 16T
2014
L1-I Size64KB/core64KB/module32KB/core32KB/core
L1-I Assoc4-way2-way8-way8-way
L1-D Size32KB/core16KB/thread32KB/core32KB/core
L1-D Assoc8-way4-way8-way8-way
L2 Size512KB/core1MB/thread256KB/core256KB/core
L2 Assoc8-way16-way4-way8-way
L3 Size2MB/core1MB/thread>2MB/cire1.5-3MB/core
L3 Assoc16-way64-way16-way16/20-way
L3 TypeVictimVictimWrite-backWrite-back
L0 ITLB Entry8---
L0 ITLB Assoc?---
L1 ITLB Entry6472128128
L1 ITLB Assoc?Full8-way4-way
L2 ITLB Entry51251215361536
L2 ITLB Assoc?4-way12-way4-way
L1 DTLB Entry64326464
L1 DTLB Assoc?Full4-way4-way
L2 DTLB Entry15361024--
L2 DTLB Assoc?8-way--
Decode4 uops/cycle4 Mops/cycle5 uops/cycle4 uops/cycle
uOp Cache Size2048-15361536
uOp Cache Assoc?-8-way8-way
uOp Queue Size?-12864
Dispatch / cycle6 uops/cycle4 Mops/cycle6 uops/cycle4 uops/cycle
INT Registers168160180168
FP Registers16096168168
Retire Queue192128224192
Retire Rate8/cycle4/cycle8/cycle4/cycle
Load Queue72407272
Store Queue44245642
ALU4244
AGU222+22+2
FMAC2x128-bit2x128-bit
2x MMX 128-bit
2x256-bit2x256-bit




AM4 CPU




AM4 소켓




AMD 신형 레이스 쿨러


[ 테스트 시스템 ]

AMD Ryzen 7 1800X (8C/16T, 3.6-4.0 GHz, 95W, $499)

AMD Ryzen 7 1700X (8C/16T, , 95W, $399)AMD Ryzen 7 1700 (8C/16T, 3.0-3.7 GHz, 65W, $329)ASUS Crosshair VI Hero MotherboardCorsair Vengeance 2x8GB DDR4-3000 C16 running at DDR4-2400 C15Crucial MX200 1TB SSDRosewill SilentNight 500W Platinum PSUASUS GTX 950 Ti (95W)MSI GTX 1080 Gaming 8GBWindows 10 Pro


PDF Opening

First up is a self-penned test using a monstrous PDF we once received in advance of attending an event. While the PDF was only a single page, it had so many high-quality layers embedded it was taking north of 15 seconds to open and to gain control on the mid-range notebook I was using at the time. This put it as a great candidate for our 'let's open an obnoxious PDF' test. Here we use Adobe Reader DC, and disable all the update functionality within. The benchmark sets the screen to 1080p, opens the PDF to in fit-to-screen mode, and measures the time from sending the command to open the PDF until it is fully displayed and the user can take control of the software again. The test is repeated ten times, and the average time taken. Results are in milliseconds.

System: PDF Opening with Adobe Reader DC

FCAT Processing

One of the more interesting workloads that has crossed our desks in recent quarters is FCAT - the tool we use to measure stuttering in gaming due to dropped or runt frames. The FCAT process requires enabling a color-based overlay onto a game, recording the gameplay, and then parsing the video file through the analysis software. The software is mostly single-threaded, however because the video is basically in a raw format, the file size is large and requires moving a lot of data around. For our test, we take a 90-second clip of the Rise of the Tomb Raider benchmark running on a GTX 980 Ti at 1440p, which comes in around 21 GB, and measure the time it takes to process through the visual analysis tool. 

System: FCAT Processing ROTR 1440p GTX1080 Data

3D Particle Movement v2.1 

This is the latest version of the self-penned 3DPM benchmark. The goal of 3DPM is to simulate semi-optimized scientific algorithms taken directly from my doctorate thesis. Version 2.1 improves over 2.0 by passing the main particle structs by reference rather than by value, and decreasing the amount of double->float->double recasts the compiler was adding in. It affords a ~25% speed-up over v2.0, which means new data. 

System: 3D Particle Movement v2.1

DigiCortex 1.16

Despite being a couple of years old, the DigiCortex software is a pet project for the visualization of neuron and synapse activity in the brain. The software comes with a variety of benchmark modes, and we take the small benchmark which runs a 32k neuron/1.8B synapse simulation. The results on the output are given as a fraction of whether the system can simulate in real-time, so anything above a value of one is suitable for real-time work. The benchmark offers a 'no firing synapse' mode, which in essence detects DRAM and bus speed, however we take the firing mode which adds CPU work with every firing.

System: DigiCortex 1.16 (32k Neuron, 1.8B Synapse)

Agisoft Photoscan 1.0

Photoscan stays in our benchmark suite from the previous version, however now we are running on Windows 10 so features such as Speed Shift on the latest processors come into play. The concept of Photoscan is translating many 2D images into a 3D model - so the more detailed the images, and the more you have, the better the model. The algorithm has four stages, some single threaded and some multi-threaded, along with some cache/memory dependency in there as well. For some of the more variable threaded workload, features such as Speed Shift and XFR will be able to take advantage of CPU stalls or downtime, giving sizeable speedups on newer microarchitectures.

System: Agisoft Photoscan 1.0 Stage 1

System: Agisoft Photoscan 1.0 Stage 2

System: Agisoft Photoscan 1.0 Stage 3

System: Agisoft Photoscan 1.0 Stage 4

System: Agisoft Photoscan 1.0 Total Time


Corona 1.3

Corona is a standalone package designed to assist software like 3ds Max and Maya with photorealism via ray tracing. It's simple - shoot rays, get pixels. OK, it's more complicated than that, but the benchmark renders a fixed scene six times and offers results in terms of time and rays per second. The official benchmark tables list user submitted results in terms of time, however I feel rays per second is a better metric (in general, scores where higher is better seem to be easier to explain anyway). Corona likes to pile on the threads, so the results end up being very staggered based on thread count.

Rendering: Corona Photorealism

Blender 2.78

For a render that has been around for what seems like ages, Blender is still a highly popular tool. We managed to wrap up a standard workload into the February 5 nightly build of Blender and measure the time it takes to render the first frame of the scene. Being one of the bigger open source tools out there, it means both AMD and Intel work actively to help improve the codebase, for better or for worse on their own/each other's microarchitecture.

Rendering: Blender 2.78

LuxMark

As a synthetic, LuxMark might come across as somewhat arbitrary as a renderer, given that it's mainly used to test GPUs, but it does offer both an OpenCL and a standard C++ mode. In this instance, aside from seeing the comparison in each coding mode for cores and IPC, we also get to see the difference in performance moving from a C++ based code-stack to an OpenCL one with a CPU as the main host. 

Rendering: LuxMark CPU C++Rendering: LuxMark CPU OpenCL

POV-Ray 3.7

Another regular benchmark in most suites, POV-Ray is another ray-tracer but has been around for many years. It just so happens that during the run up to AMD's Ryzen launch, the code base started to get active again with developers making changes to the code and pushing out updates. Our version and benchmarking started just before that was happening, but given time we will see where the POV-Ray code ends up and adjust in due course.

Rendering: POV-Ray 3.7

Cinebench R15

The latest version of CineBench has also become one of those 'used everywhere' benchmarks, particularly as an indicator of single thread performance. High IPC and high frequency gives performance in ST, whereas having good scaling and many cores is where the MT test wins out. 

Rendering: CineBench 15 SingleThreaded

Rendering: CineBench 15 MultiThreaded


Web: SunSpider on Chrome 56

Web: Mozilla Kraken 1.1 on Chrome 56

Web: Google Octane 2.0 on Chrome 56

Web: WebXPRT 13 on Chrome 56

Web: WebXPRT 15 on Chrome 56

 


Benchmarking Performance: CPU Encoding Tests

Encoding: 7-Zip

Encoding: WinRAR 5.40

Encoding: AES

Encoding: Handbrake H264 (LQ)

Encoding: Handbrake H264 (HQ)

Encoding: Handbrake HEVC (4K)

 

Benchmarking Performance: CPU Office Tests

Office: PCMark8 Home (non-OpenCL)

Office: PCMark8 Work (non-OpenCL)

Sysmark is developed by Bapco, a consortium of industry CPU companies. AMD left Bapco in the last two years, due to differences of opinion on how the benchmarking suites were angled towards Intel processors and had optimizations to show bigger differences than what AMD felt was present. The following benchmarks are provided as data, but the conflict of opinion between the two companies on the validity of the benchmark is provided as context for the following numbers.

SYSmark 2014 - Office Productivity

SYSmark 2014 - Media Creation

SYSmark 2014 - Data and Financial Analysis

SYSmark 2014 - Overall

 

Benchmarking Performance: CPU Legacy Tests

Legacy: 3DPM v1 Single Threaded

Legacy: 3DPM v1 MultiThreaded

Legacy: x264 3.0 Pass 1

Legacy: x264 3.0 Pass 2

Legacy: CineBench 10 Single Threaded

Legacy: CineBench 10 MultiThreaded

Legacy: CineBench 11.5 Single Threaded

Legacy: CineBench 11.5 MultiThreaded


출처 - http://www.anandtech.com


리뷰어 결론 - AMD 라이젠 CPU는 전통적인 uArch를 탑재하고 있으며 특히 지난 세대의 AMD와 비교할때 성능이 뛰어납니다. AMD가 싱글스레드와 멀티스레드에서 인텔의 HEDT와 동등하거나 그 이상인 벤치마크 결과도 많이 볼 수 있습니다. 그러나 AMD가 여전히 브로드웰 대비 10 - 20% 뒤떨어져있는 경우도 있습니다. 이러한 엣지 케이스는 예측하기 어렵고 최적화되지 않은 코드에서 비롯 될 수 있습니다. 인텔의 거대한 R&D 강점 중 하나는 프리페치, 메모리 알고리즘 및 광범위한 테스트를 통해 이러한 엣지 케이스를 처리 할 수 ​​있다는 것입니다.


성능 대비 가격은 여전히 ​​AMD의 강점 중 하나입니다. 499달러의 1800X가 1049달러의 i7-6900K와 비슷하거나 앞서는 수많은 테스트에서 가격 대비 성능이 2배로 변환됩니다. 우리는 라이젠 테스트를 위해 2부 - CPU 및 IPC 분석, 새로운 게임 및 그래픽 카드를 사용하는 DX12의 GPU 테스트를 계획하고 있습니다.


요약 - AMD 라이젠은 게임을 제외한 여러 연산 프로그램에서는 인텔의 최상위 모델과 비슷하거나 일부 앞서는 성능도 보이며 높은 가격 대비 성능을 어필. 어낸드텍은 벤치마크 2부로 게이밍 성능 벤치마크를 업데이트 할 예정

반응형
Posted by 랩터 인터내셔널


흥미로운 한판, 샌디브릿지 2600K vs 카비레이크 7350K 성능 대결 by http://www.anandtech.com


CPU Die Size Comparison
Numbers in table are to nearest degree of known accuracy
Data from Intel or Trusted Sources (Chipworks/PCWatch)
CPUYearProcess
Node
Die Size
2C or 2+2
Die Size
4C or 4+2
Die Size
4+3/e
(no eDRAM)
Die Size
(other)
Intel Kaby Lake201714+nm98.68126.15- 
Intel Skylake201514nm98.57122.40234-
Intel Broadwell201414nm82***241.50133 (2+3)
246.24 (10C)
306.18 (15C)
456.12 (24C)
Intel Haswell201322nm130177264181 (2+3)
355.52 (8C)
492 (12C)
662 (18C)
Intel Ivy Bridge201222nm118.09159.82-256.5 (6C)
341 (10C)
541 (15C)
Intel Sandy Bridge201132nm149216-435 (8C)
Intel Westmere
(GPU on 45nm)
200932nm81 (Core)
195* (+GPU)
276**-248 (6C)
513 (10C)
Intel Nehalem200845nm-263-296 (HEDT)
684 (8C)
Intel Yorkfield200745nm107220--
Intel Kentsfield200765nm-280--
Intel Conroe200665nm145---



인텔의 세대별 프로세서 구분, 샌디브릿지는 2011년 발표된 32나노 공정, 다이사이즈는 216 / 카비레이크는 2017년 발표된 14나노 플러스 공정, 다이사이즈는 126.15


Intel Kaby Lake S SKUs
 Cores/
Threads
Base/
Turbo
IGPL3eDRAMTDPCost
OEM
i7-7700K4/84.2/4.5HD 6308 MB-91 W$339
i7-77004/83.6/4.2HD 6308 MB-65 W$303
i7-7700T4/82.9/3.8HD 6308 MB-35 W$303
i5-7600K4/43.8/4.2HD 6306 MB-91 W$242
i5-76004/43.5/4.1HD 6306 MB-65 W$213
i5-7600T4/42.8/3.7HD 6306 MB-35 W$213
i5-75004/43.4/3.8HD 6306 MB-65 W$192
i5-7500T4/42.7/3.3HD 6306 MB-35 W$192
i5-74004/43.0/3.5HD 6306 MB-65 W$182
i5-7400T4/42.4/3.0HD 6306 MB-35 W$182
i3-7350K2/44.2HD 6304 MB-60 W$168
i3-73202/44.1HD 6304 MB-51 W$149
i3-73002/44.0HD 6304 MB-51 W$138
i3-7300T2/43.5HD 6304 MB-35 W$138
i3-71002/43.9HD 6303 MB-51 W$117
i3-7100T2/43.4HD 6303 MB-35 W$117
G46202/43.7HD 6303 MB-51 W$86
G46002/43.6HD 6303 MB-51 W$75
G4600T2/43.0HD 6303 MB-35 W$75
G45602/43.5HD 6103 MB-54 W$64
G4560T2/42.9HD 6103 MB-35 W$64
G39502/23.0HD 6102 MB-51 W$52
G39302/22.9HD 6102 MB-51 W$42
G3930T2/22.7HD 6102 MB-35 W$42



인텔 카비레이크 프로세서 라인업

i3-7350K는 듀얼코어에 SMT 지원으로 4스레드 동작, 배수락 해제, 4.2 동작클럭, L3 캐시 4MB, HD 630 내장그래픽, TDP 60와트, 가격은 168달러


Intel%20Core%20i3-7350K.jpg?_ga=1.142900


7350K CPU-Z 확인, 상기 스펙 동일


Kaby Lake i3 vs Sandy Bridge i7 Comparison
Launch Pricing
CPUYearCores
Threads
FreqTurboL3IGPDRAMTDPPrice
Core i3-7350K20172/44.2-4MBHD 630DDR4-240060W$168
Core i7-2600K20114/83.43.88MBHD 3000DDR3-133395W$317



샌디브릿지 2600K는 과거의 하이엔드 프로세서로 4코어 8스레드, 3.4 동작클럭, L3 캐시 8MB, TDP 95W, 가격은 317달러, 7350K는 반값 정도인 168달러


[ 테스트 시스템 ]


Test Setup
Processor Intel Core i3-7350K (ES, Retail Stepping), 60W, $157
2 Cores, 4 Threads, 4.2 GHz
Motherboards MSI Z270 Gaming M7
Cooling Cooler Master Nepton 140XL
Power Supply OCZ 1250W Gold ZX Series
Corsair AX1200i Platinum PSU
Memory G.Skill Ripjaws 4 DDR4-2400 C15 2x16 GB 1.2V
Memory Settings DDR4-2400 C15
Video Cards ASUS GTX 980 Strix 4GB
MSI R9 290X Gaming 8GB
ASUS R7 240 2GB
Hard Drive Crucial MX200 1TB
Optical Drive LG GH22NS50
Case Open Test Bed
Operating System Windows 7 64-bit SP1


WinRAR 5.0.1: link

Our WinRAR test from 2013 is updated to the latest version of WinRAR at the start of 2014. We compress a set of 2867 files across 320 folders totaling 1.52 GB in size – 95% of these files are small typical website files, and the rest (90% of the size) are small 30 second 720p videos.

WinRAR 5.01, 2867 files, 1.52 GB

WinRAR is more geared towards a variable threaded environment but also memory speed. The fact that the Core i5 is above the Core i3 shows that having actual cores helps, regardless of frequency - the additional hyperthreads for the Core i7-2600K also gives it the win, despite the memory frequency difference.

3D Particle Movement v2

3DPM is a self-penned benchmark, taking basic 3D movement algorithms used in Brownian Motion simulations and testing them for speed. High floating point performance, MHz and IPC wins the day. This is the second variant of this benchmark, fixing for false sharing in the first version, and lending itself to better multithreaded performance.

3D Particle Movement v2.0 beta-1

3DPMv2 is still new, so we don’t have too many results for it so far - but again this is another situation where having actual cores helps. This is typically when the threads are 'heavy', i.e. spill out into various caches and require more than 1/2 the cache shared within a core each. In the case of the Kaby Lake, this means that each core has 32KB of L1 - or 32KB per thread for the i5 but only 16KB per thread in the i3.

SYSMark 2014

Engineered by BAPco (to which Intel is a consortium member), this set of tests are designed to be an office/data/media/financial range of tests using common well-known CAD, image editing, web browsing and other tools to put out a score, where a score of 1000 is attributed to an old Core i3 using a mechanical harddrive. Here we report the overall score, however the test breakdowns can be found in Bench.

SYSmark 2014 - Overall

Because SYSMark is a variety of tests that rely on response and throughput, here is where the Core i3 comes into play over the i5 and i7-2600K. With the i5 it's about equal, but the years of IPC increases put the i7-2600K now behind the Kaby i3.

Web Benchmarks

On the lower end processors, general usability is a big factor of experience, especially as we move into the HTML5 era of web browsing.  For our web benchmarks, we take well-known tests with Chrome as installed by SYSMark as a consistent browser.

Mozilla Kraken 1.1

Kraken 1.1

Kraken favors high frequency and IPC, so the i3 takes a large lead over the i7-2600K for this sort of workload



Agisoft Photoscan – 2D to 3D Image Manipulation: link

Agisoft Photoscan creates 3D models from 2D images, a process which is very computationally expensive. The algorithm is split into four distinct phases, and different phases of the model reconstruction require either fast memory, fast IPC, more cores, or even OpenCL compute devices to hand. Agisoft supplied us with a special version of the software to script the process, where we take 50 images of a stately home and convert it into a medium quality model. This benchmark typically takes around 15-20 minutes on a high-end PC on the CPU alone, with GPUs reducing the time.

Here we report the overall time to complete the test – sub-test results can be found in Bench.

Agisoft PhotoScan Benchmark - Total Time

Photoscan is a mix of single and multi-threaded segments, but overall the extra cores in the i5/i7 beat the Core i3, but not by much.

Cinebench R15

Cinebench is a benchmark based around Cinema 4D, and is fairly well known among enthusiasts for stressing the CPU for a provided workload. Results are given as a score, where higher is better.

Cinebench R15 - Single Threaded

All the Kaby Lake processors seem to do well in CB15 single threaded performance, given that all the K-processors can reach 4.2 GHz or higher one way or another. Nonetheless, the age of the Core i7-2600K is showing here.

Cinebench R15 - Multi-Threaded

Turning the tables with actual cores, and the Core i7-2600K gets a significant leg up here. The Core i5 also sits above the Core i3.

HandBrake v0.9.9: link

For HandBrake, we take two videos (a 2h20 640x266 DVD rip and a 10min double UHD 3840x4320 animation short) and convert them to x264 format in an MP4 container.  Results are given in terms of the frames per second processed, and HandBrake uses as many threads as possible.

HandBrake v0.9.9 LQ Film

HandBrake v0.9.9 2x4K

For video conversion, having small frames puts all three CPUs in a similar spot. But ramp up the frame size and we see the Kaby Lake i5 pull ahead due to IPC and instructions. The Core i3 has enough oomph to match the extra threads on the Core i7-2600K though.

Hybrid x265

Hybrid is a new benchmark, where we take a 4K 1500 frame video and convert it into an x265 format without audio. Results are given in frames per second.

Hybrid x265, 4K Video

With a different video conversion tool and render, the extra cores and threads of the Core i7 is more than enough to give it a 30% advantage over the Core i3-7350K. It makes me wonder if another +30% frequency would help the Core i3.


Cinebench R10

The R10 version of Cinebench is one of our oldest benchmarks, with data going back more than a few generations. The benchmark is similar to that of the newest R15 version, albeit with a simpler render target and a different strategy for multithreading.

Cinebench R10 - Single Threaded Benchmark

With high frequency in tow, the Core i3-7350K makes its mark.

Cinebench R10 - Multi-Threaded Benchmark

When more threads come to play, the Core i5-7400 and Core i7-2600K battle it out in terms of four cores and IPC vs hyperthreading. The Core i3-7350K sits around ~25% behind.

Cinebench R11.5

CB11.5 has been popular for many years as a performance test, using easy to read and compare numbers that aren’t in the 1000s. We run the benchmark in an automated fashion three times in single-thread and multi-thread mode and take the average of the results.

Cinebench 11.5 - Single Threaded

Cinebench 11.5 - Multi-Threaded

Similar to CB10, the single thread results show that a 4.2 GHz Kaby Lake is nothing to be sniffed at. In the multithreaded test, CB11.5 is more able to leverage the hyperthreads, showing that a Core i7-2600K will run rings around the low end Kaby i5, but is bested by the higher frequency Kaby i5-K. The Core i3 still has that dual core deficit.

7-zip

As an open source compression/decompression tool, 7-zip is easy to test and features a built-in benchmark to measure performance. As a utility, similar to WinRAR, high thread counts, frequency and UPC typically win the day here.

7-zip Benchmark

The difference between the i3-7350K and the i5-7400 shows that 7-zip prefers cores over threads, but the Core i7-2600K results show it can use both to good effect, even on older microarchitectures, scoring almost double the i3-7350K.

POV-Ray

Ray-tracing is a typical multithreaded test, with each ray being a potential thread in its own right ensuring that a workload can scale in complexity easily. This lends itself to cores, frequency and IPC: the more, the better.

POV-Ray 3.7 Beta RC4

POV-Ray is a benchmark that is usually touted as liking high IPC, high frequency and more threads. The i7-2600K, despite having double the resources of the Core i3-7350K, is only 30% ahead. 

AES via TrueCrypt

Despite TrueCrypt no longer being maintained, the final version incorporates a good test to measure different encryption methodologies as well as encryption combinations. When TrueCrypt was in full swing, the introduction of AES accelerated hardware dialed the performance up a notch, however most of the processors (save the Pentiums/Celerons) now support this and get good speed. The built-in TrueCrypt test does a mass encryption on in-memory data, giving results in GB/s.

TrueCrypt 7.1 Benchmark (AES Performance)



Alien: Isolation

If first person survival mixed with horror is your sort of thing, then Alien: Isolation, based off of the Alien franchise, should be an interesting title. Developed by The Creative Assembly and released in October 2014, Alien: Isolation has won numerous awards from Game Of The Year to several top 10s/25s and Best Horror titles, ratcheting up over a million sales by February 2015. Alien: Isolation uses a custom built engine which includes dynamic sound effects and should be fully multi-core enabled.

Alien Isolation on ASUS GTX 980 Strix 4GB ($560)

Alien Isolation on MSI R9 290X Gaming LE 4GB ($380)

Alien Isolation on MSI GTX 770 Lightning 2GB ($245)

Alien Isolation on MSI R9 285 Gaming 2GB ($240)

Alien Isolation on Integrated Graphics

Aside from a small dip by the Core i7-2600K when using the R9 285, the i3-7350K matches the other CPUs in Alien Isolation.



Total War: Attila

The Total War franchise moves on to Attila, another The Creative Assembly development, and is a stand-alone strategy title set in 395AD where the main story line lets the gamer take control of the leader of the Huns in order to conquer parts of the world. Graphically the game can render hundreds/thousands of units on screen at once, all with their individual actions and can put some of the big cards to task.

For low end graphics, we test at 720p with performance settings, recording the average frame rate. With mid and high range graphics, we test at 1080p with the quality setting. In both circumstances, unlimited video memory is enabled and the in-game scripted benchmark is used.

Total War: Attila on ASUS GTX 980 Strix 4GB ($560)

Total War: Attila on MSI R9 290X Gaming LE 4GB ($380)

Total War: Attila on MSI GTX 770 Lightning 2GB ($245)

Total War: Attila on MSI R9 285 Gaming 2GB ($240)

Total War: Attila on ASUS R7 240 DDR3 2GB ($70)

Total War: Attila on Integrated Graphics

Similar to Alien Isolation, the only discrete GPU there seems to be much of a difference between the i3 and i7 is on the R9 285, where the newer microarchitecture has the advantage. The integrated graphics in Sandy Bridge were laughable, and the Core i3 offers over double the performance here.


Grand Theft Auto V

The highly anticipated iteration of the Grand Theft Auto franchise finally hit the shelves on April 14th 2015, with both AMD and NVIDIA in tow to help optimize the title. GTA doesn’t provide graphical presets, but opens up the options to users and extends the boundaries by pushing even the hardest systems to the limit using Rockstar’s Advanced Game Engine. Whether the user is flying high in the mountains with long draw distances or dealing with assorted trash in the city, when cranked up to maximum it creates stunning visuals but hard work for both the CPU and the GPU.

For our test we have scripted a version of the in-game benchmark, relying only on the final part which combines a flight scene along with an in-city drive-by followed by a tanker explosion. For low end systems we test at 720p on the lowest settings, whereas mid and high end graphics play at 1080p with very high settings across the board. We record both the average frame rate and the percentage of frames under 60 FPS (16.6ms).

Grand Theft Auto V on ASUS GTX 980 Strix 4GB ($560)

Grand Theft Auto V on MSI R9 290X Gaming LE 4GB ($380)

Grand Theft Auto V on MSI GTX 770 Lightning 2GB ($245)

Grand Theft Auto V on MSI R9 285 Gaming 2GB ($240)

Grand Theft Auto V on ASUS R7 240 DDR3 2GB ($70)

Grand Theft Auto V on Integrated Graphics

The older Core i7-2600K eeks out a small ~5 FPS advantage over the Core i3 when running a GTX 980 at 1080p maximum settings, but with all other GPUs the differences are minimal. With integrated graphics, the Core i3 shows it can pummel the older IGP into the ground.


GRID Autosport

No graphics tests are complete without some input from Codemasters and the EGO engine, which means for this round of testing we point towards GRID: Autosport, the next iteration in the GRID and racing genre. As with our previous racing testing, each update to the engine aims to add in effects, reflections, detail and realism, with Codemasters making ‘authenticity’ a main focal point for this version.

GRID’s benchmark mode is very flexible, and as a result we created a test race using a shortened version of the Red Bull Ring with twelve cars doing two laps. The car is focus starts last and is quite fast, but usually finishes second or third. For low-end graphics we test at 1080p medium settings, whereas mid and high-end graphics get the full 1080p maximum. Both the average and minimum frame rates are recorded.

GRID: Autosport on ASUS GTX 980 Strix 4GB ($560)

GRID: Autosport on MSI R9 290X Gaming LE 4GB ($380)

GRID: Autosport on MSI GTX 770 Lightning 2GB ($245)

GRID: Autosport on MSI R9 285 Gaming 2GB ($240)

GRID: Autosport on ASUS R7 240 DDR3 2GB ($70)

GRID: Autosport on Integrated Graphics

GRID prefers a high frequency and high IPC, and so we see the Core i3-7350K getting noticably better frame rates over the 2600K at 1080p using all our high-end and mid-range GPUs - only at 720p using an R7 240 did we see a minimal difference. The integrated graphs are still amusing to look at.



Shadow of Mordor

The final title in our testing is another battle of system performance with the open world action-adventure title, Shadow of Mordor. Produced by Monolith using the LithTech Jupiter EX engine and numerous detail add-ons, SoM goes for detail and complexity to a large extent, despite having to be cut down from the original plans. The main story itself was written by the same writer as Red Dead Redemption, and it received Zero Punctuation’s Game of The Year in 2014.

For testing purposes, SoM gives a dynamic screen resolution setting, allowing us to render at high resolutions that are then scaled down to the monitor. As a result, we get several tests using the in-game benchmark. For low-end graphics we examine at 720p with low settings, whereas mid and high-end graphics get 1080p Ultra. The top graphics test is also redone at 3840x2160, also with Ultra settings, and we also test two cards at 4K where possible.

Shadow of Mordor on ASUS GTX 980 Strix 4GB ($560)

Shadow of Mordor on ASUS GTX 980 Strix 4GB ($560)

Shadow of Mordor on MSI R9 290X Gaming LE 4GB ($380)

Shadow of Mordor on MSI R9 290X Gaming LE 4GB ($380)

Shadow of Mordor on MSI GTX 770 Lightning 2GB ($245)

Shadow of Mordor on MSI R9 285 Gaming 2GB ($240)

Shadow of Mordor on ASUS R7 240 DDR3 2GB ($70)

Shadow of Mordor on Integrated Graphics

The only real difference here between the newer Core i3-7350K and the older Core i7-2600K is with our mid-range cards (GTX 770 and R9 285), whereby the older CPU seems to have a deficit 'in general' to the other CPUs we've tested. This might be CPU instruction related, although these results aren't seen on the other cards.


Power Delta (Long Idle to OCCT)



출처 - http://www.anandtech.com


싱글 스레드 퍼포먼스는 7350K가 모든 벤치마크에서 평균적으로 25% 높은 성능, 모든 코어를 활용하는 멀티 스레드 테스트에서는 7350K가 평균적으로 18% 낮은 성능, 전력소모는 7350K가 30와트 이상 적게 소모.

반응형
Posted by 랩터 인터내셔널


인텔의 신형 7세대 카비레이크 7700K 리뷰 - http://www.anandtech.com


Intel Kaby Lake S SKUs
 Cores/
Threads
Base/
Turbo
IGPL3eDRAMTDPCost
i7-7700K4/84.2/4.5HD 6308 MB-91 W$305
i7-77004/83.6/4.2HD 6308 MB-65 W$272
i7-7700T4/82.9/3.8HD 6308 MB-35 W$272
i5-7600K4/43.8/4.2HD 6306 MB-91 W$217
i5-76004/43.5/4.1HD 6306 MB-65 W$199
i5-7600T4/42.8/3.7HD 6306 MB-35 W$199
i5-75004/43.4/3.8HD 6306 MB-65 W$179
i5-7500T4/42.7/3.3HD 6306 MB-35 W$179
i5-74004/43.0/3.5HD 6306 MB-65 W$170
i5-7400T4/42.4/3.0HD 6306 MB-35 W$170
i3-7350K2/44.2HD 6304 MB-60 W$157
i3-73202/44.1HD 6304 MB-51 W$139
i3-73002/44.0HD 6304 MB-51 W$129
i3-7300T2/43.5HD 6304 MB-35 W$129
i3-71002/43.9HD 6303 MB-51 W$109
i3-7100T2/43.4HD 6303 MB-35 W$109


카비레이크 라인업 및 스펙표


CORE i7 - 4코어 8스레드(하이퍼스레딩), L3 8MB, 내장그래픽 HD 630 공통


CORE i5 - 4코어 4스레드, L3 6MB, 내장그래픽 HD 630 공통

CORE i3 - 2코어 4스레드(하이퍼스레딩), L3 4MB, 내장그래픽 HD 630 공통


각각의 모델은 베이스 - 부스트 클럭 차이, 배수락 해제 여부, 저전력 모델 차이


 

구형 스카이레이크 6700K와 카비레이크 7700K 스펙 비교

TDP, 코어 전압, 동작 클럭 차이 확인




신형 카비레이크 특징 - 인텔 3D XPoint 기술의 옵테인 메모리 지원


- 테스트 시스템


Test Setup
Processor Intel Core i7-7700K (Retail Stepping), 91W, $303
4 Cores, 8 Threads, 4.2 GHz (4.5 GHz Turbo)
Motherboards ASRock Z270 Extreme4
MSI Z270 Gaming M7
Cooling Cooler Master Nepton 140XL
Power Supply OCZ 1250W Gold ZX Series
Corsair AX1200i Platinum PSU
Memory Corsair DDR4-2400 C15 2x8 GB 1.2V or
G.Skill Ripjaws 4 DDR4-2400 C15 2x8 GB 1.2V
Memory Settings JEDEC @ 2400
Video Cards ASUS GTX 980 Strix 4GB
MSI R9 290X Gaming 8GB
MSI GTX 770 Lightning 2GB (1150/1202 Boost)
MSI R9 285 Gaming 2G
ASUS R7 240 2GB
Hard Drive Crucial MX200 1TB
Optical Drive LG GH22NS50
Case Open Test Bed
Operating System Windows 7 64-bit SP1



Dolphin Benchmark: link

Many emulators are often bound by single thread CPU performance, and general reports tended to suggest that Haswell provided a significant boost to emulator performance. This benchmark runs a Wii program that raytraces a complex 3D scene inside the Dolphin Wii emulator. Performance on this benchmark is a good proxy of the speed of Dolphin CPU emulation, which is an intensive single core task using most aspects of a CPU. Results are given in minutes, where the Wii itself scores 17.53 minutes.

Dolphin Emulation Benchmark

As shown by the data, the i7-7700K takes the top spot. At stock it edges out an overclocked Core i7-4790K at 4.7 GHz, which is no mean feat. Dolphin is all about high frequency and IPC, which the i7-7700K has the best of both.

WinRAR 5.0.1: link

Our WinRAR test from 2013 is updated to the latest version of WinRAR at the start of 2014. We compress a set of 2867 files across 320 folders totaling 1.52 GB in size – 95% of these files are small typical website files, and the rest (90% of the size) are small 30 second 720p videos.

WinRAR 5.01, 2867 files, 1.52 GB

WinRAR is more geared towards a variable threaded environment but also memory speed. While two channels of DDR4-2400 does well for the Core i7-7700K, to the point where it beats the 6-core i7-5930K, anything with eDRAM (i7-5775C) and the higher end quad channel processors with up to 10 cores do win out. But at $1700 for 10-core, the Kaby Lake CPU does well – the only processor that beats it in its price range is that eDRAM-based i7 part.

3D Particle Movement v2

3DPM is a self-penned benchmark, taking basic 3D movement algorithms used in Brownian Motion simulations and testing them for speed. High floating point performance, MHz and IPC wins the day. This is the second variant of this benchmark, fixing for false sharing in the first version, and lending itself to better multithreaded performance.

3D Particle Movement v2.0 beta-1

3DPMv2 is still new, so we don’t have too many results for it so far, but it hits the top of the mainstream processor stack as was perhaps to be expected. It scores almost double an FX-8370, showing how far Intel’s mainstream has come from AMD’s old CPUs, but the Core i7-7700K matches up to just over double the Core i3-7350K, as it has double the cores/threads and slightly more frequency.

SYSMark 2014

Engineered by BAPco (to which Intel is a consortium member), this set of tests are designed to be an office/data/media/financial range of tests using common well-known CAD, image editing, web browsing and other tools to put out a score, where a score of 1000 is attributed to an old Core i3 using a mechanical harddrive. Here we report the overall score, however the test breakdowns can be found in Bench.

SYSmark 2014 - Overall

Because SYSMark is a variety of tests that rely on response and throughput, the Core i7-7700K hits the mix just right and scores higher than even a 10-core Core i7 Extreme part launched last year, as well as a highly overclocked Devil’s Canyon. Aside from the Core i5, the 7700K does well in price/performance here.

Web Benchmarks

On the lower end processors, general usability is a big factor of experience, especially as we move into the HTML5 era of web browsing.  For our web benchmarks, we take well known tests with Chrome as installed by SYSMark as a consistent browser.

Mozilla Kraken 1.1

Kraken 1.1

Google Octane v2

Google Octane v2



Agisoft PhotoScan Benchmark - Total Time

Here’s another instance where a stock Core i7-7700K can overcome an overclocked Devil’s Canyon. Agisoft spends a good time of its workload using cache heavy threads, showing that large core parts do really well, however the i7-7700K is on par with the six-core Core i7-3960X, showing that extra IPC and frequency can make up for a core or two.

Cinebench R15

Cinebench is a benchmark based around Cinema 4D, and is fairly well known among enthusiasts for stressing the CPU for a provided workload. Results are given as a score, where higher is better.

Cinebench R15 - Single Threaded

Cinebench R15 - Multi-Threaded

While Cinebench R15 is more a synthetic, it remains a popular test to measure professional performance and is free to use. For single threaded performance, the Core i7-7700K hits the top of the pile. With the Skylake and Kaby Lake parts both at 4.8 GHz, there’s almost nothing between them, showing the identical IPC. In multithreaded mode the 7700K is on top of all the mainstream processors as expected, and when overclocked can mix it up with some of the extreme processors as well.

HandBrake v0.9.9: link

For HandBrake, we take two videos (a 2h20 640x266 DVD rip and a 10min double UHD 3840x4320 animation short) and convert them to x264 format in an MP4 container.  Results are given in terms of the frames per second processed, and HandBrake uses as many threads as possible.

HandBrake v0.9.9 LQ Film

The LQ video emphasizes IPC due to its low cache overhead, meaning that the i7-7700K wins again, and when overclocked, performs the same as the 6700K at the same frequency.

HandBrake v0.9.9 2x4K

The higher resolution video however means that cores with frequency dominate. The i7-7700K stands above processors such as the i7-5820K, the i7-4930K and the i7-3960X, which is no small feat. But if you really want performance here, the big boys are still top performers (if you can afford them).

Hybrid x265

Hybrid is a new benchmark, where we take a 4K 1500 frame video and convert it into an x265 format without audio. Results are given in frames per second.

Hybrid x265, 4K Video

Our Hybrid test is somewhat similar to the HandBrake HQ test, showing the i7-7700K sitting tall as the mainstream champion.



Legacy Tests

At AnandTech, I’ve taken somewhat of a dim view to pure synthetic tests, as they fail to be relatable. Nonetheless, our benchmark database spans to a time when that is all we had! We take a few of these tests for a pin with the latest hardware.

Cinebench R10

The R10 version of Cinebench is one of our oldest benchmarks, with data going back more than a few generations. The benchmark is similar to that of the newest R15 version, albeit with a simpler render target and a different strategy for multithreading.

Cinebench R10 - Single Threaded Benchmark

For a few years I was under the impression that CineBench’s workload was not amenable to more IPC increases, as we hovered around 7000 pts with new microarchitectures not making much of a difference. Being high frequency the i7-7700K pulls out a lead here, but it’s worth noting that Kaby Lake as a whole scores well, perhaps indicating that other features (such as frequency speed changing) can help.

Cinebench R10 - Multi-Threaded Benchmark

The multithreaded test gives different results, as this test typically prefers many cores. Rather than the new Cinebench tests dividing the scene up into over a hundred pieces (depends on threads), CB10 purely divides the scene into exactly how many threads are present. If a thread finishes early, it will try and cut the work of another thread in half. This sort of approach to multithreading has a different approach to frequency, cores and IPC, hence why R11.5 and R15 do bigger separations with core workloads.

Cinebench R11.5

CB11.5 has been popular for many years as a performance test, using easy to read and compare numbers that aren’t in the 1000s. We run the benchmark in an automated fashion three times in single-thread and multi-thread mode and take the average of the results.

Cinebench 11.5 - Single Threaded

Cinebench 11.5 - Multi-Threaded

Similar to other tests, the i7-7700K takes the single thread crown, again beating an overclocked Devil’s Canyon i7-4790K, showing the out-of-the-box performance. Again, Kaby Lake as a whole seems to do well here, thanks to 4.2 GHz turbo modes on the i5-7600K and i3-7350K.

7-zip

As an open source compression/decompression tool, 7-zip is easy to test and features a built-in benchmark to measure performance. As a utility, similar to WinRAR, high thread counts, frequency and UPC typically win the day here.

7-zip Benchmark

The Core i7-7700K shows the benefits of frequency over a stock i7-6700K, however at the same frequency they perform roughly the same as expected.

POV-Ray

Ray-tracing is a typical multithreaded test, with each ray being a potential thread in its own right ensuring that a workload can scale in complexity easily. This lends itself to cores, frequency and IPC: the more, the better.

POV-Ray 3.7 Beta RC4

AES via TrueCrypt

Despite TrueCrypt no longer being maintained, the final version incorporates a good test to measure different encryption methodologies as well as encryption combinations. When TrueCrypt was in full swing, the introduction of AES accelerated hardware dialed the performance up a notch, however most of the processors (save the Pentiums/Celerons) now support this and get good speed. The built-in TrueCrypt test does a mass encryption on in-memory data, giving results in GB/s.

TrueCrypt 7.1 Benchmark (AES Performance)

The encryption benchmark loves both threads and memory bandwidth, so we see the extreme processors pull out large leads due to 6+ cores and four memory channels. However, we see a similar picture as before to the Devil’s Canyon part: an out-of-the-box Core i7-7700K will beat an overclocked Core i7-4790K at 4.7 GHz.


Alien: Isolation

If first person survival mixed with horror is your sort of thing, then Alien: Isolation, based off of the Alien franchise, should be an interesting title. Developed by The Creative Assembly and released in October 2014, Alien: Isolation has won numerous awards from Game Of The Year to several top 10s/25s and Best Horror titles, ratcheting up over a million sales by February 2015. Alien: Isolation uses a custom built engine which includes dynamic sound effects and should be fully multi-core enabled.

Alien Isolation on ASUS GTX 980 Strix 4GB ($560)Alien Isolation on MSI R9 290X Gaming LE 4GB ($380)Alien Isolation on MSI GTX 770 Lightning 2GB ($245)Alien Isolation on MSI R9 285 Gaming 2GB ($240)

In al of our testing, aside from a couple of scores falling at the bottom depending on the CPU/GPU combo, all the CPUs perform similarly.


Total War: Attila

The Total War franchise moves on to Attila, another The Creative Assembly development, and is a stand-alone strategy title set in 395AD where the main story line lets the gamer take control of the leader of the Huns in order to conquer parts of the world. Graphically the game can render hundreds/thousands of units on screen at once, all with their individual actions and can put some of the big cards to task.

For low end graphics, we test at 720p with performance settings, recording the average frame rate. With mid and high range graphics, we test at 1080p with the quality setting. In both circumstances, unlimited video memory is enabled and the in-game scripted benchmark is used.

Total War: Attila on ASUS GTX 980 Strix 4GB ($560)Total War: Attila on MSI R9 290X Gaming LE 4GB ($380)Total War: Attila on MSI GTX 770 Lightning 2GB ($245)Total War: Attila on MSI R9 285 Gaming 2GB ($240)Total War: Attila on ASUS R7 240 DDR3 2GB ($70)


Grand Theft Auto V

The highly anticipated iteration of the Grand Theft Auto franchise finally hit the shelves on April 14th 2015, with both AMD and NVIDIA in tow to help optimize the title. GTA doesn’t provide graphical presets, but opens up the options to users and extends the boundaries by pushing even the hardest systems to the limit using Rockstar’s Advanced Game Engine. Whether the user is flying high in the mountains with long draw distances or dealing with assorted trash in the city, when cranked up to maximum it creates stunning visuals but hard work for both the CPU and the GPU.

For our test we have scripted a version of the in-game benchmark, relying only on the final part which combines a flight scene along with an in-city drive-by followed by a tanker explosion. For low-end systems we test at 720p on the lowest settings, whereas mid and high-end graphics play at 1080p with very high settings across the board. We record both the average frame rate and the percentage of frames under 60 FPS (16.6ms).

Grand Theft Auto V on ASUS GTX 980 Strix 4GB ($560)Grand Theft Auto V on MSI R9 290X Gaming LE 4GB ($380)Grand Theft Auto V on MSI GTX 770 Lightning 2GB ($245)Grand Theft Auto V on MSI R9 285 Gaming 2GB ($240)Grand Theft Auto V on ASUS R7 240 DDR3 2GB ($70)Grand Theft Auto V on Integrated Graphics


GRID Autosport

No graphics tests are complete without some input from Codemasters and the EGO engine, which means for this round of testing we point towards GRID: Autosport, the next iteration in the GRID and racing genre. As with our previous racing testing, each update to the engine aims to add in effects, reflections, detail and realism, with Codemasters making ‘authenticity’ a main focal point for this version.

GRID’s benchmark mode is very flexible, and as a result we created a test race using a shortened version of the Red Bull Ring with twelve cars doing two laps. The car is focus starts last and is quite fast, but usually finishes second or third. For low-end graphics we test at 1080p medium settings, whereas mid and high-end graphics get the full 1080p maximum. Both the average and minimum frame rates are recorded.

GRID: Autosport on ASUS GTX 980 Strix 4GB ($560)GRID: Autosport on MSI R9 290X Gaming LE 4GB ($380)GRID: Autosport on MSI GTX 770 Lightning 2GB ($245)GRID: Autosport on MSI R9 285 Gaming 2GB ($240)GRID: Autosport on ASUS R7 240 DDR3 2GB ($70)GRID: Autosport on Integrated Graphics


Power Delta (Long Idle to OCCT)



출처 - http://www.anandtech.com

반응형
Posted by 랩터 인터내셔널

quadro_p6000.jpg


TABLE.jpg



엔비디아 쿼드로 P6000 스펙

그래픽 아키텍처 : 파스칼

쿠다코어 : 3840 (파스칼 타이탄X : 3584)

베이스 클럭 : 1417MHz 부스트 클럭 : 1530MHz

싱글 프리시전 성능 : 12테라플롭스

메모리 대역 : 432 기가바이트 퍼 세컨드

그래픽 메모리 : GDDR5X 24GB (ECC 지원)

인터페이스 : 384비트

소비전력 : 250와트




p50002.jpg




SLI 지원 - 풀 사이즈 디스플레이포트 및 듀얼 링크 DVI 출력단



compute.png


compute2.png




싱글 플롯 세이더 성능 : 최고 성능

더블 플롯 세이더 성능 : 라데온 7100 최고 성능



imagepro.png


crypto1.png


crypto2.png


GPGPU 이미지 프로세싱, GPGPU 암호화 성능 : 최고 성능




spac1.png




오픈GL / DX 그래픽 테스트 : 최고 성능



luxmark.png




럭스마크 테스트 : 최고 성능



cinebench.png




시네벤치 : 라데온 7100 최고 성능



timespy.png




3D마크 타임스파이 : 최고 성능



hitman.png




히트맨 2016 다이렉트12 : 최고 성능



power.png




전력 효율 : M6000 다음 최대 전력 소모


출처 - http://hothardware.com

반응형
Posted by 랩터 인터내셔널
111_s.png


AMD는 12월 8일 그래픽 드라이버의 최신판 "Radeon Software Crimson ReLive Edition"을 공개했다. 이번에 이 드라이버에서 새로 추가된 2개의 새 기능과 드라이버 업데이트에 의한 성능 향상을 점검한다.


게임 녹화 기능 ReLive가 추가된 2세대 라데온 소프트웨어

Radeon Software Crimson ReLive Edition은 2015년 11월 예전 AMD Catalyst를 대체하는 신세대 그래픽 드라이버로서 등장한 "Radeon Software Crimson Edition" 이후 첫 메이저 업데이트 버전이 되는 드라이버이다.


이번에는 Crimson ReLive Edition에서 추가된 신기능 "ReLive" "Radeon Chill"을 테스트하고 옛 드라이버와 비교한 성능 향상율을 벤치마크 테스트로 확인한다.


테스트 GPU로 Radeon RX 480의 레퍼런스 보드를 준비했다. 기타 테스트 환경은 다음과 같다.



[표 1] 테스트 환경
CPUCore i7-6700K
메인보드ASUS Z170-A
RAMDDR4-2133 8GB×2(15-15-15-35、1.20V)
GPURadeon RX 480 8GB
스토리지480GB SSD(OCZ VTR180-25SAT3-480G)
파워 KRPW-TI700W/94+(700W 80PLUS TITANIUM)
OS

Windows 10 Pro 64bit(1607)

01_s.jpg
Radeon RX 480의 레퍼런스 보드. Polaris 아키텍처를 바탕으로 14nm FinFET 프로세스 제품의 GPU


플레이 영상의 녹화·전달 기능 "ReLive"

Crimson ReLive Edition의 핵심 기능으로 드라이버의 버젼명에도 표기된 ReLive는 게임 화면 녹화나 전송을 가능하게 하는 새로운 기능이다. 경쟁 업체인 NVIDIA가 GeForce Experience에서 제공하고 있는 Shadow Play에 가까운 기능이라고 하면 이해하기 쉽다.


02_s.jpg


ReLive에서 제공되는 주요 기능은 게임 화면의 녹화 및 전달이며 그것을 위한 툴바를 게임 화면상에 표시하는 기능이나 스크린 샷을 취득하는 기능 등도 갖추고 있다. ReLive의 설정 화면은 Radeon Software의 "Radeon 설정"에 통합되어 여기서 녹화·전달의 상세나 단축키 등을 설정한다.


녹화 기능은 임의로 녹화를 시작하는 모드 외에도 배경으로 녹화를 하는 인스턴트 리플레이 있다. 기록하는 동영상은 비트율과 해상도, 프레임 레이트를 설정할 수 있고 동영상 형식을 AVC(H.264)와 HEVC(H.265)의 2개 중에서 선택할 수 있다.


또한 동영상 형식, 해상도, 프레임 레이트의 3가지 항목은 GPU에 의해서 대응할 수 있는 설정이 한정되어 있어 GPU가 지원하지 않은 설정을 하면 불가능 하다는 경고가 표시된다. 테스트에 Radeon RX 480이 비대응 동영상 형식인 "AVC형식, 2560×1440, 60fps" 이라는 설정으로 녹화를 시도한 결과 실제로 녹화된 동영상은 "AVC형식, 2560×1440, 30fps" 으로 기록되고 있었다.


09_s.png
10_s.png
11_s.png


AMD는 ReLive가 게임의 성능에 미치는 영향이 매우 작다고 하며 실제 게임에서 프레임 속도 저하는 최대 3~4% 정도가 된다고 한다.


이 ReLive의 녹화에 의한 성능의 저하에 대해 알아본 것이 다음 그래프다.


테스트에서 ReLive의 인스턴트 리플레이 기능을 20분으로 설정, 상시 녹화를 하고 있는 상태에서 "파이널 판타지 XIV 벤치마크"를 실행했다. 녹화 설정은 1920×1080, 60fps, 50Mbps로 형식은 AVC와 HEVC를 각각 테스트하고 있다.


12_s.png


스코어의 기준이 되는 ReLive 무효시 점수가 10,476인 반면 AVC 형식으로 녹화 중일시 9754, HEVC 형식은 9671이며 ReLive의 녹화에 의한 스코어 저하는 7~8% 정도였다. AMD가 말하는 프레임 레이트의 저하율에 비하면 다소 크지만 기록하고 있는 동영상의 퀄리티를 생각하면 녹화에 의한 부하는 충분히 낮다고 하겠다.


플레이 상황에 맞게 GPU의 소비 전력을 절감하는 "Radeon Chill"

Radeon Chill은 게임 플레이 상황에 따라 동적으로 GPU의 전력을 절감하는 기능이라고 말해도 감이 잘 오지 않는데 유저의 조작에 기초하여 렌더링하는 프레임 수를 조정하고 GPU의 소비 전력을 저하시키는 기능으로 보인다.


13_s.jpg


또한 Radeon Chill은 DirectX 9~11에서 이용할 수 있는 기능인데 모든 게임 타이틀에서 이용할 수 있는 것이 아니라 Radeon Chill 대응 타이틀에서만 이용이 가능하다.


14_s.png


Radeon Chill은 Radeon 설정 게임에서 접근할 수 있는 WattMan의 한가지 기능으로 구현되고 있다. 이용하려면 우선 게임의 글로벌 설정에서 WattMan으로 Radeon Chill을 활성화 할 필요가 있으며 Radeon Chill은 글로벌 설정에서 단축 키를 설정하는 것으로 게임 실행 중에 기능을 온/오프 할 수 있다.


15_s.png


글로벌 설정에서 Radeon Chill을 활성화하면 Radeon Chill에 대응한 게임 타이틀의 개별 설정에서 Radeon Chill이 동작 조정의 기준으로 하는 프레임 레이트 상한선과 하한선을 설정하도록 된다. 표준에서는 하한이 40fps, 상한은 144fps로 설정되어 있다.


16_s.png


Radeon Chill 대응 타이틀인 "오버워치"에서 그 효과의 정도를 테스트했다. 오버워치의 설정은 화면 해상도 1920×1080, 렌더링 품질 표준으로 Radeon Chill은 40~144fps로 설정하고 있다.


17_s.jpg
18_s.jpg
19_s.jpg


Radeon Chill을 유효하게 한 상태에서 게임의 조작을 그만두면 프레임 레이트는 하한치 40fps에 다가가다. 이 상태에서 한번이라도 조작하면 프레임 레이트는 오르는데 상한 144fps에 이르는 것은 드물고 대개는 하한과 상한의 중간 값으로 렌더링 된다. 조작에 반응해 프레임 레이트가 상승하는 거동을 보면 상황에 따라서 프레임 레이트를 낮추기보다는 필요성에 따라서 프레임 레이트를 올리고 있다는 느낌이 든다.


이번에 테스트한 오버워치에서 Radeon Chill을 취소한 상태와 Radeon Chill이 최대한 전력 절약 효과를 발휘하고 있다고 생각되는 조작 상태(40fps시)에서는 대략 100W의 전력 차이가 나고 있다. 그런데 AMD는 프레임 레이트를 컨트롤하고 소비 전력을 절감하는 기능으로서 FRCT(프레임 레이트 타깃 컨트롤)이 이미 존재하고 있다. FRCT는 프레임 레이트의 상한을 설정함으로써 GPU가 렌더링 부하의 가벼운 장면을 불 필요하게 높은 프레임 레이트에서 렌더링하는 것을 막고 소비전력을 억제하는 기능이다.


20_s.png


AMD는 Radeon Chill은 FRCT를 대체하는 기능이 아니며 FRCT처럼 프레임 레이트에 엄밀한 상한을 마련하는 것은 아니라고 하고 있다. 이점에 대해서 어떤 차이가 있는지 체크해 본 것이 다음의 스크린 샷이다.


스크린 샷은 왼쪽부터 Radeon Chill·FRCT 무효시 Radeon Chill(40~144fps) 유효시 FRTC(60fps) 유효시 순으로 늘어놓고 있다.


21_s.jpg
22_s.jpg
23_s.png


이 스크린 샷은 The Witcher 3:Wild Hunt의 타이틀 화면에서 취득한 것. 이 화면은 그리기 부하가 매우 낮기 때문에 FRTC와 Radeon Chill을 취소할때 프레임 레이트는 1300fps 안팎으로 이르며 소비 전력도 155W다.


이에 Radeon Chill을 40~144fps로 활성화 했을때 프레임 레이트는 1200fps 근처로 소비 전력은 150W. FRTC를 60fps로 설정 했을때의 프레임 레이트는 60fps 미만으로 소비전력은 67W로 나타났다.


Radeon Chill을 활성화하면 프레임 레이트가 떨어지고 있지만 설정 범위 40~144fps의 범위와는 동떨어진 동작과 되는 반면 FRTC는 상한치를 넘지 못하는 수치까지 대폭 프레임 레이트가 떨어지고 있다. 이 결과는 바로 AMD가 주장하는 결과다.


Radeon Chill의 독특한 점은 게임 플레이 상황을 동작 기준으로 삼고 있다. GPU의 소비 전력이 줄어든다는 것은 GPU의 발열이 줄어들 것으로 같은 뜻인데 GPU의 발열이 줄면 GPU 쿨러의 동작 소리도 줄어들게 된다. 조작이 적은 상황에서 프레임 레이트가 떨어지는 것을 허용할 수 있다면 소비 전력, 열, 노이즈를 묶어 줄일 수 있는 Radeon Chill은 이용할 가치가 있는 기능이다.


다만 보통 60Hz 동작의 디스플레이 등을 쓰는 경우, 디스플레이의 리프레시 레이트에서 벗어난 프레임 레이트로 렌더링되면 오류가 발생한다. GPU의 전력을 줄일 수 있어도 게임 화면의 렌더링이 무너지면 의미가 없다. Radeon Chill을 진정으로 활용하려면 프레임 레이트에 디스플레이의 리프레시 레이트를 동기화시키는 FreeSync를 동시에 이용해야 한다.


FreeSync와 Radeon Chill은 궁합이 좋다기보다는 FreeSync 환경에서 GPU를 효율적으로 운용하는 기능이 Radeon Chill이라 해도 과언이 아니다. 구입할 수 있는 FreeSync 지원 모니터의 코스트는 낮다. 거기에 Radeon Chill라는 효과적인 전력 절약 기능이 추가됨으로써 Radeon 사용자가 FreeSync 환경을 구축하는 장점은 더욱 커질 것이다.


Crimson ReLive Edition과 구 버전 드라이버의 성능 비교

Crimson ReLive Edition의 특징으로서 AMD는 과거의 드라이버 성능 향상을 내걸었고, 2016년에 발매된 Polaris 아키텍처 채용 GPU인 Radeon RX 480이면 발매 당초 드라이버로부터 최대 8%의 성능 향상을 이루었다고 한다.


그 향상 정도는 어느 정도의 것인지 구 버전인 Crimson Edition의 마지막 WHQL 버전으로 16.9.2(9월 29일 버전)으로 벤치마크 테스트 점수를 비교했다.


실행한 벤치마크 테스트는 3DMark(그래프 1,2,3,4), Ashes of the Singularity:Benchmark(그래프 5), The Witcher 3:Wild Hunt(그래프 6), 오버워치(그래프 7), 다크소울 3(그래프 8), 어쌔신 크리드 신디케이트(그래프 9), 파이널 판타지 XIV 벤치마크(그래프 10), SteamVR 퍼포먼스 테스트(그래프 11).


테스트 결과 Crimson ReLive Edition의 사용으로 Radeon RX 480의 성능은 대체로 1~3% 정도 향상된다. 또 벤치마크 점수가 향상하면서도 최대 소비전력은 구 버전 드라이버와 같은 정도로 억제되어 있어 드라이버의 최적화로 전력 효율도 개선되고 있는 것 같다.



g01_s.png
g02_s.png
g03_s.png
g04_s.png
g05_s.png
g06_s.png
g07_s.png
g08_s.png
g09_s.png
g10_s.png
g11_s.png
g12_s.png


녹화 기능에만 머물지 않는 기능 추가, 성능 향상이 매력인 Crimson ReLive Edition

이상과 같이 Radeon Software ReLive Edition의 새로운 기능 두가지와 성능을 점검했다.


Radeon 설정에 통합되는 AMD 순정 녹화 기능 ReLive의 구현이 큰 장점인 것은 말할 필요도 없지만 FreeSync 환경에 적합한 전력 절약 기능인 Radeon Chill과 새로운 GPU 최적화에 의한 성능 향상은 최신 GPU를 사용하고 있는 Radeon 사용자에게 큰 혜택을 줌과 동시에 Radeon의 구입을 검토하는 사용자에게도 크게 매력적인 것이다.


향후 업데이트를 통해 각 GPU가 ReLive로 이용할 수 있는 녹화 설정과 Radeon Chill 대응 게임 타이틀의 확충도 기대된다.


출처 - http://pc.watch.impress.co.jp/docs/topic/review/1033776.html

반응형
Posted by 랩터 인터내셔널

방열판을 장착하고 가격도 지금까지의 제품에 비해 훨씬 저렴해진 PLEXTOR "M8PeG" 시리즈 시작으로 TLC 3D NAND 플래시를 채용한 인텔 "600p"시리즈 등 신제품이 속속 등장하고있다.



재입고 기다리는 사람이 많을 PHM2-GB 시리즈. 유통량이 증가하면 MLC NAND 플래시 채용한 M.2 SSD 가격 기준이 될 수도


M.2 SSD 춘추 전국 시대가 도래했다는 느낌속에서 ADATA가 12월 상순 발매 예정인 NVMe1.2 규격 PCI Express Gen3 x4 대응 M.2 SSD 'XPG SX8000 시리즈의 성능을 확인해보자.



11월 하순 발매 예정인 ADATA의 최신 NVMe M.2 SSD "XPG SX8000" 시리즈

후발인 만큼 기대가 높아진 "XPG SX8000" 시리즈

"XPG SX8000" 시리즈는 ADATA 최초의 NVMe1.2 규격의 PCI Express Gen3 x4 대응 M.2 SSD.

현 시점에서 국내 판매 예정인 용량 라인업은 128GB/256GB/512GB의 3가지 모델(1TB 모델은 형식 번호, 스펙 미확정)이며 NAND 플래시는 2D MLC NAND 보다 내구성이 높아지고 있는 3D NAND. 

컨트롤러는 Silicon Motion "SM2260"을 채용하고 NAND 플래시의 일부를 SLC 모드로 동작시키는 "SLC캐시" 와 DRAM 캐시로 고속화를 꾀하고 있다.




용량 512GB 모델의 "ASX8000NP-512GM-C"


최대 전송 속도는 시퀀셜 읽기 2400MB/sec, 쓰기 1000MB/sec, 랜덤 읽기 10만 IOPS, 랜덤 쓰기 14만 IOPS다. 또한 ADATA의 사이트에는 최대치만 명시되었기 때문에 용량별 전송 속도를 회사측에 확인해 정리했다.


XPG SX8000스펙 표
형번ASX8000NP-128GM-CASX8000NP-256GM-CASX8000NP-512GM-C
용량128GB256GB512GB
NAND 플래시3D MLC NAND
컨트롤러Silicon Motion SM2260
시퀀셜 읽기1000MB/sec2500MB/s2400MB/sec
시퀀셜 쓰기300MB/sec600MB/sec1000MB/sec
랜덤 읽기4만5000IOPS8만IOPS10만IOPS
랜덤 쓰기7만5000IOPS13만IOPS14만IOPS
MTBF200만시간
제품 보증5년


NAND와 DRAM 캐시는 후면에도 탑재

실제로 용량 512GB의 "ASX8000NP-512GM-C"를 보자면 기판 표면에는 NVMe1.2 규격의 Silicon Motion제 컨트롤러 "SM2260" 외 마이크론제 NAND 플래시 ×2, DRAM 캐시(DDR3L 메모리) ×1. 그리고 뒷면에도 마이크론제 NAND 플래시 ×2와 DRAM 캐시 ×1을 탑재하는 양면.



컨트롤러와 더불어 양면 모두 Micron의 3D MLC NAND 플래시가 4장, DDR3L 메모리 DRAM 캐시를 2장 탑재


컨트롤러는 인텔 "600p" 시리즈에도 채용되고 있는 Silicon Motion의 "SM2260"을 채용.히트 스프레더의 역할을 하는 은색 스티커가 붙어 있는 것도 마찬가지


Micron의 3D NAND플래시 메모리로 FBGA Code "NW825"의 "MT29F1T08CMCBBJ4-37:B"를 양면 모두 4장(128GB × 4장) 탑재한다


DRAM 캐시는 DDR3L-1600 256MB의 NANYA "NT5CC128M16IP-DI". DRAM 캐시 용량은 양면 모두 512MB



이어 LGA 1151 메인보드의 M.2 슬롯에 "ASX8000NP-512GM-C"를 탑재하고 성능을 체크한다.

OS는 별도로 준비한 SSD로부터 기동하고 각종 벤치마크는 "ASX8000NP-512GM-C"에 데이터가 없는 깨끗한 상태에서 실행하고 있다. 검증 장비의 상세 내역은 다음 표와 같다.



테스트 환경
CPUIntel「Core i7-6700K」
(4GHz/4코어/8스레드 )
메인보드ASUS「Z170M-PLUS」
(Intel Z170 Express)
메모리G.Skill「F4-3000C15Q-32GRK」
(PC4-24000, 8GB ×2)
그래픽CPU 내장 GPU(Intel HD Graphics 530)
시스템 SSDSanDisk「Extreme Pro 240GB」
(SATA3 240GB)
파워Seasonic「SS-750KM」
(750W/80PLUS GOLD)
OSWindows 10 PRO(64비트)


각종 벤치마크를 실행하기 전에 갑자기 문제가 발생했다. OS 기동용으로 쓰고 있지 않음에도 불구하고 "CrystalDiskInfo 7.0.4"를 기동하면 온도가 61도의 레드존 표시로…….

 

"HWiNFO64"에서 온도를 확인하면 최소 57도로 상당히 불안한 온도를 기록했다. 테스트 삼아 "CrystalDiskMark 5.1.2"의 최소 데이터 사이즈인 50MiB를 실행하면 시퀀셜 쓰기 테스트 시작때는 70도까지 올라가고 말았다.


 


ASUS "Z170M-PLUS"


때문에 이번 테스트에서는 메인보드 팬 컨트롤러 기능에서 CPU 쿨러의 회전수 최저치를 2300rpm 정도로 설정, 아이들시 49도 안팎이 되게 테스트를 하기로 했다.


실온 24도 정도의 상태에서 아이들시 61도...


아이들 상태에서 온도가 높아 데이터 사이즈 50MiB 완료 전에 70도까지 상승했다


ASUS 메인보드로만 테스트했기 때문에 궁합의 문제 가능성도 버릴수 없지만 PCIExpress ×4 변환 카드에 탑재했을시에도 아이들 상태에서 57도가 되어 있었다. 또 OS 실행 직후 50도대였던 것도 있었지만 "ASX8000NP-512GM-C"에 읽기 쓰기 액세스가 전혀 없는 상태에서도 서서히 온도가 상승하면서 결국 57도 안팎이 되어 버렸다. 컨트롤러가 뭔가 작업을 벌이고 있을까.

 

또한 성능이 저하하는 서멀 슬롯링의 문턱 값은 65도 안팎으로 낮게 된 듯하다. 궁합 문제의 가능성이나 발매전 제품이기 때문에 장담은 못하겠지만 안정된 퍼포먼스를 발휘하려면 PC 케이스의 프론트 팬들로부터 에어 플로가 있는 위치에 M.2 슬롯을 갖춘 메인 보드에서 운용하거나 컨트롤러 등에 히트 싱크를 받은 냉각 대책은 필수다.



65도를 넘으면 성능이 저하


시작부터 잡음이 있었던 "XPG SX8000"의 용량 512GB 모델 "ASX8000NP-512GM-C"를 벤치마크 "AS SSD Benchmark 1.9.5986.35387","ATTO Disk Benchmark 3.05","CrystalDiskMark 5.1.2"의 3종류에서 퍼포먼스를 체크한다.

 

우선 "CrystalDiskMark 5.1.2"에서 데이터 사이즈의 차이에 영향이다. 50MiB~32GiB의 9개 데이터 사이즈를 실시하면 각 사이즈로 큰 차이가 나지 않고, 시퀀셜(Seq Q32T1)읽기는 2400MB/sec전후, 쓰기는 1180MB/sec 가량을 기록했다.

 

랜덤(4K Q32T1)도 읽기 400MB/sec, 쓰기 600MB/sec 대로 되어 있으며 IOPS 기준은 읽기 10만 IOPS, 쓰기 14만 IOSP에 이른다.



50MiB100MiB500MiB


1GiB2GiB4GiB


8GiB16GiB32GiB


이어서 "AS SSD Benchmark 1.9.5986.35387" / "ATTO Disk Benchmark 3.05"의 결과를 본다.



AS SSD Benchmark 1.9.5986.35387의 MB/sec와 IOPS 표기


ATTO Disk Benchmark 3.05의 결과


PLEXTOR "M8Pe" 시리즈 등의 최신 M.2 SSD일 경우 정상적으로 퍼포먼스를 계측하지 못한 "AS SSD Benchmark 1.9.5986.35387"이지만 "ASX8000NP-512GM-C"는 문제없이 시퀀셜 읽기 1667MB/sec, 쓰기 1119.29MB/sec, 랜덤 읽기 400.31MB/sec(10만 2480IOPS), 쓰기 574.74MB/sec(14만 7133IOPS)를 기록. 이것도 랜덤 읽기, 쓰기는 확실히 공칭 값을 넘어섰다.

 

데이터 사이즈로 다소 브레드 경향이 나왔지만 "ATTO Disk Benchmark 3.05"도 문제 없이 계측할 수 있으며 최대치는 읽기 2150MB/sec, 쓰기 1193MB/sec의 좋은 결과를 내고 있다.


괜찮은 퍼포먼스를 발휘한 "XPG SX8000" 시리즈의 용량 512GB 모델 "ASX8000NP-512GM-C" 는 역시 냉각 대책이 돛대가 될 만한 점과 256GB에서 1만 4000엔 전후, 512GB로 2만 8000엔 안팎으로 좀 더 보태면 히트싱크를 장비하고 랜덤 성능이 높은 PLEXTOR"M8PeG"시리즈를 구입할 수 있는 가격대는 미묘하다. 속도면에서는 불만이 없으므로 히트싱크 구현버전의 판매나 가격 하락을 기대하고 있다.


ADATA 최초의 NVMe M.2 SSD가 되는 "XPG SX8000" 시리즈. 성능은 더할 나위 없지만 동작 온도는 테스트 환경 고유의 가능성이 저버리지 않았지만 선택지가 늘고 있는 NVMe M.2 SSD 전선에 참전하려면 중요하다


ADATA에 확인한 결과 SSD의 온도에 대해서는 문제없다고 한다. 문제가 없어서 파는 것은 지극히 당연한 것이지만 아이들시 온도가 60도를 넘고 있는 것은 사용자에게는 아쉬운 대목이다. 오히려 이 온도 문제를 어떻게 극복하는가로 어떤 의미에서는 조립 마니아의 개조심을 자극하는 제품을 완성했다고 할 수 있다.



출처 - http://ascii.jp

반응형
Posted by 랩터 인터내셔널