애플이 개발자 이벤트 WWDC 2018을 개최하고 iOS 12를 발표했습니다.


새로운 iOS 12에서 앱 기동은 40%, 키보드 표시는 50%, 카메라 구동은 70% 고속화되고, 특히 고 부하시 동작 최적화를 실현하여 최대 2배의 고속화를 실현하고 있습니다. CPU를 최대 성능에 바로 도달하도록 튜닝 함으로써 스크롤이나 앱 기동 등에 쾌적한 동작을 실현합니다. 


ARKit도 업데이트되어 Pixar와 공동으로 개발한 새 파일 포맷 usdz로 AR 콘텐츠를 공유할 수 있게 됐습니다. 사진 앱은 검색 기능이 강화되고 시설이나 이벤트 이름, 액티비티 등에서 검색이 가능합니다. 또, Siri에는 숏 컷 기능이 추가되면서 임의의 음성 명령으로 설정한 동작을 실행시킬 수 있어 복수의 앱을 조합해 거시적으로 실행할 수 있는 것도 특징입니다.


새 앱/기능으로서는 앱별 이용 시간이나 통지 수 등을 가시화하는 Screen Time 앱이 추가되어 Screen Time에서는 앱 이용 시간을 스스로 제한하는 이용이나 아이의 iOS 장치 정보를 확인하거나 이용을 제한하는 퍼렌틀 컨트롤 기능도 갖추고 있습니다.


그 외 애니모지(Animoji)기능을 강화했고, 자신을 닮은 아바타를 만들 수 있는 Memoji 추가, Facetime은 새로 32명까지 그룹 통화에 대응하고 있습니다.


iOS 12 대응 기기는 iOS 11과 마찬가지로 iPhone 5s 이상을 지원합니다.




반응형
Posted by 랩터 인터내셔널

Microsoft 관련 보안 연구가인 Longhorn(@never_released)이 애플의 차기 아이폰 시리즈에 탑재되는 A12 프로세서의 코드 네임을 밝혔습니다.


그에 따르면 A12 시리즈 프로세서의 코드 네임은 Vortex이며 파트 넘버는 A12 프로세서가 T8020, A12X 프로세서가 T8027 입니다. 그 동안 A 시리즈 프로세서의 코드 네임은 A9가 Hurricane(허리케인), A10 Fusion이 Zephyr(제퍼), A11 Bionoc은 Monsoon(몬순)으로 바람에 얽힌 명칭이였는데 A12도 바람과 얽힌 이름으로 보이고 있습니다.


또한 A12 프로세서는 이미 양산이 시작되고 있으며 TSMC가 7나노 공정으로 제조하고 있어 10나노 비해 에너지를 40% 절약하고, 성능은 20% 증가가 예상되고 있습니다.

반응형
Posted by 랩터 인터내셔널


NVIDIA는 4일(대만시간) 타이베이에서 기자 회견을 개최하고 CEO 젠슨 황이 로봇이나 드론과 같은 자율 동작형 기계의 "뇌"로 사용하는 개발 플랫폼 "Jetson Xavier"을 발표했다. 가격은 1,299달러.


Jetson Xavier는 "Jetson TX2"의 후계가 되는 모델로 GPU에는 Volta 아키텍처를 채용한다. TX2와 비교해 10배의 전력 효율과 20배의 성능을 달성하고 딥 러닝 기술을 구사한 본격적인 자율 동작형 머신을 실현한다.


CPU에는 8코어 ARMv8.2 대응 64bit CPU 탑재. L2는 8MB, L3은 4MB. Tensor 코어가 내장된 Volta 아키텍처 GPU를 채용하고 CUDA 코어 수는 512기. 12nm FinFET 프로세스에서 제조되고 있으며 최대 TDP는 30W로 10W나 15W의 동작 모드로 전환할 수 있다.


메모리는 LPDDR4x, 버스 폭은 256bit, 용량은 16GB. 스토리지는 eMMC 5.1 32GB. 또 7-way VLIW 프로세서를 채용한 비전 엑셀러레이터, 4K60p × 2에 대응한 비디오 인코더/디코더 등을 탑재한다. 본체 크기는 100×87×16mm(폭×두께×높이)


인터페이스는 eDP/DisplayPort/HDMI, 16레인 CSI-2(D-PHY V1.2에서는 40Gbps, CPHY v1.1에서는 109GB/s) 및 8레인 SLVS-EC 같은 카메라 입력(최대 16기 대응), 16GT/s에 대응한 PCI Express(5레인), USB 3.1×3, USB 2.0×4, Gigabit Ethernet, UFS, I2S, I2C, SPI, CAN, GPIO, UART, SD 등을 갖춘다.


출처 - https://pc.watch.impress.co.jp/docs/news/1125580.html

반응형
Posted by 랩터 인터내셔널


ASUS는 5일(현지시간) 메인 스트림을 위한 15.6형 노트북 "VivoBook S15(S530)" 및 14형 노트북 VivoBook S14(S430)을 발표했다.


팝적인 컬러 라인업이 특징으로 젊은층을 겨냥하고 있다. 본체 색상은 Firmament Green, Star Grey, Silver Blue, Gun Metal, Icicle Gold의 5종류. 측면과 선반이 다른 투톤 컬러를 채용하고 액정을 열면 키보드가 3.5도 틸트 하는 ErgoLift 힌지를 갖춘다.


S15/S14함께 VivoBook과 최초로 3변협 액자 액정(NanoEdge)을 채용. 화면 점유율은 S15이 86%, S14이 84%. 또한 Windows Hello대응의 지문 센서도 갖추며 S15는 풀 사이즈 키보드를 탑재하고 키 스트로크 1.4mm를 확보했다.


배터리는 일반적인 리튬 이온의 3배 수명을 실현하는 ASUS Battery Health Charging 기술로 배터리의 퇴화를 막고 안전하게 충전할 수 있다. 더불어 60%까지 49분 급속 충전할 수 있다.


사양은 거의 공통으로 CPU는 Core i3-8130U/Core i5-8250U/Core i7-8550U, 메모리는 최대 16GB, 스토리지는 128GB/256GB/512GB SSD+500GB/1TB HDD(S15는 2TB HDD도 선택 가능), GPU는 CPU내장/GeForce MX130/GeForce MX150, 액정은 1920×1080 대응(S15는 1366×768스튜던트도 선택 가능) OS는 Windows 10 Home또는 Pro.


인터페이스는 USB 3.0×2(1기는 Type-C), USB 2.0, HDMI 출력, microSD 카드 리더, IEEE 802.11ac 대응 무선 LAN, Bluetooth 4.2, 음성 입출력 등을 갖춘다. 배터리는 3셀 42Wh. 본체 크기 및 중량은 S15가 361.4×243.5×18mm(폭×두께×높이)/1.8kg, S14가 323.4×225.5×18mm(동)/1.4kg.


출처 - https://pc.watch.impress.co.jp/docs/news/1125398.html

반응형
Posted by 랩터 인터내셔널
01_l.jpg

CG32


ASUS는 4일 COMPUTEX 2018 개최에 맞추어 31.5형 게이밍 4K 액정 디스플레이 CG32를 발표했다. 발매는 2018 연내 예정.


3840×2160 VA 패널을 채용하고 HDR10 콘텐츠 표시에 대응한다. 백 라이트를 권역으로 분할하고 제어하는 로컬 디밍그로 피크 휘도 600cd를 실현한다. VESA가 정한 DisplayHDR 600 규격에 준거하며 DCI-P3 커버율은 95%


가정용 게임기용 게이밍 디스플레이를 강조하고 있으며 40~60Hz 구동시 "Adaptive-Sync"에 대응. 가정용 게임기에는 Xbox One X 및 Xbox One S가 FreeSync(=Adaptive-Sync)에 대응하고 있다.


일반적인 TV는 27~50ms 정도의 표시 지연이 발생하는 반면, 본 제품은 13ms로 저 지연인 것도 어필하고 있다. 스탠드부에는 게임 패드를 설치할 공간을 마련, 충전 전용 USB 포트 2개 배치, 또한 통신 가능한 2포트 USB 3.0 Hub도 탑재한다.


입력은 DisplayPort 1.2 및 HDMI 2.0×3.5W+5W스피커를 갖춘다.



02_l.jpg
VG49V


CG32와 동시에 49형 "VG49V", 34형 "ProArt PA34V" 울트라 와이드 액정 2제품도 발표되고 있다.


VG49V는 가로 세로비 32:9 3840×1080 VA 패널을 채용한 게이밍 디스플레이로 곡률 1800R의 커브드 디자인 채용. 2018년말 발매를 예정한다.


최대 144Hz 구동 고속 리프레시 레이트에 대응하고 48~144Hz로 FreeSync를 지원한다. 백 라이트를 순간적으로 명멸하는 "Extreme Low Motion Blur" 기능으로 응답 속도 1ms를 실현.


입력은 DisplayPort 1.2, HDMI 2.0×2.5W+5W 스피커를 갖춘다. ProArt PA34VC는 34형 3440×1440 IPS 패널을 채용한 21:9 비율의 액정 디스플레이. 곡률 1900R 커브드 디자인을 채용하고 2018년 내 발매를 예정한다.


영상 편집이나 사진가 등 프로용 제품으로 sRGB 커버율 100% 실현. 출하시 보정 색차 2미만(⊿ E<2)을 떨치며 40~100Hz에서 동작하는 Adaptive-Sync 기능도 갖추어 게임 용도에도 부드러운 표시를 지원하고 있다.


입력은 Thunderbolt 3×2, DisplayPort 1.2, HDMI 2.0×2.


03_l.jpg
ProArt PA34VC


출처 - https://pc.watch.impress.co.jp/docs/news/1125612.html

반응형
Posted by 랩터 인터내셔널
002_l.jpg


Intel은 COMPUTEX 기조 강연에 상당하는 e21FORUM에 등단해 향후 공표할 신제품이나 새로운 테크놀로지에 관한 설명을 진행했다.


현지 시간 14시부터 진행된 기조 강연에는 Intel 상급 부사장 겸 클라이언트 컴퓨팅 사업 본부장 그리고 브라이언트가 등단했고 이 회사의 신제품이나 전략에 대한 설명을 진행했다.



차세대 클라이언트 CPU인 Whiskey Lake-U, Amber Lake-Y 가을 투입

이 가운데 그는 회사가 개발을 계속해 온 차세대 클라이언트 PC용 프로세서 Whiskey Lake-U, Amber Lake-Y에 대해 언급했다.


두 제품은 8세대 Core 프로세서의 새로운 에디션으로 추가될 전망. 이미 17개의 디자인 우인을 취득했고 스펙 등의 자세한 내용에 관해서는 설명되지 않았지만 올해(2018년) 가을에 출하가 시작될 예정이다.


또한 OEM 업체 소식통의 정보에 따르면 Whiskey Lake-U는 그 이름으로도 알 수 있듯이 TDP 15W 프로세서로 2in1 기기 및 초박형 노트 PC 용.


현재의 Kaby Lake-R(Kaby Lake Refresh)과의 차이는 CPU에 통합되는 PCH가 Ice Lake용 PCH로 개발된 14nm세대의 것으로 바뀐다는 점이다. 이 때문에 칩의 기능으로서는 USB 3.1 Gen2에 대응하는 등의 특징을 갖추게 되는데 그것이 Whiskey Lake-U에 쓰이는지는 분명치 않다. CPU에 관해서는 Kaby Lake-R과 기본적으로는 마찬가지로 쿼드 코어가 될 전망이다.


Amber Lake-Y도 그 이름에서 볼 수 있듯 Y 프로세서로 불리는 팬리스 2in1장치용 제품이다. 단, 종래의 Y 프로세서 TDP 틀이 4.5W인 반면 이 Amber Lake-Y는 TDP의 범위가 5W. 방열 소재 등의 진화 등에 의해 5W로도 대응이 가능하다고 판단된 것으로 보인다.


TDP가 5W가 되면서 Amber Lake-Y는 클럭 주파수가 Kaby Lake-Y 세대에 비해서 상승됐고, 성능이 향상되고 있다는 것이 특징이다.(CPU는 여전히 듀얼 코어) 통상 PC 업계에서는 신세대 프로세서가 9월 초 독일 베를린에서 열리는 IFA에서 발표되면서 장착 제품이 그 자리에서 OEM 업체로부터 발표되고, 가을부터 크리스마스 판매 경쟁기까지 제품이 등장하는 스케줄로 제품의 전개가 이뤄진다.


아마 이번에 발표된 Whiskey Lake-U, Amber Lake-Y도 그런 스케줄로 제품이 등장하게 되지 않을까.



104_l.jpg

Cascade Lake-X로 보이는 28코어 HEDT 클라이언트 프로세서 시연

그 외 28코어 클라이언트 전용 프로세서 테크놀로지 프리뷰를 기조 강연에서 진행했다. 자세한 내용에 관해서는 드러나지 않고 있지만 Intel이 개발 중인 Cascade Lake-X로 보인다.


OEM 업체 소식통의 정보에 따르면 Cascade Lake-X는 현재의 Core X 프로세서에 이용되고 있는 Skylake-X, Kaby Lake-X의 후계 제품으로 올해 4분기에 발매가 예정된 HEDT 하이엔드 톱 컴퓨터용 제품이다.


원래 Cascade Lake는 Cascade Lake-SP로 서버용으로 계획된 제품으로 14nm++라고 불리는 Intel의 14nm의 최신 프로세스 노드에서 제조된다. Cascade Lake-X에는 최대 28코어 SKU가 계획됐으며 이번에 진행한 기술 프리뷰에도 그것이 이용되고 있다.


또 Intel은 Optane의 최신 제품으로 905P 시리즈 4제품을 추가한 것도 발표했다. 이 중에는 380GB M.2 형상의 제품도 포함됐으며 그 동안 Optane을 이용하지 못한 노트 PC 등에서도 향후 Optane을 스토리지로서 선택할 수 있게 된다.



출처 - https://pc.watch.impress.co.jp/docs/news/event/1125404.html



반응형
Posted by 랩터 인터내셔널


세계 1위 소프트웨어 기업 마이크로소프트(Microsoft)는 4일, 코드 관리 서비스를 제공하는 깃허브(GitHub)를 인수한다고 공식 발표했다.


Microsoft CEO 사티아 나델라(Satya Nadella)는 GitHub와 협력하여 개발자의 자유와 개방성, 혁신에 대한 약속을 강화하겠다고 밝혔다. 인수 후 Xamarin 창설자이기도 한 Microsoft 부사장 Nat Friedman이 GitHub의 CEO에 취임한다. GitHub의 현 CEO인 Chris Wanstrath는 Microsoft의 테크니컬 펠로우로 변경된다.


운영은 Microsoft로부터 독립하며 업계의 모든 개발자에 개방적인 플랫폼을 제공한다는 방침이다. 인수 금액은 75억달러로 Microsoft의 주식으로 지급되며 최종 인수는 연내까지 완료할 예정.

반응형
Posted by 랩터 인터내셔널


인텔의 상급 부사장 겸 클라이언트 컴퓨팅 사업 본부장 브라이언트는 창립 50주년, 그리고 8086 프로세서의 출시 40주년을 기념한 제품으로 "Core i7-8086K"를 발표했다.


Core i7-8086K는 개발 코드 네임 Coffee Lake-S로 불리는 CPU 6코어의 14++에서 제조되는 제품이다. 최대의 특징은 Turbo Boost 5GHz의 클럭 주파수를 실현하면서 Turbo Boost시 공식 스펙으로 5GHz를 정식으로 한 제품은 Core i7-8086K가 첫 제품이다. 또한 이른바 "K SKU"의 제품이기 때문에 CPU 배수록은 해제되었으며 배율을 변경하는 오버클럭도 가능하게 되어 있다.


인텔은 1968년 7월 18일 고 로버트 노이스와 고든 무어가 설립하면서 시작됐다. 올해(2018년)은 그 50주년을 기념할 나이가 된다. 그와 동시에 올해는 1978년에 발매된 8086 프로세서의 40주년에도 해당한다. 8086 프로세서는 Intel Architecture가 x86으로 통칭되는 것으로 보듯이 현재의 PC 프로세서의 기초가 된 제품이다.


이번에 발표된 Core i7-8086K는 그러한 인텔의 50주년, 그리고 8086의 40주년(1978년 6월 8일 발표)을 기념한 제품으로 계획되어 있어 그것을 축하하는 제품이다. 물론 명칭은 8086 프로세서에 따고 있는 것은 명백할 것.


Core i7-8086K는 LGA1151 전용 데스크탑 프로세서로 14nm++에서 생산된 Coffee Lake-S 기반 제품이다. 이 때문에 Intel 300 시리즈 칩 세트를 탑재한 메인보드, Coffee Lake-S에 대응한 CPU 소켓을 탑재한 메인보드와 조합해서 이용할 수 있다. CPU 코어는 기존 Coffee Lake-S 기반 제품과 마찬가지로 6코어/12스레드, L3캐시가 12MB.


Core i7-8086K의 특징은 Turbo Boost 5GHz를 실현하는 것이다. 그 동안의 Core i7-8000 시리즈의 최상위 SKU인 8700K 베이스가 3.7GHz, Turbo Boost시 최대 4.7GHz에 비해 베이스가 4GHz, Turbo Boost시 최대 5GHz로 올리고 있다.


Turbo Boost 일때지만 공식적인 스펙으로 5GHz를 넘어선 것은 이번 Core i7-8086K가 처음으로 50주년 기념 모델에 걸맞은 제품이다(50주년 5에 걸치고 5GHz인 것이라고 볼 수 있을 것). 또한 이 Turbo Boost시 최대라는 것은 싱글 코어시 이야기로 모든 CPU 코어를 Turbo Boost에서 클럭을 끌어올렸을 경우에는 4.3GHz.(이 점은 다른 Coffee Lake-S 스펙도 마찬가지)


내장되어 있는 GPU는 Intel UHD Graphics 630, 클럭 주파수는 베이스시 350MHz, Turbo Boost시 1.2GHz로 이쪽은 8700K과 완전히 동등한 스펙이다.


Core i7-8086K의 판매는 CPU 자체, OEM 업체 데스크탑 PC에 내장되는 2가지 판매 방법으로 진행 될 예정으로 8086 프로세서 발표 기념일인 6월 8일 오전 0시 1분(미국 태평양 시간, 한국 시간은 6월 8일 16시 1분)부터 판매가 시작될 전망이다.


8086개의 이 제품을 선물하는 24시간 제한 이벤트도 예정되어 있다. 캠페인에 관한 자세한 내용은 Intel의 Web사이트(영문)을 참조하길 바라며 한국에서도 참여할 수 있다.

반응형
Posted by 랩터 인터내셔널
008_l.jpg


인텔이 인공지능 관련 행사 "AIDC(AI DevCon)"를 개최하고 회사의 AI 프로세서에 관한 새 전략을 설명했다. 그 발표 내용은 이미 뉴스 기사로 전했는데 본 기사에서는 이들의 발표가 향후의 기계 학습(머신 러닝)/심층 학습(딥 러닝) 프로세서 시장에 어떠한 영향을 미칠지에 대해 살펴본다.


이번 발표에서 주목되는 것은 현재는 테스트 출하에 머물고 있는 "Lake Crest"의 후계에 해당하는 "Spring Crest"가 2019년 말까지 상용 출시되는 것, FPGA, Movidius VPU(Vision Processing Unit) 등 하드웨어의 최적화를 자동으로 처리하는 컴파일러 "nGRAPH" 2가지.



NVIDIA의 GPU+CUDA가 심층 학습에서 독주 체제

이제 IT 업계에서는 "AI"가 가장 중요한 기술이다. 기계 학습/심층 학습 기법을 활용한 AI는 스마트폰, PC 등의 클라이언트 기기에 있어서도 중요한 기술이 되고 있다.


예를 들어 Windows 10에 탑재되고 있는 "Cortana", iOS 디바이스에 탑재되고 있는 "Siri" 등의 AI 보조 기능은 클라이언트 측에서 음성을 기록하고 클라우드로 보내며 클라우드 측은 기계 학습/심층 학습의 추론 기능을 이용하여 음성 인식, 그것에 입각한 데이터를 분석하고, 순식간에 클라이언트 장치로 결과를 보내게 된다.


이러한 기계 학습/심층 학습을 이용한 AI는 인텔과 엔비디아가 제공하고 있는 프로세서를 이용하여 연산되고 있다. 그것들이 이용되고 있는 연산 종류를 나누면 크게 3개로 나뉜다.


1. 클라우드 서버에서 기계 학습/심층 학습
2. 클라우드 서버에서 기계 학습/심층 학습 추론
3. 엣지 디바이스(클라이언트 측)기계 학습/심층 학습 추론


학습이란 것은 인간의 뇌를 본뜬 DNN(Deep Neural Network) 등에서 데이터를 읽고, 그 답을 주거나 하는 말 그대로 학습시키는 프로세스다. 유아에게 개를 개, 고양이를 고양이라고 가르치는 것처럼 AI에게 개를 개, 고양이를 고양이로 주입하는 프로세스라고 생각하면 쉽다.


인간도 양질의 서적을 읽으면 지식이 비약적으로 늘고 더 현명해지듯이 DNN에도 양질의 데이터를 가져오는 만큼 현명해져 많은 AI 개발자가 이 학습 과정에 코스트와 시간을 보내고 있다.


추론이라는 것은 학습을 마친 DNN 등을 이용하여 이동해 온 데이터가 개인가, 고양이인가를 판단하는 프로세스다. 이 추론은 클라우드 서버상에서 진행되는 것도 있으며 클라이언트 디바이스 측에서 진행되는 것도 있다.


이 중 지금까지 기계 학습/심층 학습을 처리하는 반도체에서 초점을 맞춰 온 것은 주로 클라우드 서버의 학습에 이용하는 프로세서다. 그 시장에서 압도적인 리더로 여겨지는 것은 NVIDIA로 Tesla GPU와 프로그래밍 모델 CUDA의 조합은 그 높은 성능으로 지지를 받고 있다.


특히 NVIDIA는 NVSwitch로 불리는 NVLink를 스위칭하는 컨트롤러를 12개 도입함으로써 16 GPU를 하나의 GPU로 다룰 수 있는 "DGX-2"을 발표했으며 심층 학습의 학습 시간이 병목이 됐던 AI 개발자를 열광시키고 있다.



001_l.jpg
002_l.jpg
003_l.jpg


인텔은 "원 사이즈 피츠 올"이 아닌 복수의 선택 사항을 제공하는 전략

NVIDIA의 뒤를 쫓는 인텔도 기계 학습/심층 학습에서 주요 벤더 중 하나다. 왜냐하면 NVIDIA의 GPU는 독립적으로는 움직이지 않고 반드시 CPU가 필요하기 때문이다. 그 CPU는 예외 없이 인텔의 Xeon이 사용되고 있으며 NVIDIA의 점유율=인텔의 점유율이다.


또 NVIDIA의 GPU가 사용되지 않은 서버에서 기계 학습/심층 학습이 진행되는 사례도 다수 있다. 너무 큰 데이터가 없는 경우에는 GPU를 쓰지 않고도 충분히 학습할 수 있어 CPU 만으로 성능이 충분한 경우가 많기 때문이다. 그러한 니즈를 대상으로 인텔은 개발 툴을 확충하여 "Math Kernel Library-Deep Neural Network(MKL-DNN)" 등을 제공한다.


이번에 열린 AIDC에서는 Google이 제공하는 프레임워크 "TensorFlow"와 MKL-DNN을 이용하여 Xeon의 최적화를 추진한 결과 추론시 성능이 CPU 노드 스케일링보다 높은 성능으로 실현할 수 있다고 설명했다.



004_l.jpg


하지만 인텔의 기계 학습/심층 학습 솔루션은 Xeon 만이 아니다. AIDC의 기조 강연에 등단한 인텔의 이사 겸 AI 제품 사업 본부장은 "앞으로 기계 학습/심층 학습은 원 사이즈 피츠 올은 아니다" 라고 몇번이나 밝히며 기계 학습/심층 학습용 프로세서의 요구가 다양해지고, GPU 에만 의존하는 시대는 곧 끝난다고 강조했다. 또 동시에 "추론의 처리는 계속 늘어 추론에 적합한 요구가 높아지고 있다" 고 설명하며 향후 추론에 최적인 프로세서의 요구가 강해진다고 어필했다.


그 말처럼 인텔은 기계 학습/심층 학습용 프로세서의 다양화를 추진하고 있다. MKL-DNN의 버전업 등에 의한 Xeon 성능을 올리는 것은 물론 인텔이 2015년에 Altera를 인수하고 얻은 FPGA 제품을 강화하고 있으며 일전에는 Xeon에 FPGA를 CPU 모듈상에 통합한 제품을 내놓았다.


Microsoft가 퍼블릭 클라우드로 제공하는 Azure의 새로운 서비스로서 FPGA를 이용한 추론 엔진을 제공하기 시작했고, 2016년 9월 인수한 Movidius 추론 프로세서를 에지 측의 추론에 활용하는 다양한 움직임을 보이고 있다. Movidius는 에지 측의 추론에 특화된 프로세서로(Intel에서는 VPU=Vision Processing Unit 이라고 부른다) 추론을 불과 1W 이하로 처리하는 제품이다.


이미 AI 카메라나 드론, USB 스틱 등에 "Myraid 2(100GFLOPS/6카메라/28nm)" 라는 제품이 채용됐고, 향후 지난해(2017년) 8월에 발표된 "Myraid X(1TFLOPS/4TOPs/8카메라/16nm)" 라는 차세대 제품을 탑재한 최종 제품이 시장에 나올 예정이다.



005_l.jpg
006_l.jpg
007_l.jpg


Nervana가 개발한 Lake Crest, 그리고 그 후계 Spring Crest로 GPU에 대항

그리고 NVIDIA의 강점이 되고 있는 GPU를 이용한 심층 학습 솔루션에 대항하는 제품이 NNP(Neural Network Processors). 그 최초의 제품이 "Lake Crest"(개발 코드 네임), 그 후계 제품이 "Spring Crest"


009_l.jpg


Lake Crest은 인텔이 AIDC 전신 행사인 "Intel AI Day" 에서 처음 구상을 공개한 제품으로 Intel이 인수한 Nervana가 개발한 심층 학습에 특화된 프로세서다.


Lake Crest는 12개의 Tensor 기반 프로세서 클러스터를 내장하고 있으며 로컬 메모리로 12GB의 HBM2를 탑재하고 있다. 또 NNP 간 접속하는 인터 커넥트 대역으로 2.4TB/s의 대역폭이 확보되어 있으며 여러개의 칩을 접속하여 연산에 이용할 수 있다.


중요한 것은 Crest 시리즈는 액셀러레이터처럼 기능이 고정된 것이 아니라 GPU와 CPU와 같이 프로그래머블로 프로그래머가 소프트웨어를 작성해 효율적인 심층 학습을 할 수 있다는 점이다.


예를 들어 FP16, FP32 같은 각종 부동 소수점 연산, 또 INT8 등의 추론에서 흔히 쓰이는 정수 연산까지 임의의 프로그램을 구축할 수 있다. 또한 행렬 곱셈(GEMM:General Matrix Multiply) 경우의 효율은 GPU보다 높다고 기조 강연에서 밝히며 이론치의 96.4%의 성능을 실현할 수 있다고 설명했다.


현재 Lake Crest는 특정 고객에 대해 테스트 출하했고, 소프트웨어 개발을 공동으로 진행하고 있다. 대규모 상용 제공은 2019년 말까지 출하가 예정됐고, 그럼 Lake Crest의 후계인 Spring Crest는 어떤 제품일까?


미국 인텔 집행 임원겸 AI 제품 사업 본부 AI 하드웨어 사업부장은 "Lake Crest는 낡은 프로세스 노드를 사용하고 있다. 최초의 실리콘에 위험이 있는 프로세스 노드를 이용하는 것을 피하고 싶었기 때문이다. 그것을 최신의 프로세스 노드로 삼을 뿐 주파수를 올리거나 하는 것에 의한 성능 향상이 가능하다"고 밝혔다.


구체적으로 어떤 프로세스로 제조한다는 언급은 피했지만 Spring Crest가 Lake Crest보다 훨씬 앞선 프로세스 노드고, 성능이 향상되고 있다고 설명했다. 인텔은 이번 AIDC에서 Spring Crest는 Lake Crest와 비교해 3~4배의 학습 성능을 실현한다고 설명했다.


그렇게 되면 NVIDIA의 GPU에 대한 무기로는 Spring Crest가 있지만 과제도 있다. 그 필두는 투입 시기가 19년 말로 1년 반 만에 되는 것이다. "이같이 되는 이유는 실리콘을 체인지 했기 때문이다" (인텔) 성능을 높이기 위해 원래의 로드맵 제품에서 Spring Crest로 변경했기 때문이라고 밝혔다.


인텔은 2016년 Intel AI Day 타이밍에 Lake Crest의 후계로 Knights Crest을 2018년 투입키로 했으나 Knights Crest 계획은 파기되고 대신 Spring Crest가 로드맵 상에 등장한 배경이 있다.

그 사이 NVIDIA가 멈추는 것은 아니기 때문에 Spring Crest가 출시하는 단계에서 NVIDIA가 얼마나 성능을 올릴지에 따라 Spring Crest의 매력이 없을 가능성도 있기 때문에 그것은 리스크라고 할 수 있다.



여러 종류의 프로세서가 있는 상황을 새 컴파일러 nGRAPH로 커버

그리고 이번에 인텔은 기계 학습/심층 학습용 프로세서의 약점이 됐던 부분을 극복하는 시스템을 도입한다고 발표했다.


이미 말한 대로 AIDC에서 인텔의 간부는 한창 "기계 학습/심층 학습용 프로세서는 원 사이즈 피츠 올은 아니다"라는 말을 되풀이했다. GPU+CUDA의 하나의 아키텍처로 추론부터 클라우드 서버 측의 학습까지 커버하는 NVIDIA를 의식한 표현으로 보인다. 표로 만들면 아래와 같다.



NVIDIAIntel
제품아키텍처제품아키텍처제품아키텍처
클라우드 서버에서 기계 학습/심층 학습TeslaCUDAXeonx86Lake CrestTensor 코어
클라우드 서버에서 기계 학습/심층 학습 추론TeslaCUDAXeonx86FPGAAltera
에지 디바이스 기계 학습/심층 학습 추론TegraCUDAMyraid 2/XMovidius


NVIDIA는 하나의 CUDA 프로그래밍 모델에서 어떤 GPU도 같은 소프트웨어를 가동시킬 수 있다.(실제로는 재 컴파일이 필요한 경우도 있다) AI를 개발하는 엔지니어들은 CUDA만 공부하면 에지 측의 추론은 Tegra, 클라우드 추론과 학습은 Tesla로 하드웨어는 달라도 같은 CUDA 프로그램으로 만들기 쉽다.


그것에 비하면 인텔은 하드웨어의 차이를 AI를 개발하는 엔지니어가 의식해야 한다. Xeon을 이용해서 클라우드 추론과 학습을 진행하면 Xeon에 최적화를 하고, FPGA를 이용해서 클라우드에서 추론을 하면 FPGA에 맞추어 최적화를, Movidius를 이용하는 경우에는 Movidius에 최적화 할 필요가 있어 파편화되고 있다.


앞으로 이에 Lake Crest/Spring Crest가 추가되므로 또 AI 엔지니어가 학습 할 것이 늘어난다.이것이 그동안 AI를 인텔 플랫폼 상에서 연산할 때의 약점이였다. 거기서 인텔이 새로 도입하는 것이 nGRAPH다. nGRAPH는 말하자면 컴파일러의 일종으로 TensorFlow 등의 심층 학습 프레임 워크와 함께 사용해 Lake Crest, FPGA, Movidius 등 각각의 하드웨어에 최적화 된 코드를 자동으로 생성한다.


인텔에 따르면 CPU(Xeon)에 관해서는 계속 MKL-DNN을 이용해 최적화할 필요가 있지만 "nGRAPH를 이용하면 AI 엔지니어는 하드웨어의 차이를 인식할 필요가 사라진다. AI 엔지니어에게 그런 차이를 이해하는 것은 시간 낭비일 뿐, 그것을 쉽게 할 수 있는 도구가 필요했다 " 는 말과 같이 컴파일러 차원에서 하드웨어를 추상화하기 때문에 AI 엔지니어는 그것을 이해하지 않아도 컴파일러에 집중할 수 있다는 게 장점이다.


이에 따라 여러 종류의 프로세서가 있다는 약점을 덮는 것이 가능하고, AI 엔지니어에게 복수의 하드웨어를 사용해 보다 효율적인 학습과 추론을 행하는 것이 가능하게 된다. 인텔의 기계 학습/심층 학습 솔루션에 있어서 마지막 피스가 nGRAPH 이며, 그것이 갖추어 졌을때는 현 시점에서 심층 학습 세계의 절대 제왕인 NVIDIA도 심각한 위협이 되지 않을까,


보도 - https://pc.watch.impress.co.jp/docs/column/ubiq/1124703.html

반응형
Posted by 랩터 인터내셔널


대만 리얼텍 세미컨덕터(Realtek Semiconductor)는 세계 첫 싱글 칩 2.5G 이더넷 컨트롤러 RTL8125, RTL8156을 발표했다.


RTL8125, RTL8156은 2.5G 이더넷 기능을 QFN 패키지에 집약해 히트싱크가 불 필요하고, 2.5G Ethernet 용으로 설계된 순수 ASIC으로는 세계 최초이며 펌웨어를 저장하기 위한 외부 플래시도 불 필요하다.


RTL8125는 PCI Express 2.0 접속의 PC 조립용, RTL8156은 USB 3.1 접속으로 외장형 동글과 도킹 스테이션용이며 차세대 CDC-NCM에 대응하고 macOS와 리눅스는 접속해서 바로 사용할 수 있다. 그 외 2500BASE-X, SGMII+, USXGMI인터페이스를 지원하는 물리 레이어 트랜시버 RTL8226도 동시에 발표됐다.

반응형
Posted by 랩터 인터내셔널