2014년 7월에 펜티엄의 20주년 기념 모델로 Pentium G3258이 발매됐다. 그래서 이번 기회에 Pentium 20년의 역사를 되돌아보며 지난번 P5 세대를 해설했기에 P6 세대를 해설한다.


 

box_248x.jpg

 

 

P5와 함께 개발이 진행되고 있었던 P6 마이크로 아키텍처

P5 코어의 개발과 병행해 인텔 내부에서는 P6 개발이 시작되고 있었다. 개발 시작은 1990년 6월, 개발 거점 인텔 내 디자인 센터다.

 

map2_588x.jpg
Pentium II 부터 Pentium III 까지 인텔 CPU 로드맵

 

 

1990년은 P5가 발매되기 전 i486이 출시되던 시기다. 즉, P6는 P5와 개발 기간이 겹쳤던 것이다.

P6는 초기 컨셉 단계에서 VILW를 비롯한 여러 방식을 검토하기 위해 간단한 DFA(Data Flow Analyzer)로 불리는 시뮬레이션 툴을 작성하는 성능 평가를 실시했다. 그 결과 슈퍼스칼라+아웃 오브 오더 구성이 가장 성능이 높다는 판단에 이른 것으로 보인다.

 

그런데 당시는 슈퍼스칼라에 관한 연구나 논문은 모두 RISC 프로세서를 기반으로 하고 있으며 CISC로 아웃 오브 오더를 구현한 사례 혹은 연구는 전무했다.

 

거기서 프론트 엔드에 x86 CISC 명령을 RISC 형태의 내부 명령으로 변환 처리한다는 아이디어가 발생한다. 이러한 발상은 1993년 개발이 시작된 AMD의 K5와 1993년에 발매된 NexGen의 Nx586이 모두 x86 명령을 프론트 엔드에서 RISC 명령으로 변환하고 실행하는 방법을 구현한 것으로도 알 수 있다.

 

각 개발 시기를 생각하면, "어떤 하나의 방법을 타사가 흉내" 낸 것이 아니라 각사가 각각 최적의 방법을 생각한 결과 같은 결론에 도달했다고 생각해야 한다. 그리고 이 방식은 올바른 선택이었다.

 

P6 코어 첫 프로세서 Pentium Pro 탄생

그런데 최대 3개 명령을 동시에 디코딩, 최대 5개 명령을 발행하는 아웃 오브 오더는 P5에 비해 중후한 구성으로 최초의 제품인 Pentium Pro는 CPU 코어만 5.5만 트랜지스터에 달했다.

 

ppro_th_248x.jpg P6 코어를 처음 채용한 Pentium Pro

 

 

이는 당초 0.6μm BiCMOS 프로세스는 306mm2에 이르며 2차 캐시까지 장착할 수 없는 문제가 있었다. 그래서 2차 캐시는 다이의 외부에 설치할 수 밖에 없었다.

 

이 부분은 1차 캐시만으로 그럭저럭 성능이 나온 P5와의 차이점으로 2차 캐시를 생략한 P6 코어의 성능다운 모델은 Covington 코어의 셀러론.

 

따라서 2차 캐시를 탑재한 것은 좋았지만 이 당시는 코어와 등속으로 움직이는 것을 중시하여 최초가 된 MCM(Multi-Chip Module) 구성은 패키지 방식에 대한 도전으로, 결과적으로 수율은 좋지 않아 비용이 증가한 것은 어쩔 수 없었다.

 

또, 150~200MHz로 움직이면서 TDP는 31.7W(150MHz·256KB L2)~37.9W(200MHz·512KB L2)에 달했다. 이는 Pentium MMX 233MHz의 TDP(17W)에 비해 갑절 이상의 숫자며 방열도 중요 했다.

 

그리고 큰 다이 + 2차 캐시 구조로 가격이 떨어질리도 없고, 1993년 11월 발표 당시는 가장 싼 150MHz 버전이 974달러, 200MHz+512KB L2 버전은 1989달러라는 황당한 가격이 되어 컨슈머 용으로 전혀 맞지 않는 것은 명백했다.

 

또 실제로 벤치 마크를 해 보면 32bit 명령은 고속화 됐지만 당시 주류였던 Windows 95에서는 오히려 Pentium에 떨어지는 결과가 나온 것은 Windows 95의 상당 부분이 16bit 명령에서 작동되어 Pentium Pro는 16bit로 최적화가 제대로 되지 않은 것을 뜻했다.

 

결과적으로 Pentium Pro는 컨슈머에게 거의 보급되지 않은 한편, 당초부터 멀티 프로세서를 지원하고 정품 칩셋에서 최대 4P, 서드 파티(ServerWorks)가 만든 칩셋에서는 6P나 8P구성을 지원했다.

 

OS도 요즘에는 Windows NT Server를 비롯한 몇몇 OS가 SMP(대칭형 다중 프로세싱) 대응으로 빠르게 시장 점유율을 높이면서 RISC 기반의 서버 시장을 빼앗게 된다.

 

Pentium Pro는 "Pro"라는 명칭에 걸맞게 엔터프라이즈와 단말기 시장에서 확실하게 받아들여져 이 부분으로 감안하면 Pentium Pro는 성공한 제품이라고 봐도 문제 없을 것이다.

 

성능 면에서도 당초 0.6μm 프로세스에서 나중에 0.35μm CMOS 프로세스로 바뀌고, 최대 1MB의 2차 캐시를 갖춘 제품도 추가됐다.

 

AMD의 K6에 쫓긴 Pentium II

map2_588x.jpg
Pentium II 부터 Pentium III 까지 인텔 CPU 로드맵

 

Pentium Pro의 후속이 되는 것이 1997년에 발매된 Klamath 코어의 Pentium II다. 지난번 설명했던 대로 인텔은 호환 제조 업체를 떨어뜨리기 위한 일환으로 Socket 7의 폐지를 계획하고 있었다.

이 때문에 P6 코어를 컨슈머 전용으로 투입하기로 했다. 0.6μm에서는 306mm2으로 거대했던 P6 코어도 0.35μm에서는 203mm2로 상식적인 사이즈로 줄어들었기 때문에 이는 불가능하지 않았다. 또 MMX 그룹 추가로 16bit 명령 처리 속도를 고속화 해 Pentium과 비교해도 성능 면에서의 개선은 확실했다.

 

 p2_240x.jpg Socket7 폐지 계획, Slot1을 채용한 Pentium II

 

 

문제는 Pentium Pro와 같이 외부형 2차 캐시 형태는 비용이 상승 한다는 점에서 Pentium II는 카트리지에 1/2배속으로 SRAM칩을 CPU와 함께 탑재하는 방식으로 전환했다.

 

속도가 절반인 대신 용량은 512KB로 증가 된 것도 있고, 캐시로 인해 성능 저하는 발생하지 않았으며 어느정도 비용은 억제되었기 때문에 적절한 방침이였다. 가장 저렴한 233MHz 제품이 636달러, 300MHz제품은 여전히 1981달러로 저돌적인 가격이었기 때문에 컨슈머 전용으로 시작은 주춤했던 것으로 기억하고 있다.

 

이런 추세가 변하는 것은 다음 해인 1998년 0.25μm 프로세스로 이행하면서 부터다. 우선 1월 말 66MHz호스트 333MHz 제품이 등장하지만 이는 722달러, 이와 더불어 기존 제품의 가격 인하도 이어졌다.

 

그리고 4월 14일에는 100MHz FSB의 350/400MHz 버전이 각각 621/824달러로 기존에 비하면 훨씬 저렴한 가격으로 출시되고 Celeron 266MHz가 155달러로 출시됐다. 이는 AMD의 급속한 추격에 기인하는 부분이 크다.

 

AMD는 NexGen의 Nx686을 바탕으로 K6를 1997년 4월에 발표한다. 당초 233MHz에 그쳤지만 1998년에는 0.25μm로 미세화한 Little Foot코어로 전환해 300MHz대로 상승했다. 또 K6-2가 1998년 5월에 발매되고 최대 350MHz까지 진입했다.

 

K6_240x.jpg   가격이 저렴하고 기존의 Socket 7에서 동작했기 때문에 인기를 얻는 AMD-K6

 

K6/K6-2의 정수 연산은 Pentium II와 동등하며 5월에 발매된 K6-2 300MHz은 281달러로 가격은 훨씬 저렴했다.

마더보드를 Super 7 외에 기존의 66MHz FSB의 Socket 7에서도 대응하면서 Slot 1의 Pentium II 보다 훨씬 싸게 구입이 가능하여 가격 경쟁력은 인텔을 크게 웃돌아 인텔은 가격을 낮춰 맞설수 밖에 없었다.

인텔은 Celeron으로 이 갭을 메꿀 생각으로 2차 캐시를 생략하면 성능이 떨어졌지만 많은 인기를 얻었다. 단지 100MHz FSB의 400MHz 구동에 문제 없는 동작으로 조립 유저에게는 "상대적으로 저렴하다"는 묘한 인기가 있었지만 K6-2에 대항할 수 있는 레벨은 아니었다.

 

2차 캐시를 내장한 Pentium III

map2_588x.jpg
Pentium II 부터 Pentium III 까지 인텔 CPU 로드맵

 

 

이런 점에서 Intel은 다음 제품의 개발을 서두른다. 그것이 SSE을 탑재하고 파이프 라인을 1단 늘려 고속화한 Katmai코어의 Pentium III다.

 

Pentium_III_300x.jpg
(Pentium III http://commons.wikimedia.org/wiki/File:Intel_Pentium_III_733_MHz.jpg)

 

 

경쟁사 AMD K6-2는 350MHz, 이어 나온 K6-III는 대용량 3차 캐시가 발목을 잡아 450MHz에 겨우 도달하는 정도였기 때문에 600MHz까지 올리면 추격에 시간이 걸릴것이라는 판단이 있었다고 보인다.

 

경쟁 격화에 따라 당초 발표된 450/500MHz 제품의 가격은 각각 469/696달러, 5월에 발매된 550MHz제품도 744달러로 다소 저렴한 금액을 형성했다.

 

Katmai 코어의 Pentium III는 AMD Athlon의 맹추격을 받게 됐다. 1999년 6월에 발표된 AMD의 K7 Athlon은 동일 동작 주파수의 Pentium III 보다 약간 저렴하게 설정됐다.

 

당초에는 마더보드 입수성의 불편함과 약간의 비싼감은 있었지만 2000년에 들어서자 이것도 거의 해결된다. 또 파이프 라인 구조적으로 K7 쪽이 약간의 동작 주파수가 상승되고 저렴하면서 최종적으로 K7 코어로 700MHz에 이르며 인텔을 앞서게 된다.

 

Katmai_300x.jpg
Katmai 코어의 Pentium III 내부. Pentium II 와 마찬가지로 기판 위에 CPU코어와 512KB 2차 캐시를 개별적으로 구현하고 있다. (http://commons.wikimedia.org/wiki/File:Intel_Pentium_III_Katmai.jpg)

 

 

AMD에 맞서 인텔은 0.18μm으로 미세화한 Coppermine 코어의 Pentium III를 1999년 말에 투입한다. 이 Coppermine은 미세화에 따른 다이 사이즈에 여유가 생겨 마침내 2차 캐시까지 온-다이 통합이 가능해 졌다.

 

Coppermine_300x.jpg
Coppermine 코어의 Pentium III 내부. 2차 캐시를 CPU에 내장했다. (http://commons.wikimedia.org/wiki/File:Pentium_iii_cu-mine_slot1_naked.jpg)

 

 

이는 갑자기 진행된 것은 아니다. 사실 2차 캐시를 처음 통합한 것은 1998년에 투입된 Mendocino 기반의 Celeron이다.

 

Celeron 그레이드에선 2차 캐시를 탑재하면 원가가 너무 상승해 수지가 안 맞으나 2차 캐시 없이는 성능이 낮아 잠정안으로 Mobile Pentium II 용으로 프로세스를 0.25μm → 0.22μm 미세화하고 그 만큼 2차 캐시를 온 칩으로 통합한 Dixon 코어를 끌고 가려했다.

 

2차 캐시는 128KB로 삭감(Dixon은 256KB) 된 부분 때문에 성능은 약간 낮았지만 풀 스피드로 동작하는 만큼 Covington의 성능 개선은 눈부셨고, 덤으로 프로세스의 미세화로 보다 고속으로 동작했다.

 

그런 점들에서 조립 사용자들은 Mendocito의 Celeron 300A MHz를 구입해 100MHz FSB로 450MHz로 구동 시키는게 큰 유행이 되어 발열 증가에 맞춰 히트 싱크의 교환이 필요했지만 Pentium III 450MHz보다 훨씬 저렴하게 구성할 수 있었다.

 

Celeron_300A_MHz_300x.jpg
Celeron 300A MHz. (http://commons.wikimedia.org/wiki/File:Intel_Celeron_300A_MHz.jpg)

 

 

그런데 이야기를 되돌리면 2차 캐시를 온 다이로 통합하고, 또 Slot 1 같은 거대한 패키지가 필요 없게 되어 인텔은 새로운 Socket 370 패키지를 준비한다. 이름 그대로 370핀 PGA 패키지로 Slot 1에 비해 면적이 크게 작아졌고 심지어 제조 원가도 낮출 수 있게 된다.

 

 socket230_240x.jpg Socket 370. Slot 1에 비해 면적 감소와 제조 원가를 떨어뜨렸다

 

 

또, Coppermine에서는 대폭적인 판매 가격 인하가 이뤄지고, AMD도 경쟁력 강화를 위해 똑같이 0.18μm로 미세화(K75 코어)를 개발하여 반년 후 2000년 6월에는 2차 캐시를 온 다이로 탑재한 Thunderbird 코어를 투입해 추가로 가격 면에서도 "인텔보다 약간 저렴"을 유지해 인텔은 AMD에 대한 견제를 실패한다.

 

오히려 동작 주파수 1GHz 제품을 먼저 내놓으며 이른바 1GHz 경쟁에서는 AMD가 승리했고, Coppermine코어의 Pentium III는 1.13GHz 제품의 리콜까지 발생하며 여기서 인텔은 AMD에 완전히 추월당한다

 

coppermine2_240x.jpg   Coppermine코어의 Pentium III

 

 

다행히도 인텔은 Pentium III에 병행해서 P4 코어를 개발하고 있었으며 인텔은 데스크탑 및 서버용으로 P4 코어를 전면적으로 투입하기로 결심한다.

 

실제로 P4는 소비 전력이 너무 높아 Pentium M이 등장하는 2003년경까지 0.13μm 프로세스로 미세화 된 Tualatin은 일부 서버 및 조립용으로 계속 사용 되어 첫 등장부터 8년여 정도 상당히 장기간 사용된다.

또 Pentium M이나 이어 등장하는 Core 마이크로 아키텍처는 어떤 의미로 P6의 발전된 확장형으로서 현재까지도 사용되는 아키텍처라고도 말할 수 있다.

 

보도 - http://ascii.jp

반응형
Posted by 랩터 인터내셔널