슈퍼컴퓨터 역사> 핵무기 모의 실험을 위해 태어난 ASCI
슈퍼 컴퓨터의 계보, 이번부터 ASCI의 이야기를 한다. ASCI는 Accelerated Strategic Computing Initiative의 약어로 "가속적 전략적 컴퓨팅·이니셔티브" 라는 신비한 역어도 있다.
현재는 ASC(Advanced Simulation and Computing program:선진 시뮬레이션 및 컴퓨팅 계획)이라는 명칭으로 바뀌고 있다.
ASCI Blue Mountain |
핵 실험 시뮬레이션을 위해 태어난 ASCI
이 ASCI가 성립 된 배경을 먼저 해설한다. 이야기는 1995년 11월로 거슬러 올라간다. 클린턴 대통령은 CTBT(Comprehensive Nuclear Test Ban Treaty:포괄적 핵 실험 금지 조약)을 비준할 방침을 밝힌다.
클린턴 대통령은 1996년 9월에 이에 서명하지만 상원은 원래 비준에 관한 심의를 거부, 최종적으로 1999년 10월에 상원에서 심의에 들어간(여기에 이르기까지 꽤 우여곡절이 있었다)것의 비준은 부결된다.
이어 부시 정권은 핵 폭발을 동반하지 않은 임계 핵 폭발 실험을 진행했고 CTBT 자체가 아직 모든 핵 보유국의 비준을 받지 않은 발효 상태였기 때문이지만 이 역사 자체는 본론은 아니므로 여기까지 한다.
이야기를 1995년 11월로 되돌리면 미국 정부로서는 CTBT 비준 방침을 밝힌 이상 그것이 실현 된 경우에 대비할 필요가 있다.
구체적으로는 SSMP(Stockpile Stewardship and Management Program:비축 탄두 유지 관리 계획, Management를 뺀 SSP:Stockpile Stewardship Program라고 하는 경우도 있다)를 핵 실험 없이 어떻게 수행할지 입안할 필요성이 생겼다.
핵무기를 유지할 때 그 안전성 및 신뢰성을 확인한다는 것은 핵무기의 성격상 필요하며 지금까지는 정기적으로 핵 실험을 한 형태로 실시했지만 CTBT는 이러한 핵 실험 자체를 금지하는 것이어서 다른 수단이 필요하다.
거기서 실제 핵 실험 대신 컴퓨터 시뮬레이션으로 이를 실시한다는 아이디어가 나왔다.
단순히 생각해도 여러가지 문제는 많다. 시뮬레이션을 할 경우 정밀도를 보장하기 위해서는 어딘가에서 실제 결과와 비교할 필요가 있으므로 핵 실험을 즉각 중단하면 이 정도의 담보가 매우 어려워진다.
실제 미국에서도 이것도 대해 여러가지 분규 했으나 그것도 본론은 아니므로 여기는 생략한다. 중요한 것은 CTBT 비준에 의해 정밀한 핵 실험 시뮬레이션이 가능하게 하는 시스템이 필요하게 되었다는 것이다. 이에 따라 DoE(Department of Energy:미국 에너지부)가 책정한 것이 ASCI.
즉 ASCI는 SSMP의 일부라는 것이다. 실제로 ASCI는 DoE 산하 로렌스 리바모아 국립 연구소, 로스앨러모스 국립 연구소, 샌디아 국립 연구소란 3개 연구소가 일체가 되어 개발한다는 방침을 취하고 이에 캘리포니아 공과/시카고/일리노이/스탠퍼드/유타라는 5개 대학이 협력하는 형식이다.
1996년 9월에 발표된 ASCI 프로그램 계획에 따르면 1997년도의 ASCI에 대한 지출은 1억 2160만 달러가 책정되었다.
1997년도의 ASCI에 대한 지출 | |
---|---|
어플리케이션 개발 | 5490만달러 |
문제 해결 환경 구축 | 2350만 달러 |
플랫폼 개발 | 3370만 달러 |
전략 얼라이언스 관계 | 610만 달러 |
관련 지출 | 340만 달러 |
내역은 표대로 적잖은 금액이 이에 들어가고 있었던 것이 분명하다.
그 ASCI의 주요 목적은 "2010년까지 핵무기 성능 평가나 리뉴얼 프로세스 분석, 사고 분석과 검증을 가능한 완전하고 고성능인 물리 시뮬레이션 코드 생성"이다.
미국의 컴퓨터 업계에 이러한 코드를 실행하기 위해 필요한 보다 고성능/ 고용량인 하이엔드 슈퍼 컴퓨터 개발을 촉진하고 이들을 실현하기 위한 여건도 중요한 과제로 꼽혔다.
당연하지만 핵 실험 시뮬레이션은 그만큼 고성능/고 정밀의 것이라서 우선 이것을 어떻게 할 필요가 있으며 다음에 그것을 움직이기 위한 플랫폼 개발, 환경 정비, 1997년 예산의 절반 가까이가 애플리케이션 개발에 맞춰진 것도 당연하다.
그 어플리케이션 개발의 본질을 떠나 하드웨어적인 부분이다. 아래의 사진은 ASCI Program Plan에서 제시된 2002년 부근까지의 로드맵이다.
주요 컴퍼넌트의 성능은 1996년~2003년 사이에 1000배로 높이면서 이 결과로 애플리케이션 성능을 10만배로 만들겠다는 목표인데 왠지 이 시점에서 석연찮은 점이 있다. 1000배 밖에 안 되는 기분이 드는 건 필자뿐일까? |
복수의 시스템을 병행하여 개발, 순차적으로 그것을 이용하는 ASCI
ASCI는 목표에 대해 일약에 완성판의 시스템을 만드는게 아니라 복수의 시스템을 병행하여 개발하고 순차적으로 그것을 이용하는 형태로 목표를 달성한다는 접근이 취해진다. 그것이 아래의 사진이다.
ASCI는 복수의 시스템을 병행하여 개발하고 순차적으로 그것을 이용하는 형태로 목표를 달성하는 구조. 이 시점에서 Option Red와 Option Blue만 있고 그 다음은 미정이었다 |
구체적으로는 이하의 표 형식으로 진행했다. Purple만 ASC로 이름이 바뀌는 것은 2004년에 프로젝트 이름이 ASCI에서 ASC에 바뀐점 때문이다.
ASCI시스템 | ||||||
---|---|---|---|---|---|---|
Option이름 | 연산 성능 | 메모리 양 | 실용화 시기 | |||
ASCI Red | 1T FLOPS 이상 | 0.5TB | FY1996 | |||
ASCI Blue | 3T FLOPS 이상 | 1.5TB | FY1998 | |||
ASCI White | 10T FLOPS 이상 | 5TB | FY2001 | |||
ASCI Q | 30T FLOPS 이상 | 10TB | FY2003 | |||
ASC Purple | 100T FLOPS 이상 | 30TB | FY2007 |
참고로 이건 어디까지나 당초 계획에 따른 표인데 실제로는 ASCI Blue는 ASCI Blue Pacific와 ASCI Blue Mountain의 2개가 존재한다. 또 ASCI Red의 후계로서 Red Storm이 추가됐다.
2000년에는 ASCI의 각 머신를 메우는 위치 설정이 되는 Blue Gene/L도 발주돼 2005년 실용화되었다. 이 Blue Gene/L은 IBM이 독자 개발을 계속해 Blue Gene/P 및 Blue Gene/Q가 개발 되었다. 이 Blue Gene/Q를 바탕으로 한 것이 Sequoia로 2012년부터 가동됐다.
ASCI의 각 머신. 사진 출처:로렌스 리바모아 국립 연구소 |
이들 각각의 머신의 자세한 내용은 다음부터 자세히 설명해 나갈 것이며 그 전에 ASCI와 ASC 프로젝트에 다시 이야기를 되돌린다.
ASCI의 원래 목적은 앞서 말한 대로 핵 실험 시뮬레이션이다. 이에 대해 열거하면 다음과 같다. FY2000은 미국 회계 연도 2000년(2000년 10월 1일~2001년 9월 30일)을 의미한다.
ASCI와 ASC프로젝트의 진척 | |
---|---|
FY2000 | 핵무기를 사용한 폭발(Primary Explosion)을 3D 시뮬레이션 함과 동시에 그 내용을 분석하는 시연에 성공. |
FY2001 | 2차 폭발(Secondary Explosion)의 시연에도 성공하는 동시에 ASCI White를 이용하여 완벽히 동작하는 문제 해결 환경을 제공하는데 성공한다. 또 시뮬레이션 조건에 관한 제반 검증에 처음 통과한다. |
FY2002 | 완전한 열 핵무기 폭발 시뮬레이션과 사고 상태에서 핵무기 상황 3D 분석도 가능해졌다. |
FY2003 | 핵무기 시스템의 다양한 상태에서의 안전 시뮬레이션을 제공 개시. |
FY2004 | 실제 핵무기 모델의 검증을 완료하고 W76/W80 핵폭탄의 수명 연장을 위한 정비를 지원하는 동시에 W88 핵폭탄의 지원을 추가.또 비 핵무기 실험과 판정의 시뮬레이션도 지원. |
대체로 2005년경에는 초기의 목적을 어느 정도 달성할 수 있게 됐다. 이어 다른 핵무기의 지원이나 새로운 시뮬레이션 등도 수시로 추가되고 있는데 처음 ASCI의 목적은 어느 정도 달성했다고 생각할 수 있는 좋은 상태가 됐다.
이에 따라 ASCI가 ASC로 바뀐 것은 2004년의 일이다. ASC의 주 목적은 계속 SSMP/SSP의 유지인데 동시에 당초의 목적에는 없었던 복잡하고 불 확실한 시나리오의 지원이나 ICF(Inertial Confinement Fusion:관성 핵융합)의 서포트 등 보다 높은 수준으로 타겟을 옮기면서 현재도 진행중이다.
결과적으로 2009년에는 Peta FLOPS 머신, 2016년에는 100P FLOPS의 머신, 2018년에는 Exascale(1E FLOPS)의 머신을 각각 필요로 한다는 로드맵을 그렸다. 그리고 Peta FLOPS 머신이 Cielo, 100P FLOPS의 머신이 아까 나온 Sequoia로 현재 가동 중이다.
이어 ASC의 최신 로드맵(PDF)에는 AST 1(Trinity)/ATS 2/ATS 3 라는 3세대 ATS(Advanced Technology Systems)와 병행하여 TLCCII/CTS-1/CTS-2라는 3세대 CTS(Commodity Technology Systems)가 개발됨이 드러나고 있다.
아직 ATS 2 이후의 이름은 정해지지 않은 것 같다 |
ATS란 SSP를 위한 피크 성능을 요구하는 스페셜 시스템 대해 CTS는 표준적인 시스템 구성을 사용하고 저렴한 가격으로 계산 능력을 실현한다는 것이다.
현재 이용되고 있는 TLCC II(Tri-Lab Linux Capacity Cluster 2)는 로렌스 리바모아, 로스앨러모스 샌디아 3개의 국립 연구소에서 공동으로 운용하고 있는 Linux Cluster의 제 2세대라는 것이다. 이 이야기도 계속 되겠지만 ASC는 미국의 슈퍼 컴퓨터 시장을 견인하고 있다고 해도 좋을 것이다.
다음은 ASCI Red부터 순차적으로 설명해 나간다.
출처 - http://ascii.jp
'글로벌 IT 뉴스' 카테고리의 다른 글
애플 맥북 리뷰 (0) | 2015.09.15 |
---|---|
슈퍼컴퓨터 역사> 최초의 1PFLOPS를 달성한 IBM 로드러너 (0) | 2015.09.15 |
슈퍼컴퓨터 역사> 발군의 성능으로 잘 팔린 IBM 블루진(Blue Gene/L) (0) | 2015.09.15 |
슈퍼컴퓨터 역사> 마지막 SMP 클러스터 머신 ASC Purple (0) | 2015.09.15 |
슈퍼컴퓨터 역사> 기동에 8시간이 걸린 ASCI Q (알파 프로세서) (0) | 2015.09.15 |