HPE 크레이 슈퍼컴퓨팅의 스펙이 일부 공개됐다.

HPE 본사 컴퓨팅 사업부 브랜든 드래거(Brandon Draeger)는 HPE 공식 블로그에 올린 기고문 ’ 슈퍼 컴퓨팅의 다음 장 : 엑사 스케일 시대’를 통해 엑사스케일 시대로의 전환을 알리며 신규 HPE 크레이 슈퍼컴퓨팅 라인의 특장점과 전 세계 유수 연구기관에서 사용되고 있는 HPE 크레이 슈퍼컴퓨팅의 사례’를 소개했다,

그는 “ 엑사스케일 시대는 빠르게 증가하는 데이터속에서 가장 핵심 인사이트와 가치를 추출하기 위해 새로운 컴퓨팅 기술을 요구하고 있다”며 “이러한 기술들은 슈퍼컴퓨팅 인프라를 진화시킬 뿐만 아니라, 학계 및 상용 데이터센터 내의 혁신과 디지털 트랜스포메이션에 힘을 실어줄 것”이라고 주장했다.

그가 내세운 엑사스케일 시대에 필요한 기술들은 다음과 같다.

먼저, 복잡하고 새로운 워크로드를 지원할 수 있는 신속하고도 인텔리전트한 인터커넥트가 필요하다는 것. 데이터가 구현되는 방식에 더 넓은 범위의 애널리틱스 방식을 적용하게 되는데 이는 한 워크플로우에서 실시간으로 HPC, 애널리틱스, AI 워크로드를 다양하게 결합해 활용하는 것을 의미한다는 것이다, 따라서 더 많은 프로세서 및 액셀러레이터 아키텍처를 지원할 수 있는 유연한 인프라가 필수적이라는 것.

새롭게 결합된 HPC, 애널리틱스, AI 워크로드를 베어메탈 환경에서 통합된 워크플로우로 실행하거나 기존 슈퍼컴퓨팅 소프트웨어에서 컨테이너화된 워크로드로 지원하는 것은 쉽지 않다고도 지적했다. 이를 해결 하기위해서는 관리자와 개발자가 차세대 애플리케이션을 개발할 수 있도록 클라우드형 경험을 제공하는 새로운 유연한 소프트웨어 인프라가 필수적이라고 주장했다.

마지막으로 제일 중요한 핵심은 바로 데이터라고 했다. 수없이 다양한 데이터 종류와 액세스 패턴이 넘쳐나는 이 시대에, 정확한 시간과 정확한 장소에 데이터를 전달할 수 있는 새로운 데이터 플로우가 필요하다는 것이다,

그는 “이것이 바로 엑사스케일 시대 하드웨와 소프트웨어 인프라가 제공해야하는 기능”이라며, “HPE는 HPE 크레이 슈퍼컴퓨팅 라인을 통해 해당 기능을 최초로 제공할 수 있게 됐다”고 했다. 해당 제품군은 세계 최초 3대 엑사스케일 시스템을 운영하는 HPC 핵심 기술과 크레이 샤스타(Shsata) 아키텍처를 결합해 탄생했다고 공개했다.

수냉식 슬링샷 인터커넥트
수냉식 슬링샷 인터커넥트

다음은 그가 공개한 HPE 크레이 슈퍼컴퓨터의 스펙이다.

HPE 크레이 슈퍼컴퓨터는 컴퓨팅 노드가 급증할 때, 그리고 AI 결합 시 워크플로우가 증가될 때 나타나는 병목현상, 처리능력 및 업무 수행 관련 이슈를 해결할 수 있다.

관리 툴셋과 네이티브 이더넷 호환성을 바탕으로 클라우드형 애플리케이션 및 컨버지드 HPC의 더욱 향상된 생산성과 워크로드를 느끼실 수 있다. 또 데이터센터 스토리지와 리소스에 직접 연결돼 AI 애플리케이션에게 필요한 I/O 대역폭도 제공한다.

HPE 크레이 슈퍼컴퓨터는 슈퍼컴퓨팅 환경에서 서비스형(as-a-Service)으로 제공된다.

다중의 프로세서 아키텍처와 액셀러레이터 옵션을 지원하며, 추가적으로 향후 차세대 블레이드 및 서버와 호환될 수 있도록 설계됐다.

HPE 크레이 슈퍼컴퓨터는 ‘HPE 크레이 엑스 수냉식(Liquid-cooled) 인프라’와 ‘HPE 크레이 공랭식(Air-cooled) 인프라’ 등 두가지 구성이 가능하다.

HPE 크레이 엑스 슈퍼컴퓨터는 수냉식 캐비닛으로 구성돼 컴팩트한 블레이드 환경 내 모든 부품을 수냉식으로 냉각한다.

HPE가 자체 디자인한 캐비닛 아키텍처는 GPU 전력량(500W 이상)을 지원하며, 인터커넥트 케이블링을 없애고 공랭식 랙 인프라와 비교 시 운영 비용을 총 50% 이상을 절약한다. 실제로, 수냉식 시스템의 수명주기 대비 설치 비용은 기존 랙 기반 시스템보다 최대 33%가 더 저렴했다.

또 전자케이블 대비 더 비용이 높은 광 인터커넥트 케이블(Optical Interconnect Cable)의 사용을 최소화해 컴팩트한 시스템 아키텍처를 구성했다.

공랭식 HPE 크레이 슈퍼컴퓨팅 솔루션은 HPE 슬링샷(HPE Slingshot) 인터커넥트와 HPE 크레이 소프트웨어 스택과 결합된 HPE Apollo 컴퓨터 노드를 기반으로 하고 있다. 기능적으로 수냉식과 공랭식 솔루션의 프로세서는 모두 동일한 인터커넥트와 소프트웨어를 지원하고 있다.

공랭식 슬링샷 인터커넥트
공랭식 슬링샷 인터커넥트

“미래의 슈퍼컴퓨팅은 어떠한 모습일 것인가?”

HPE 크레이 슈퍼컴퓨터 디자인은 아주 간단하고도 기본적인 질문에서 시작됐다는 것이다,

대규모 차세대 시스템은 빠른 속도와 계획적으로 설계된 슈퍼컴퓨팅 인터커넥트를 사용하면서, 기존과 신규 시스템을 서로 연결시켜줄 수 있어야 하는데 이러한 기능을 갖추고 있는 제품이 바로 ‘HPE 슬링샷 인터커넥트(HPE Slingshot interconnect)’이다.

HPE 슬링샷은 64개 포트를 활용해 200Gb/s 속도로 운영할 수 있는 상당히 높은 대역폭을 제공하며, 데이터 기반 HPC와 AI 워크로드를 겨냥한 신규 기능을 갖추고 있다. HPE 슬링샷 내 높은 기수(Radix)의 64포트 스위치는 드래곤플라이(Drangonfly) 토폴로지와 결합해 모든 엔드포인트 사이에서 최대 3개의 스위치 간 홉으로 250,000개 이상의 호스트 포트로 확장 가능하다.

HPE는 HPE 크레이 소프트웨어 스택을 디자인 및 개발했다.

크레이 클러스터 스토어 E1000(Cray ClusterStor E1000)은 확장 가능하고 비용 효율적이면서 새로운 유형의 데이터 플로우를 지원할 수 있도록 계획적으로 공학 설계됐다. 즉, 전통적인 HPC 스토리지 시스템과 최신 올플래시 엔터프라이즈 파일 스토리지 시스템의 정수를 결합한 완벽한 시스템이라고 할 수 있다.

HPE 크레이 슈퍼컴퓨터가 도입 활용되고 있는 사례는 다음과 같다..

호주 국가 슈퍼컴퓨팅 센터인 ‘퍼시 슈퍼컴퓨팅 센터(Pawsey Supercomputing Centre)’는 세계 최상급의 HPC 아키텍처인 HPE 크레이 엑스 슈퍼컴퓨터를 활용해 더욱 향상된 퍼포먼스, 집적도와 효율성을 선보일 예정이다, 퍼시 슈퍼컴퓨팅 센터의 신규 시스템은 AMD EPYC CPU와 AMD Instinct GPU 장착으로 더욱 고도화된 HPE의 크레이 엑스 슈퍼컴퓨팅을 사용하게 된다. 퍼시 슈퍼컴퓨팅 센터는 30배 더 강한 컴퓨팅 파워와 10배 이상 더 높은 에너지 효율성을 바탕으로 천문학, 식물병리학 및 신약발견과 같은 분야의 복잡한 모델링과 시뮬레이션을 진행해 관련 연구에 박차를 가할 계획이다.

또 체코 내 가장 영향력 있는 R&D 및 혁신을 위한 HPC 센터인 ‘IT4Innovations’ 국가 슈퍼컴퓨팅 센터도 자국 내 가장 강력한 슈퍼컴퓨터의 탄생을 위해 HPE와 함께 손잡았습니다.

이번 신규 컴퓨터는 “EURO-IT41”라는 명칭 하에 HPE의 HPC 및 AI 솔루션을 바탕으로 과학, 제약 및 엔지니어링 분야의 연구를 적극 지원할 수 있도록 모델링과 시뮬레이션의 성능을 한층 더 높여줄 것이다, 해당 시스템에는 HPE Apollo 2000 및 HPE Apollo 6500 시스템이 장착돼 AI 및 데이터 인텐시브 애플리케이션의 모델링과 시뮬레이션과 같이 결합된 워크로드를 지원하도록 설계됐다. 또 해당 슈퍼컴퓨터는 크레이 클러스터스토어 E1000 스토리지 시스템과 통합되어 고성능의 스토리지 필수 사양에 적합한 소프트웨어 및 하드웨어 기능을 제공하고 센터 내 지속적인 데이터 증가를 관리할 수 있습니다.

HPE는 EuroHPC JU으로부터 핀란드에 세계에서 가장 빠른 슈퍼컴퓨터를 설치하는 1억 6천만 달러의 프로젝트를 수주했다.

‘루미(LUMI)’라는 이름의 이번 신규 컴퓨터는 유럽 내 연구원 및 민간, 공공기관들이 R&D를 한 차원 더 고도화하고 헬스케어, 기상예측, AI 기반 제품 개발 등의 분야에 혁신을 이루는데 큰 기여를 할 것으로 예상된다.

EuroHPC JU의 신규 슈퍼컴퓨터 ‘루미(LUMI)’는 ‘프리 엑사스케일(pre-exascale)’ 시스템으로써 이론상 노트북 150만 개를 결합한 성능인, 최대 550 페타플롭스(petaflops)급 성능을 제공할 수 있다.

루미 시스템 역시 차세대 AMD EPYC CPU와 AMD Instinct GPU가 설치된 HPE 크레이 엑스 슈퍼컴퓨터를 사용해, 뛰어난 성능 및 최적화된 딥러닝 기술을 제공한다. 이를 바탕으로, EuroHPC JU와의 협력을 통해 HPE는 기존 시스템보다 5배 내지 10배 이상 빠른 슈퍼컴퓨팅인 엑사스케일 컴퓨팅이 유럽 전역에 확산될 수 있도록 슈퍼컴퓨팅 리소스를 더욱 확대하고 있다.

저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지