보다 큰 연산 능력과 메모리, 내장된 확장성으로 대규모 머신 인텔리전스 시스템 지원

M2000 IPU 머신_IPU랙
M2000 IPU 머신_IPU랙

글로벌 AI 반도체 전문 기업인 그래프코어(Graphcore)는 그래프코어의 2세대 IPU(지능 처리 장치) 플랫폼인 ‘IPU-머신 M2000’을 출시한다고 17일 밝혔다.

이 솔루션은 보다 큰 처리 능력과 메모리, 내장된 확장성을 바탕으로 극도의 머신 인텔리전스 워크로드를 처리 가능하며, 데이터센터급 연산 성능을 구현할 수 있다.

IPU-머신 M2000은 플러그 앤 플레이 방식의 머신 인텔리전스 컴퓨팅 블레이드로, 간편한 구축을 위해 설계됐으며 대규모 확장이 가능한 시스템을 지원한다.

슬림한 블레이드 유닛 하나로 1 페타플롭(PetaFlop)에 달하는 머신 인텔리전스 컴퓨팅 성능을 구현하며, 인공지능(AI)의 스케일아웃(scale-out)에 최적화된 통합 네트워킹 기술을 탑재했다.

IPU-머신 M2000은 그래프코어의 새로운7나노미터(nm) 콜로서스Mk2 GC200 IPU 프로세서 4개로 구동되며, 그래프코어의 포플러 소프트웨어 스택의 완벽한 지원을 받는다. 기존 시스템 간 호환성이 높고 1세대 그래프코어IPU 제품에 비해서도 8배나 향상된 성능을 제공한다.

포플러 소프트웨어는 IPU가 그래프코어의 독자적인 익스체인지-메모리 통신 기능을 통해 스트리밍 메모리에 액세스할 수 있도록 지원한다. 이를 통해 수천억 개의 매개 변수를 갖는 대규모 모델 또한 지원이 가능하다.

각 IPU-머신 M2000은 최대 450GB의 밀도를 제공하며, 초당180테라바이트에 이르는 독보적인 대역폭으로 익스체인지-메모리를 지원한다.

이에 따라 IPU 익스체인지-메모리는 최신 7나노 공정의 GPU 제품 대비 10배 이상의 높은 메모리 밀도와 100배 이상 높은 메모리 대역폭의 이점을 제공한다.

IPU-머신 M2000의 아키텍처는 최대 64,000 IPU의 데이터센터 규모 시스템을 IPU-POD구성 방식으로 구축해 16 엑사플롭(ExaFlops)의 머신 인텔리전스 연산 성능을 구현할 수 있다. 이를 통해 가장 까다로운 머신 인텔리전스 학습이나 대규모 구축에 따른 워크로드도 처리 가능하다.

IPU-머신 M2000 은 단일 IPU-머신 M2000 박스 하나를 기존의 CPU 서버 중 하나에 직접 연결해 구축 가능하며, 서버 한대에 최대 8대의 IPU-머신 M2000을 추가로 연결시킬 수도 있다.

GC200 프로세서_IPU2
GC200 프로세서_IPU2

대규모 시스템의 경우, 표준 19인치 랙에 내장된 16개의 IPU-머신 M2000으로 구성된 랙 스케일 IPU-POD 64를 사용해 랙을 스케일아웃해 데이터센터급 머신 인텔리전스 연산 성능을 구현한다.

그래프코어의 ‘버추얼-IPU’ 소프트웨어는 워크로드 관리 및 오케스트레이션(orchestration) 소프트웨어와 통합되어 다양한 사용자의 학습과 추론을 위한 서비스를 손쉽게 제공하며, 이를 통해 사용자는 가용 자원을 작업별로 조정 및 재구성할 수 있다.

그래프코어 IPU-머신 M2000 솔루션은 데이터센터에 머신 인텔리전스 컴퓨팅 기능의 추가 도입 계획을 검토하는 기업에게 강력하고 유연하며 간편한 사용을 바탕으로 탁월한 선택지를 제공한다.

IPU-머신 M2000은 새로운 그래프코어 콜로서스 Mk2 GC200 IPU를 탑재하고 있다. TSMC사의 최신 7나노 공정 기술을 이용해 개발된 각각의 칩에는 823 평방밀리미터(sqmm) 넓이의 단일 다이(die)에 594억 개가 넘는 트랜지스터가 탑재되어 있어 지금까지 개발된 프로세서 중 가장 정교한 수준의 아키텍처를 자랑한다.

GC200에는 1,472개의 개별 IPU-코어가 통합돼 있어 8,832개의 개별적인 병렬 연산 스레드를 실행할 수 있다. 각 IPU 프로세서 코어는 그래프코어가 독자적으로 개발한 ‘AI-플로트(AI-Float)’로 불리는 일련의 새로운 부동 소수점 기술을 통해 성능을 향상시킨다.

산술 구현 성능을 조정해 머신 인텔리전스 연산의 전력 소비와 성능을 개선하고 각각의 IPU-머신 M2000 블레이드 유닛 하나 당 최대 1 페타플롭의 AI 연산 성능을 제공한다.

나이젤 툰(Nigel Toon) 그래프코어 최고경영자(CEO)는 “이번에 새롭게 출시한 M2000은 기존에 비해 8배 가량 향상된 성능을 제공해 가장 까다로운 머신 러닝 및 대규모 데이터센터급 워크로드 처리도 가능하다. 그래프코어는 앞으로도 탄탄한 글로벌 파트너 생태계(에코시스템)를 바탕으로 머신 인텔리전스 분야의 다양한 고객층을 지원하기 위해 적극적인 시장 공략에 나설 것”이라고 말했다.

강민우 그래프코어 한국 지사장은 “그래프코어는 지속적인 혁신 제품 개발을 통해 국내외 AI 기업 고객의 요구사항을 충족하고 있다”며, “실제로 많은 고객들이 GPU기반 기술 대비 월등한 성능 개선을 통한 상업적 이점과 AI 연구 분야 진전에 도움이 됐다고 보고하고 있다. 그래프코어는 국내 비즈니스 강화에 초점을 두고 전폭적인 고객 지원을 아끼지 않겠다”고 덧붙였다.

IPU-머신 M2000 및 IPU-POD 64 시스템의 본격 양산 및 출하 일정은 4분기부터 시작될 예정이다. 초기 이용 고객들은 오늘부터 그래프코어의 클라우드 파트너인 시라스케일(Cirrascale)사의 클라우드를 통해 IPU-POD 시스템을 평가해 볼 수 있다.

IPU-POD 64
IPU-POD 64

 

저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지