UAE G42의 AI슈퍼컴 '콘도르 갤럭시3'에 공급돼
GPU대비 57배, 최대 24조개 파라미터 AI모델 훈련

미국의 AI반도체 스타트업인 세레브라스 시스템즈(Cerebras systems)가 초거대 3세대 웨이퍼 스케일 AI가속기인 ‘CS-3’를 공개했다. 이 가속기는 UAE의 기술지주그룹 G42의 AI 슈퍼컴퓨터 ‘콘도르 갤럭시3(CG-3)’에 탑재됐다.

세레브라스는 13일(현지시간) 현재 가장 큰 GPU보다 57배 처리 능력을 갖고 이전 CS-2보다 2배 빠르게 거대언어모델(LLM)를 훈련시킬 수 있는 CS-3 가속기를 발표했다.

이는 CS-3 가속기가 4조개의 트랜지스터와 90만개의 AI코어, 칩내에 44GB의 S램을 갖춘 웨이퍼 스케일 AI칩인 WSE-3를 내장하고 있는 데 따른 것이다. WSE-3는 최대 125 페타플롭스의 AI 성능을 갖춰, 최대 24조개의 파라미터를 가진 AI 모델을 훈련시킬 수 있다. TSMC 5나노 공정으로 생산됐다. GPT4와 클로드보다 10배 큰 LLM을 구축할 수 있다.

 

세레브라스의 WSE-3. 웨이퍼 스케일 AI반도체로 초거대 AI가속기 CS-3에 사용된다. 출처=세레브라스
세레브라스의 WSE-3. 웨이퍼 스케일 AI반도체로 초거대 AI가속기 CS-3에 사용된다. 출처=세레브라스

 

확정성도 커, 최대 2048개의 CS-3시스템을 연결한 CS-클러스터로 하이퍼스케일 AI슈퍼컴퓨터를 구축할 수 있다.

CS-3는 또 새로운 GPU가 이전 세대 대비 두 배 이상의 전력과 비용 증가를 불러오는 데 반해 이전 CS-2대비 전력이나 비용 증가 없이 최대 2배로 성능을 끌어올릴 수 있어 총소유비용을 크게 개선시켰다.

CS-3가 공급된 첫 AI슈퍼컴퓨터는 G42와 세레브라스가 협력해 구축한 세 번째 슈퍼컴퓨터인 콘도르 갤럭시 3(CG-3)다. CG-3는 64개의 CS-3시스템이 들어가 8 엑사플롭스의 성능을 갖춰, 이전 CG-2의 계산 용량을 2배 늘리면서도 전력 소비는 증가하지 않는다. CG-3는 개발자에게 단일 프로세서로 단일 통합메모리로 제시된다. 이에 단일 장치처럼 보이고 프로그래밍할 수 있는 유일한 AI슈퍼컴퓨터라는 것이 세레브라스측 설명이다.

CG-3는 텍사스주 댈러스에 구축되며, 오는 2분기 가동을 시작할 예정이다.

한편, 세레브라스는 퀄컴과 파트너십을 체결하고 LLM의 훈련 및 추론을 위한 공동 AI플랫폼을 개발하고 있다.

관련기사

저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지