Cerebras e G42 presentano il più grande supercomputer al mondo da 4 exaFLOP
Cerebras Systems e G42 hanno presentato Condor Galaxy, una rete di nove supercomputer interconnessi con un nuovo approccio all’elaborazione IA in grado di ridurre drasticamente i tempi di training dei modelli IA. Condor Galaxy 1, il primo supercomputer IA di questa rete, si caratterizza per i suoi 4 exaFLOP e i 54 milioni di processori core. Cerebras e G42 prevedono di implementare nei primi mesi del 2024 altri due supercomputer di questo tipo, CG-2 e CG-3, negli Stati Uniti. Con una capacità programmata totale da 36 exaFLOP, questa rete di computer senza paragoni rivoluzionerà il progresso dell’IA nel mondo.
“È stato incredibilmente entusiasmante collaborare con Cerebras per fornire rapidamente il supercomputer di training dell’IA più veloce al mondo e gettare le basi per l’interconnessione di una costellazione di questi supercalcolatori in tutto il mondo. Questa collaborazione coniuga le straordinarie capacità di elaborazione di Cerebras con l’esperienza multisettoriale di G42 nell’IA. Secondo la visione condivisa di G42 e Cerebras, Condor Galaxy sarà utilizzato per rispondere ai problemi più pressanti della società in ambito sanitario, energetico, di azione per il clima e non solo”, ha commentato Talal Alkaissi, CEO di G42 Cloud, una controllata di G42.
Situato a Santa Clara, California, CG-1 riunisce 64 sistemi Cerebras CS-2 collegandoli in un unico supercomputer IA facile da usare, con una capacità di training IA da 4 exaFLOP. Cerebras e G42 propongono CG-1 come servizio sul cloud che consente ai clienti di ottenere i benefici garantiti dalle performance di un supercomputer IA senza necessità di gestire o distribuire modelli su sistemi fisici.
Con CG-1, Cerebras per la prima volta collabora non solo alla realizzazione di un supercomputer IA dedicato, ma anche alla sua gestione e funzionamento. CG-1 è stato progettato per consentire a G42 e ai suoi clienti sul cloud di effettuare in modo rapido e semplice il training di grandi modelli innovativi e, quindi, di velocizzare l’innovazione. L’alleanza strategica tra Cerebras e G42 dispone già di avanzati modelli IA stato dell’arte in chat arabe bilingui, di studi in materia sanitaria e di clima.
“Fornendo 4 exaFLOP di elaborazione IA a FP 16, CG-1 riduce drasticamente i tempi di training dell’IA eliminando al contempo la fatica dell’elaborazione distribuita”, è la dichiarazione di Andrew Feldman, CEO di Cerebras Systems. “Molte aziende sul cloud hanno annunciato grandi cluster di GPU, la cui realizzazione costa miliardi di dollari, ma che risultano difficilissimi da usare. Distribuire un singolo modello su migliaia di piccole GPU richiede mesi di tempo da parte di decine di persone estremamente esperte. CG-1 risolve questo problema; la configurazione di un modello di IA generativa richiede minuti, non mesi, e può essere eseguita da un singolo addetto. CG-1 è il primo di tre supercomputer IA da 4 exaFLOP che saranno implementati negli Stati Uniti. Insieme a G42, nel corso del prossimo anno prevediamo di espandere questa implementazione e di creare incredibili capacità di elaborazione IA da 36 exaFLOP efficienti e realizzate ad hoc”.
G42, leader nell’IA e nel cloud computing con sede negli Emirati Arabi Uniti, è in prima linea nelle iniziative di trasformazione digitale su larga scala a livello mondiale. Gli EAU sono stati la prima nazione a nominare nel proprio governo federale un Ministero per l’Intelligenza Artificiale, con successivi cospicui investimenti come la creazione del partner per la ricerca di G42, la Mohamed bin Zayed University of Artificial Intelligence, in assoluto la prima università al mondo di specializzazione post-laurea focalizzata interamente sull’IA.
Il training di modelli di grandi dimensioni richiede enormi volumi di calcolo, ampi set di dati e competenze specifiche sull’IA; la collaborazione tra G42 e Cerebras risponde a tutti e tre questi requisiti. Con la rete di supercomputer Condor Galaxy, queste due aziende stanno democratizzando l’IA perché offrono un accesso semplice e senza problemi al computer IA leader di settore. G42 opera su diversi set di dati provenienti da studi in materia di sanità, energia e clima, per consentire agli utenti dei sistemi di effettuare il training di nuovi e avanzati modelli fondamentali. Questi modelli e le applicazioni derivate rappresentano una forza potente per il bene. Cerebras e G42, infine, riuniscono un team di ingegneri hardware e dati, scienziati dell’IA e specialisti del settore per un’offerta completa nel settore IA mirata a risolvere i problemi dei clienti. È una combinazione che produrrà risultati rivoluzionari e velocizzerà al massimo centinaia di progetti IA nel mondo.
Ottimizzato per i modelli linguistici di grandi dimensioni e per l’IA generativa, CG-1 è dotato di 4 exaFLOP a 16 bit per il calcolo IA , con supporto standard fino a 600 miliardi di modelli di parametri e supporto opzionale fino a 100 trilioni di modelli di parametri tramite configurazioni estensibili. Con 54 milioni di core di elaborazione ottimizzati per l’IA, fabric bandwidth da 388 terabit al secondo e 72.704 processori core EPYC AMD, diversamente da qualsiasi cluster GPU, CG-1 offre una scalabilità quasi lineare delle performance da 1 a 64 sistemi CS-2 utilizzando un semplice parallelismo dei dati.
“AMD si impegna ad accelerare l’IA con processori di elaborazione all’avanguardia estremamente performanti e prodotti per il calcolo adattivo, oltre che tramite collaborazioni con aziende innovative come Cerebras, che condividono la nostra visione dell’IA pervasiva”, ha sottolineato Forrest Norrod, vicepresidente esecutivo e direttore generale del Data Center Solutions Business Group di AMD. “Basato su oltre 70.000 processori core EPYC AMD, Condor Galaxy 1 di Cerebras metterà ampie risorse di elaborazione a disposizione di ricercatori e imprese impegnati a promuovere l’IA”.
CG-1 offre supporto nativo per il training con lunghezze di sequenze estese e fino a 50.000 token già pronti per l’uso, senza necessità di librerie software speciali. La programmazione di CG-1 avviene interamente senza complessi linguaggi di programmazione distribuita e, quindi, anche i modelli più grandi possono essere eseguiti senza dedicare settimane o mesi alla distribuzione delle attività su migliaia di GPU.
Situato a Colovore, una struttura di co-location estremamente performante di Santa Clara, California, CG-1 è gestito da Cerebras in conformità alle normative statunitensi, a garanzia del fatto che i sistemi IA stato dell’arte non vengano utilizzati da stati avversari. Ciascun sistema Cerebras CS-2 è progettato, sottoposto a packaging, prodotto, testato e integrato negli Stati Uniti; Cerebras è il solo produttore a effettuare il packaging dei processori e a produrre sistemi IA negli Stati Uniti.
CG-1 è il primo di tre supercomputer IA da 4 exaFLOP costruiti e installati negli Stati Uniti grazie alla collaborazione tra Cerebras e G42. Questi tre supercomputer IA saranno interconnessi in un supercomputer IA distribuito da 12 exaFLOP e con 162 milioni di core, formato da 192 Cerebras CS-2 e basato su oltre 218.000 CPU core EPYC AMD a performance elevate. G42 e Cerebras prevedono di rendere operativi altri sei supercomputer Condor Galaxy nel 2024, portando la potenza di elaborazione totale a 36 exaFLOP.