Inquiry
Form loading...
Cluster di processori Power AI VICOR

Notizie aziendali

Cluster di processori Power AI VICOR

2023-12-08
Recentemente, l’introduzione di un nuovo supercomputer cluster basato su processore AI ASIC ha innalzato il limite della rete di trasmissione di energia a un livello mai immaginato qualche anno fa. Con l'applicazione di un livello di corrente vicino a 100 kA/cluster ASIC, è necessario innovare l'architettura, la topologia, il sistema di controllo e il packaging del sistema di alimentazione per soddisfare una domanda di corrente così elevata. A causa del continuo miglioramento del livello di potenza, è molto importante utilizzare il bus di alimentazione da 48 V per la trasmissione di potenza. Inoltre, l'applicazione sempre più compatta del cluster di processori limita la fattibilità di posizionare lo schema di alimentazione orizzontalmente accanto al processore, quindi è necessario un nuovo schema di alimentazione per risolvere il problema. Architettura a rapporto diviso (FPA) VICOR 48 V diretta al carico ( Sfide della trasmissione di potenza a grappolo Il sistema ASIC del cluster adotta un packaging compatto per ottenere la larghezza di banda ad alta velocità richiesta, in modo da realizzare i trilioni di prestazioni di elaborazione richieste dal carico di lavoro di addestramento dell'intelligenza artificiale (come la guida automatica). Ciascun processore nel cluster stesso potrebbe richiedere da 600 a 1000 A di corrente. Pertanto, anche sulla scheda di accelerazione di un singolo processore, se la posizione di posizionamento dello schema di alimentazione non è vicina al pin di alimentazione del processore, ciò comporterà anche una grave perdita di impedenza del PCB o del substrato, il che comporterà il problema della trasmissione di potenza. perdita del chiamante. Inoltre, GPU e processori AI speciali hanno adottato processi a 7 Nm e 5 nm e presto verranno utilizzati nodi di processo in silicio a 3 nm, in modo da realizzare il rapido sviluppo dell'intelligenza artificiale (AI). La tensione operativa nominale del nucleo di questi nodi di processo è attualmente compresa tra 0,75 e 0,85 V. Per accelerare le prestazioni del sistema con 8 processori e schede basati su GPU nel cluster, quindi inserirli su ciascun rack del sistema con requisiti di prestazioni elevate. Tuttavia, la recente introduzione di cerebras e Tesla mostra un altro metodo di clustering dell'ASIC AI stesso. Questo metodo può generare supercomputer con grande potenza di calcolo ed elevata densità di potenza, ma comporta anche severi test sulla trasmissione di potenza e sfide sulla gestione termica/raffreddamento. Per la trasmissione di potenza, il cluster ASIC/GPU non dispone di spazio di trasmissione di potenza orizzontale come la scheda AI a processore singolo o doppio processore. Il segnale I/O ad alta velocità utilizzato dal cluster ASIC/GPU è molto sensibile al rumore di commutazione a corrente elevata (ovvero il rumore generato quando funziona il regolatore buck polifase a commutazione dura). Pertanto, spostando lo schema di alimentazione polifase a commutazione rigida più vicino al processore si genererà un maggiore rumore di commutazione della corrente. In questo caso, il progetto dello schema di alimentazione non dovrebbe solo soddisfare i requisiti del segnale I/O sensibile al rumore, ma anche ridurre il più possibile il valore PDN. Con il valore di progettazione tipico di 40 – 60 A/fase, il numero di schemi di alimentazione polifase richiesti per fornire corrente di picco per ciascun ASIC AI o GPU (in molti casi, la richiesta di corrente di ciascun AISC è maggiore di 1500 A) può facilmente superare 30 fasi. In questo scenario applicativo, la tradizionale alimentazione trasversale (schema Buck polifase) è quasi difficile da realizzare. Una nuova modalità di sblocco della trasmissione di corrente per l'alimentatore a rapporto diviso Il principio di base dell'architettura a rapporto diviso (FPA) è quello di dividere il convertitore di potenza in due funzioni principali, ottimizzare ciascuna funzione rispettivamente e quindi realizzare queste funzioni come un sistema. Queste due funzioni sono la stabilizzazione della tensione e la moltiplicazione della corrente. Stabilizzazione della tensione L'efficienza del regolatore di tensione è inversamente proporzionale al lavoro svolto: maggiore è il lavoro, minore è l'efficienza. Quanto più vicine sono la tensione di ingresso e la tensione di uscita del regolatore, tanto minore è il lavoro svolto e tanto maggiore è l'efficienza. Con l'ottimizzazione della posizione dell'architettura del rapporto di suddivisione nel sistema, la differenza di tensione di ingresso-uscita del regolatore può essere ridotta al minimo. PRM Il regolatore di tensione adotta la topologia buck boost con commutazione a tensione zero (ZVS), che ha un'elevata efficienza quando la differenza di tensione in ingresso e in uscita è piccola. ZVS riduce notevolmente la perdita di commutazione, realizza il funzionamento ad alta frequenza e riduce notevolmente le dimensioni del convertitore. Il PRM solitamente regola la tensione di ingresso compresa tra 40 e 60 V sulla tensione di uscita compresa tra 30 e 50 V. Commutazione graduale e moltiplicazione della corrente Il PRM è seguito dal secondo stadio, che svolge funzioni di abbassamento della tensione e aumento della corrente. Questo utilizza l'ampiezza sinusoidale (SAC ) VTM della topologia Modulo moltiplicatore di corrente. Le caratteristiche di VTM possono essere considerate come un trasformatore ideale. Le sue tensioni di ingresso e uscita sono correlate da un rapporto fisso e può mantenere un'impedenza molto bassa (centinaia di ) quando si supera la frequenza operativa di 1 MHz. Poiché nel VTM non è presente alcun dispositivo di accumulo dell'energia, può fornire energia sufficiente purché mantenga un raffreddamento sufficiente. Ciò fa sì che la capacità di alimentazione del VTM corrisponda alla capacità termica del processore. La topologia Sac utilizza un sistema di controllo della commutazione a tensione zero e corrente zero, che riduce ulteriormente il rumore di commutazione e la perdita di potenza. PRM E VTM È parte integrante della FPA. Il PRM viene selezionato in base all'intervallo di tensione di ingresso del sistema e ai requisiti di alimentazione; VTM viene selezionato in base all'intervallo di tensione di uscita e ai requisiti di corrente. Il PRM può essere installato in qualsiasi punto conveniente del sistema; Il VTM deve essere installato il più vicino possibile al core del processore. PRM e VTM costituiscono insieme i moduli funzionali dell'FPA: uno è utilizzato in particolare per la stabilizzazione della tensione, l'altro è utilizzato in particolare per la conversione della tensione e la moltiplicazione della corrente. Il pacchetto chip SM riduce il rumore e migliora la dissipazione del calore Sebbene la topologia e l'architettura utilizzate per implementare i regolatori di tensione ad alte prestazioni siano importanti, la tecnologia di confezionamento è altrettanto importante. Vicor SM-ChiP Il pacchetto integra tutti i dispositivi passivi, i dispositivi magnetici, i MOSFET e i controller in un unico modulo. Inoltre, il design del package può fornire efficacemente corrente elevata e facilitare il raffreddamento del modulo con la più bassa impedenza termica. Molti dispositivi con chip SM sono dotati di schermi metallici collegati a terra nella maggior parte della superficie esterna. Ciò non solo contribuisce al raffreddamento, ma protegge anche il rumore della corrente parassita ad alta frequenza dalla diffusione all'esterno del dispositivo. La modalità di trasmissione della potenza verticale può ridurre la perdita PDN del 95% Per gli array di processori cluster su larga scala, è quasi impossibile adottare la tradizionale modalità di trasmissione di potenza orizzontale. La soluzione migliore per l'alimentazione del processore cluster è la trasmissione di potenza verticale (VPD). Nel VPD il moltiplicatore di corrente si trova direttamente sotto il processore sull'altro lato della scheda madre. Accorciando la distanza della corrente che passa attraverso la scheda madre, la perdita PDN viene notevolmente ridotta. VPD richiede due caratteristiche chiave per ottenere questa funzione. Schema di trasmissione di potenza verticale GTM Il moltiplicatore di corrente è posizionato sotto il processore per massimizzare le prestazioni di trasmissione di potenza. La soluzione di trasmissione di potenza verticale (VPD) è progettata anche per soluzioni che includono routing I/O più elevato, memoria integrata o cluster di processori più ristretti, riducendo notevolmente il numero di applicazioni dei dispositivi periferici. Innanzitutto, lo schema di alimentazione verticale (VPD) dovrebbe trovarsi nell'area direttamente sotto il processore, che contiene molti condensatori ad alta frequenza, necessari per disaccoppiare la corrente UHF (> 10 MHz) dal resto del sistema. In secondo luogo, per ottenere la massima efficienza, la posizione di uscita corrente e lo stile della soluzione VPD devono essere coerenti con la posizione di ingresso corrente e lo specchio di stile sul processore, in modo da realizzare il vero alimentatore "verticale" ad alta corrente. Per realizzare queste funzioni, la soluzione VICOR VPD è un modulo di integrazione composto da tre strati: lo strato inferiore è un riduttore e lo strato intermedio è l'array moltiplicatore di corrente VTM, lo strato superiore è il regolatore di tensione PRM, tali tre strati formano un VPD completo soluzione, che chiamiamo DCM 。 Gearbox svolge due funzioni: una è includere un condensatore di disaccoppiamento ad alta frequenza e l'altra è ridistribuire la corrente da VTM per formare una modalità coerente con l'immagine del processore sopra. La dimensione dell'array VTM dipende dai requisiti di corrente in ingresso del processore e la dimensione del PRM dipende dalla richiesta di alimentazione totale. Se la GPU o l'ASIC necessitano di più binari di alimentazione, il livello VTM e il livello PRM possono essere realizzati utilizzando rispettivamente PRM e VTM indipendenti e le loro dimensioni possono soddisfare i requisiti di corrente e tensione di ciascun binario specifico. Vicor DCM Si tratta di una soluzione VPD completa da 48 V per caricare cluster ASIC implementata in un pacchetto avanzato. PRM 、 VTM E lo strato di trasmissione del modulo fornisce stabilizzazione della tensione, moltiplicazione della corrente, capacità di disaccoppiamento e abbinamento del pacchetto pin-to-pin. Architettura Vicor FPA, sistema di controllo ZVS e ZCS, sacco ad alta frequenza Topologia del moltiplicatore di corrente e tecnologia di packaging del chip SM forniscono tutti gli elementi per migliorare il VPD. Risolve il problema della bassa rumorosità e della trasmissione di potenza in cluster e semplifica la progettazione meccanica del raffreddamento e della gestione termica con elevata efficienza e forte adattabilità termica. La soluzione VPD consente ai processori di analizzare dati massicci e ad alta velocità attraverso cluster, in modo da migliorare il modello di formazione e migliorare l'apprendimento automatico a un livello significativamente più elevato, così da diventare il vero promotore del sistema AI ad alte prestazioni. Modi migliori per ottenere potenza di calcolo ad alte prestazioni L’intelligenza artificiale e l’apprendimento automatico sono nella fase iniziale di crescita e questo treno accelererà solo con il passare degli anni. Questa accelerazione richiede soluzioni che elaborino dati più complessi più velocemente. La nuova generazione di supercomputer basati su processori AI ASIC richiederà più potenza rispetto ai supercomputer tradizionali. Un nuovo e innovativo schema di trasmissione di potenza è l’unico modo per l’intelligenza artificiale di realizzare il proprio impegno. È necessario che l’architettura, la topologia, il sistema di controllo e il packaging del sistema di alimentazione lavorino insieme per soddisfare la crescente domanda di corrente elevata. La soluzione preferita è lo schema di alimentazione verticale che utilizza il moltiplicatore di corrente. Si tratta di una soluzione collaudata e matura in grado di soddisfare la domanda odierna di elaborazione ad alte prestazioni e che può essere facilmente ampliata per stare al passo con le esigenze future. Ha una struttura compatta e un'elevata efficienza e può ridurre la perdita di potenza del PDN di oltre il 50%.