Inquiry
Form loading...
Power AI-processorcluster VICOR

bedrijfsnieuws

Power AI-processorcluster VICOR

08-12-2023
Onlangs heeft de introductie van een nieuwe clustersupercomputer op basis van een AI ASIC-processor de grens van het stroomtransmissienetwerk op een niveau gebracht dat een paar jaar geleden nog nooit was voor mogelijk gehouden. Met de toepassing van een stroomniveau van bijna 100 kA / ASIC-cluster is het noodzakelijk om te innoveren op het gebied van de architectuur van het stroomsysteem, de topologie, het besturingssysteem en de verpakking om aan een dergelijke hoge stroomvraag te kunnen voldoen. Vanwege de voortdurende verbetering van het vermogensniveau is het erg belangrijk om een ​​48V-voedingsbus te gebruiken voor krachtoverbrenging. Bovendien beperkt de steeds compactere toepassing van processorclusters de haalbaarheid van het horizontaal naast de processor plaatsen van het energiebeheerschema, dus is een nieuw energiebeheerschema nodig om het probleem op te lossen. VICOR 48V direct-to-load ( Uitdagingen van clusterkrachttransmissie Het cluster-ASIC-systeem maakt gebruik van een strakke verpakking om de vereiste hogesnelheidsbandbreedte te bereiken, om zo de biljoenen verwerkingsprestaties te realiseren die nodig zijn voor de AI-trainingswerklast (zoals automatisch rijden). Elke processor in het cluster zelf heeft mogelijk 600 tot 1000 ampère stroom nodig. Daarom zal, zelfs op de versnellingskaart van een enkele processor, als de plaatsingspositie van het energiebeheerschema niet dicht bij de stroompin van de processor ligt, dit ook een ernstig PCB- of substraatimpedantieverlies met zich meebrengen, wat de uitdaging van de stroomtransmissie met zich mee zal brengen. verlies van de beller. Bovendien hebben GPU en speciale AI-processors 7Nm- en 5nm-processen overgenomen en zullen binnenkort 3nm-siliciumprocesknooppunten worden gebruikt om de snelle ontwikkeling van kunstmatige intelligentie (AI) te realiseren. De nominale kernbedrijfsspanning van deze procesknooppunten ligt momenteel tussen 0,75 en 0,85 V. Om de prestaties van het systeem te versnellen met 8 GPU-gebaseerde processors en kaarten in het cluster, en deze vervolgens op elk rack van het systeem te plaatsen met hoge prestatie-eisen. De recente introductie van cerebras en Tesla laat echter een andere methode zien om AI ASIC zelf te clusteren. Deze methode kan supercomputers genereren met een groot rekenvermogen en een hoge vermogensdichtheid, maar brengt ook zware tests met zich mee op het gebied van de krachtoverbrenging en uitdagingen op het gebied van thermisch beheer/koeling. Voor krachtoverbrenging heeft het ASIC / GPU-cluster geen horizontale krachtoverbrengingsruimte zoals een AI-kaart met een enkele processor of een dubbele processor. Het snelle I/O-signaal dat door de ASIC/GPU-cluster wordt gebruikt, is zeer gevoelig voor schakelruis met hoge stroomsterkte (dat wil zeggen de ruis die wordt gegenereerd wanneer de hard schakelende polyfase-buck-regelaar werkt). Daarom zal het dichter bij de processor brengen van het hard schakelende polyfase-energieschema meer stroomschakelingsruis veroorzaken. In dit geval moet het ontwerp van het energieschema niet alleen voldoen aan de eisen van het ruisgevoelige I/O-signaal, maar ook de PDN-waarde zoveel mogelijk verlagen. Onder de typische ontwerpwaarde van 40 – 60 A/fase kan het aantal meerfasige voedingsschema’s dat nodig is om piekstroom te leveren voor elke AI ASIC of GPU (in veel gevallen is de huidige vraag van elke AISC groter dan 1500 A) gemakkelijk de 30 overschrijden. fasen. In dit toepassingsscenario is de traditionele transversale stroomvoorziening (polyfase Buck-schema) vrijwel moeilijk te realiseren. Een nieuwe manier om stroomtransmissie te ontgrendelen voor stroomvoorziening met split-ratio Het basisprincipe van de split ratio-architectuur (FPA) is om de stroomomvormer in twee hoofdfuncties te verdelen, elke functie respectievelijk te optimaliseren en deze functies vervolgens als een systeem te realiseren. Deze twee functies zijn spanningsstabilisatie en stroomvermenigvuldiging. Spanningsstabilisatie De efficiëntie van de spanningsregelaar is omgekeerd evenredig met de verrichte arbeid: hoe meer werk, hoe lager de efficiëntie. Hoe dichter de ingangsspanning en de uitgangsspanning van de regelaar bij elkaar liggen, hoe minder werk er wordt verricht en hoe hoger het rendement is. Met de positie-optimalisatie van de split-ratio-architectuur in het systeem kan het ingangs-uitgangsspanningsverschil van de regelaar worden geminimaliseerd. PRM De spanningsregelaar maakt gebruik van de Zero Voltage Switching (ZVS) Buck Boost-topologie, die een hoog rendement heeft wanneer het ingangs- en uitgangsspanningsverschil klein is. ZVS vermindert het schakelverlies aanzienlijk, realiseert hoogfrequente werking en verkleint de omvang van de omzetter aanzienlijk. PRM past doorgaans de ingangsspanning van 40 tot 60V aan naar de uitgangsspanning van 30 tot 50V. Zacht schakelen en stroomvermenigvuldiging De PRM wordt gevolgd door de tweede trap, die functies voor spanningsverlaging en stroomstijging uitvoert. Dit maakt gebruik van sinusoïdale amplitude (SAC) VTM van topologie Stroomvermenigvuldigingsmodule. De kenmerken van VTM kunnen worden beschouwd als een ideale transformator. De ingangs- en uitgangsspanningen zijn gerelateerd aan een vaste verhouding, en het kan een zeer lage impedantie handhaven (honderden van ) bij overschrijding van de werkfrequentie van 1 MHz. Omdat er in VTM geen energieopslagapparaat zit, kan het voldoende energie leveren, zolang het maar voldoende koeling behoudt. Hierdoor komt het vermogen van de VTM overeen met het thermische vermogen van de processor. De Sac-topologie maakt gebruik van een schakelbesturingssysteem met nulspanning en nulstroom, waardoor schakelruis en vermogensverlies verder worden verminderd. PRM en VTM Het is een integraal onderdeel van FPA. PRM wordt geselecteerd op basis van het ingangsspanningsbereik en de stroomvereisten van het systeem; VTM wordt geselecteerd op basis van het uitgangsspanningsbereik en de stroomvereisten. PRM kan op elke geschikte plaats in het systeem worden geïnstalleerd; De VTM wordt zo dicht mogelijk bij de processorkern geïnstalleerd. PRM en VTM vormen samen de functionele modules van FPA: de ene wordt speciaal gebruikt voor spanningsstabilisatie en de andere wordt speciaal gebruikt voor spanningsomzetting en stroomvermenigvuldiging. SM-chippakket vermindert geluid en verbetert de warmteafvoer Hoewel de topologie en architectuur die worden gebruikt om hoogwaardige spanningsregelaars te implementeren belangrijk zijn, is de verpakkingstechnologie net zo belangrijk. Vicor SM-ChiP Het pakket integreert alle passieve apparaten, magnetische apparaten, MOSFET's en controllers in één module. Bovendien kan het pakketontwerp effectief hoge stroom leveren en modulekoeling met de laagste thermische impedantie vergemakkelijken. Veel SM-chipapparaten hebben op de meeste delen van het buitenoppervlak geaarde metalen afschermingen. Dit draagt ​​niet alleen bij aan de koeling, maar voorkomt ook dat hoogfrequente parasitaire stroomruis zich buiten het apparaat verspreidt. De verticale energietransmissiemodus kan het PDN-verlies met 95% verminderen Voor grootschalige clusterprocessorarrays is het vrijwel onmogelijk om de traditionele horizontale energietransmissiemodus over te nemen. De beste oplossing voor de stroomvoorziening van clusterprocessors is verticale energietransmissie (VPD). Bij VPD bevindt de huidige vermenigvuldiger zich direct onder de processor aan de andere kant van het moederbord. Door de stroomafstand die door het moederbord gaat te verkorten, wordt het PDN-verlies aanzienlijk verminderd. VPD vereist twee belangrijke kenmerken om deze functie te bereiken. Verticaal krachtoverbrengingsschema GTM De stroomvermenigvuldiger wordt onder de processor geplaatst om de krachtoverbrengingsprestaties te maximaliseren. De oplossing voor verticale energietransmissie (VPD) is ook ontworpen voor oplossingen zoals hogere I/O-routering, ingebouwd geheugen of strakkere processorclusters, waardoor het aantal toepassingen voor randapparatuur aanzienlijk wordt verminderd. Ten eerste moet het verticale voedingsschema (VPD) zich in het gebied direct onder de processor bevinden, dat veel hoogfrequente condensatoren bevat, die nodig zijn om UHF-stroom (> 10 MHz) te ontkoppelen van de rest van het systeem. Ten tweede moeten, om maximale efficiëntie te bereiken, de huidige uitgangspositie en stijl van de VPD-oplossing consistent zijn met de huidige invoerpositie en stijlspiegel op de processor, om de echte "verticale" voeding met hoge stroomsterkte te realiseren. Om deze functies te realiseren, is de VICOR VPD-oplossing een integratiemodule die uit drie lagen bestaat: de onderste laag is een versnellingsbak en de middelste laag is VTM Current multiplier array, de bovenste laag is PRM-spanningsregelaar, dergelijke drie lagen vormen een complete VPD oplossing, die we DCM noemen. De versnellingsbak heeft twee functies: de ene is het opnemen van een hoogfrequente ontkoppelingscondensator, en de andere is het herverdelen van de stroom van VTM om een ​​modus te vormen die consistent is met het beeld van de bovenstaande processor. De grootte van de VTM-array hangt af van de ingangsstroomvereisten van de processor, en de grootte van de PRM hangt af van de totale stroomvraag. Als de GPU of ASIC meerdere stroomrails nodig heeft, kunnen de VTM-laag en de PRM-laag worden gerealiseerd door respectievelijk onafhankelijke PRM en VTM te gebruiken, en hun grootte kan voldoen aan de stroom- en spanningsvereisten van elke specifieke rail. Vicor DCM Het is een complete 48V om VPD-oplossing te laden voor ASIC-clusters geïmplementeerd in een geavanceerd pakket. PRM, VTM En de versnellingsbaklaag van de module zorgt voor spanningsstabilisatie, stroomvermenigvuldiging, ontkoppelingscapaciteit en pin-to-pin-pakketmatching. Vicor FPA-architectuur, ZVS- en ZCS-besturingssysteem, hoogfrequente sac Huidige multipliertopologie en SM-chip Verpakkingstechnologie biedt alle elementen om VPD te verbeteren. Het lost het probleem van geluidsarme en clusterkrachtoverdracht op, en vereenvoudigt het mechanische ontwerp van koeling en thermisch beheer met een hoog rendement en een sterk thermisch aanpassingsvermogen. Met de VPD-oplossing kunnen processors snelle en enorme gegevens analyseren via clusters, om het trainingsmodel te verbeteren en machine learning naar een aanzienlijk hoger niveau te brengen, om zo de echte promotor te worden van een krachtig AI-systeem. Betere manieren om krachtige rekenkracht te verkrijgen AI en machinaal leren bevinden zich in de eerste groeifase, en deze trein zal met het verstrijken van de jaren alleen maar versnellen. Deze versnelling vereist oplossingen die complexere gegevens sneller verwerken. De nieuwe generatie supercomputers op basis van AI ASIC-processors zullen meer kracht nodig hebben dan traditionele supercomputers. Een nieuw en innovatief energietransmissieschema is de enige manier waarop AI zijn belofte kan waarmaken. Het vereist dat de architectuur, de topologie, het besturingssysteem en de verpakking van het energiesysteem samenwerken om aan de toenemende hoge huidige vraag te voldoen. Het verticale voedingsschema met behulp van een stroomvermenigvuldiger heeft de voorkeur. Het is een beproefde en volwassen oplossing die kan voldoen aan de huidige vraag naar krachtige computers en die eenvoudig kan worden uitgebreid om aan toekomstige behoeften te voldoen. Het heeft een compacte structuur en een hoog rendement en kan het vermogensverlies van PDN met meer dan 50% verminderen.