Earth Simulator
De Viquipèdia
L'Earth Simulator (ES) va ser el supercomputador més ràpid del món des de 2002 fins a 2004. Pot portar a terme 35,86 trilions (35,860,000,000,000) d'operacions en coma flotant per segon, o 35,86 TFLOPS. És un projecte dels organismes japonesos NASDA, JAERI i JAMSTEC per a desenvolupar un sistema per fer un model climàtic.
L'Earth Simulator està emplaçat a l'àrea industrial de Kanazawa-ku, a Yokohama-shi, Japó. El complex Earth Simulator Center (ESC) va començar a operar a finals de 2001 i esdevingué el primer de la llista TOP 500 de supercomputadors. Encara que el projecte es va fer públic 5 anys abans, la comunitat de supercomputació dels EUA va rebre una sorpresa.
Taula de continguts |
[edita] Finalitat
L'ES es dedica a la recerca, principalment, de dues parts de la ciència:
- D'una banda l’estudi atmosfèric i oceanogràfic, realitza models d’alta resolució:
- globals, on mostra posibles prediccions de l’escalfament global
- regionals, desenvolupa estudis sobre fenòmens com el Niño i el monsó asiàtic
- locals, amb models de prediccions de desastres climàtics com els tifons, les plujes torrencials localitzades, el vessament de petròli... etc.
- Per altra part, tenim l’estudi de la terra ferma amb models dinàmics:
- globals, ajuntant en un sistema tota la superficie de terra sòlida
- regionals, on descriu l’activitat de l’escorça i el mantell de la zona de l’Arxipèlag Japonès. També simula el procés de generació d’un terratrèmol, i realitza estudis tomogràfics amb ones sísmiques.
[edita] Maquinari
Aquest supercomputador es basa en l’arquitectura SX de NEC.
Està composat de 640 nodes, cada un format per 8 processadors vectorials (amb un màxim de 8 GFLOPs cadascú). El cicle de procés es de 2ns (és a dir 500Mhz) i hi ha 16 gibibytes de memòria compartida dins de cada node. Està compartimentat en cabinets de 1 metre x 1,4 metres x 2 metres, on s'hi encabeixen dos nodes dels esmentats anteriorment. Cada cabinet consumeix una potència de 20KVA.
En total, té 5120 processadors, un màxim teòric de 40 TFlops i 10 tebibytes de memòria. Té un single stage crossbar consistent en 2900m de cables, dividits en 83000 cables de coure, amb un ample de banda en el seu tall transversal de 16 GiB/s. Disposa d'una capacitat d’emmagatzemament de 700 terabytes de espai en disc i de 1,6 PBbytes en cinta magnètica.
La zona ocupada pel supercomputador és l'equivalent a 4 pistes de tennis, amb tres pisos d’alçada.
[edita] Processor Node (PN)
El Sistema de Memòria global (MS) es divideix en 2048 bancs, i la seqüència de números de bancs, concorda amb l’increment d’adreçes de llocs a la memòria. Per això el rendiment màxim s’obté accedint a les dades contigües que estan assignades a llocs en ordre ascendent de les adreçes de memòria.
[edita] Processadors Aritmètics (AP)
Consisteixen en un xip LSI, que opera a una freqüència de rellotge de 500 MHz amb alguns circuits operant a 1GHz, format per:
- una unitat super-escalar de 4 vies (SU)
- Una unitat vectorial (VU)
- Una unitat de control a la memoria principal
Cada SU és un procesador super-escalar amb:
- 64KB de memòria cau (cache en anglès)) d’instrucció
- 64KB de memòria cau de dades
- 128 registres escalars de propòsit general.
Cada VU té:
- 72 registres vectorials
- cada un d'aquests registres té 256 elements vectorials
- 8 conjunts de 6 tipus diferents de canonades vectorials: suma/desplaçament, multiplicació, divisió, operacions lògiques, màscares i càrrega/emmagatzamament (load/store).
El mateix tipus de canonades vectorials treballen juntes amb una instrucció d’un únic vector i canonades de diferents tipus poden operar concurrentment. El VU i SU suporten el format de dades en punt flotant de l’IEEE 754.
[edita] Interconnection Network (IN)
La unitat de control d’accés remot (RCU) està connectada directament als switches del bus d’interconnexió i controla les comunicacions de dades entre nodes a un ritme de transferèrencia bidireccional de 12,3 GB/s, tant per enviar com per rebre dades. Així l’ample de banda total de la xarxa entre nodes és al voltant de 8 TB/s. Varis modes de transferència de dades , incluint l’accés a subarrays tridimensionals i modes d’accés indirecte, es realitzen per hardware. En una operació que involucra l’accés a les dades d’un subarray, les dades es voen d’un PN a un altre en una única operació de hardware, amb un temps de processament relativament petit.
Les cabines de Xarxa d’Interconnexió (IN) tenen dos switch de 640x640. La senyal de PN canvia de sèrie a paral.lel i es introduida a un circuit d’intercanvi. La senyal que venia del circuit d’intercanvi es convertida a Paral.lel o Sèrie, i enviada a una altra cabina PN. El nombre de cables que connecten les cabines PN i les IN es 640x130=83200, i l’extensió total es de 2400 Km.
[edita] Sistema Operatiu
El sistema operatiu que funciona a l’Earth Simulator es una versió específica del sistema operatiu de NEC basat en UNIX, anomenat SUPER-UX, i va ser desemvolupat per la sèrie de supercomputadores SX de NEC. Per ajudar als càlculs científics a gran escala, el SUPER-UX ha estat optimitzat principalment en extendre la escalabilitat i en proveir qualitats especials per l’Earth Simulator.
[edita] Sistema de fitxers paral.lel
Si un treball en paral.lel , que s’executa en els 640 PNs, llegeix o escriu a un disc intal.lat en un PN, cada PN accedeix al disc seqüencialment i el rendiment empitjora molt. Encara que una E/S local en la qual cada PN llegeix o escriu en el seu propi disc resol el problema, és un treball difícil, administrar un nombre gran de arxius parcials. De manera que, les E/S paral.leles són necesàries en aquest supercomputador, des del punt de vista del rendiment, i la facilitat d’ús. El Sistema de Fitxers Paral.lel (PFS) proveeix al Earth Simulator d’una E/S paral.lela. Això permet manejar multiples fitxers, que estan localitzats a discs separats de varis PNs, com un gran fitxer lògic. Cada procés d’un programa paral.lel pot llegir/escriure dades distribuides desde i cap a un fitxer paral.lel concurrentment amb una expressió d’E/S per arribar a un alt rendiment i facilitat d’ús de l’E/S.
[edita] Llenguatges
Compiladors de Fortran 90, C i C++ són els emprats. Tots ell tenen un avançada capacitat de vectorització automàtica i microtasques.