Video: La nueva supercomputadora más potente del mundo ahora es de Estados Unidos y no de China+ (Noviembre 2024)
El gobierno de EE. UU. Hizo una gran apuesta para que las supercomputadoras más rápidas ayuden a resolver algunos de los problemas más importantes de la ciencia, con planes para construir dos supercomputadoras enormes, cada una de las cuales sería varias veces más rápida que las máquinas más rápidas de la actualidad.
Esto incluye $ 325 millones para la construcción de las nuevas supercomputadoras, incluida una nueva máquina llamada Summit en Oak Ridge National Laboratories (ORNL) y otra llamada Sierra en Lawrence Livermore National Laboratory (LLNL), así como $ 100 millones para investigación y desarrollo en situaciones extremas. escala la tecnología de supercomputación en un programa llamado FastForward2. Se espera que Summit entregue de 150 a 300 petaflop / s de pico (miles de millones de cálculos de coma flotante por segundo), y Sierra más de 100 petaflop / s en comparación con los 54.9 petaflop / s de pico de la máquina más rápida de hoy (la Tianhe-2) en la carretera hacia la "computación exascale".
Para poner esto en perspectiva, la potencia de cómputo total de los sistemas Top500 a partir de hace unos meses era de 274 petaflop / s (una nueva lista de Top500 saldrá la próxima semana junto con el programa SuperComputing 14). Ambos sistemas serán construidos por IBM y se basarán en CPU de arquitectura IBM Power, GPU Nvidia Tesla e interconexiones Mellanox.
Tom Rosamilla, vicepresidente senior de IBM Systems & Technology Group, describió los sistemas como el uso de una nueva "arquitectura centrada en datos" diseñada para eliminar el movimiento de datos tanto como sea posible, colocando los datos más cerca de la informática. IBM dice que esto está diseñado para proporcionar modelado, simulación, aplicaciones y análisis de vanguardia y rentables en Big Data, y aprovecha la iniciativa OpenPower (de la cual Nvidia y Mellanox son miembros).
Como parte de esto, utilizará las GPU Nvidia Tesla basadas en su próxima arquitectura Volta (que vence en 2017, siguiendo la arquitectura Pascal en 2016) y la tecnología NVLink de la compañía para conexiones entre todos los procesadores en un solo nodo de servidor. Sumit Gupta, Gerente General de Tesla GPU Accelerated Computing para Nvidia, describió NVLink como la "primera interconexión de alta velocidad para la GPU", que permite las comunicaciones punto a punto entre una GPU y otra GPU, así como entre la GPU y el CPU de potencia. (La primera generación de NVLink se lanzará en 2016; los nuevos sistemas utilizarán la segunda generación). Los nodos dentro de los sistemas se conectarán usando la próxima generación de interconexión InfiniBand Mellanox EDR 100 Gb / s.
IBM dijo que cada sistema tendrá un rendimiento máximo "muy superior a 100 petaflops", equilibrado con más de cinco petabytes de memoria dinámica y flash, y será capaz de mover datos al procesador a más de 17 petabytes por segundo (que el la compañía dice que es equivalente a mover más de 100 mil millones de fotos por segundo).
Jeffrey Nichols, director de laboratorio asociado de OrnL's Computing and Computational Sciences, describió la arquitectura como "un número menor de nodos con una huella de memoria compartida mucho mayor" y dijo que eso debería permitir a los desarrolladores optimizar y ejecutar de manera más eficiente las cargas paralelas que actualmente se ejecutan en la corriente de ORNL Sistema titán. ORNL dice que su sistema Summit incluirá más de 3400 nodos con cada nodo, incluidos múltiples procesadores IBM Power 9 y múltiples GPU Nvidia Volta, con más de 512 GB de DDR4 y memoria de alto ancho de banda (en un diseño coherente, por lo que puede funcionar con todos los CPU y GPU) junto con 800 GB de RAM no volátil, que ofrece más de 40 teraflops de rendimiento máximo. Tendrá un sistema de servidor de almacenamiento GPFS con 1TB / s de ancho de banda de E / S y 120 PB de capacidad de disco. Esto eventualmente debería reemplazar el sistema Titan actual de ORNL, que es un sistema Cray basado en procesadores AMD Opteron y CPU Nvidia Kepler, capaces de 27 petaflop / s, con Nichols diciendo que Summit debería entregar de 5 a 10 veces el rendimiento de Titan. Summit está programado para ser entregado en 2017 y disponible para usuarios en 2018.
Las aplicaciones objetivo para el sistema Summit incluyen la ciencia de la combustión (tratando de aumentar la eficiencia de los motores de combustión en un 25-50 por ciento), la ciencia del cambio climático, el almacenamiento de energía y la energía nuclear. Nichols dijo que Summit debería permitir a ORNL "expandir los horizontes" de la ciencia que están haciendo en los laboratorios.
El sistema LLNL, llamado Sierra, está dirigido al programa de Simulación y Computación Avanzada (ASC) de la Administración Nacional de Seguridad Nuclear (NNSA), diseñado principalmente en ciencia y evaluación de armas. Según Mike McCoy, Director del Programa ASC de LLNL, la supercomputadora le permite al laboratorio hacer simulaciones sobre las reservas nucleares del país sin tener que volver a las pruebas nucleares. Dijo que el código de simulación de armas 3D del laboratorio era "una de las aplicaciones más complicadas del planeta". Señaló que este no es un caso del gobierno que compra un sistema comercial, sino más bien un "codiseño" en el que los programadores y los diseñadores del sistema trabajan juntos en la arquitectura.
Ambos sistemas, que forman parte de un programa del Departamento de Energía conocido como Colaboración de los laboratorios nacionales Oak Ridge, Argonne y Lawrence Livermore (CORAL), tienen como objetivo acelerar el desarrollo de la informática de alto rendimiento. IBM dice que la programación para tales sistemas puede comenzar hoy, pero los sistemas no se instalarán hasta 2017 o 2018. Como parte del programa CORAL, Argonne National Lab también obtendrá nueva supercomputación, pero aún no lo ha anunciado.
En general, Nichols dijo que consideraba a Summit y Sierra como "primeros pasos hacia el exascale" y dijo que esperaba sistemas futuros a lo largo del mismo camino arquitectónico y esperaba una larga colaboración con los vendedores. Aproximadamente cinco años después de la entrega de Summit, dijo, esperaría tener una computadora exascale.
Además, hoy AMD anunció que recibió $ 32 millones en dos premios del DOE, como parte del proyecto FastForward2, para investigar la arquitectura de nodo de exascale basada en sus unidades de procesamiento acelerado (APU) basadas en la arquitectura de sistema heterogéneo (HSA) y para ayudar a diseñar un nuevo estándar para futuras interfaces de memoria. El DOE dijo que AMD, Cray, IBM, Intel y Nvidia liderarán los proyectos FastForward2. (Intel y Cray no están involucrados con las supercomputadoras anunciadas hoy, pero continúan siendo grandes jugadores en el espacio, por lo que será interesante ver si están involucrados en los planes de Argonne).