Video: Fugaku | Así es la "supercomputadora" japonesa más rápida del mundo (Noviembre 2024)
La noticia de ayer de que la supercomputadora Tianhe-2 de China es ahora la más rápida del mundo no es tan impactante. Después de todo, una versión anterior estaba en la cima de la lista de supercomputación en 2010.
Lo que es un poco más sorprendente es la arquitectura detrás del Tianhe-2 (también conocido como Milky Way-2). Se basa en la nueva arquitectura Xeon Phi de Intel, que combina una gran cantidad de núcleos x86 en un solo chip; la supercomputadora luego combina esos chips en una sola arquitectura. No se esperaba que este sistema se implementara durante un par de años más, por lo que me sorprendió ver un sistema basado en Xeon Phi para encabezar la lista. Lo que encuentro más fascinante aquí es la competencia con sistemas basados principalmente en la computación GPU. De hecho, un sistema basado en los núcleos de GPU CUDA de Nvidia, que encabezó la lista la última vez, ahora ocupa el segundo lugar.
La lista Top500 de las computadoras más rápidas del mundo generalmente sale dos veces al año: una vez en conjunto con la Conferencia Internacional de Supercomputación (ISC) que está ocurriendo ahora en Alemania y nuevamente en la Conferencia de Supercomputación (SC 13) en el otoño.
El Tianhe-2, con sede en la Universidad Nacional de Tecnología de Defensa en Changsha, China, muestra un rendimiento sostenido de más de 33.8 petaflops (más de 17, 500 billones de operaciones de punto flotante por segundo) y un rendimiento máximo de 54.9 petaflops en el punto de referencia LINPACK. Esto hace que sea aproximadamente el doble de rápido que el líder anterior, el sistema Titan basado en el Laboratorio Nacional Oak Ridge (ORNL) del Departamento de Energía de los Estados Unidos. Tianhe-2 tiene 16, 000 nodos, cada uno con dos procesadores Intel Xeon E5-2692 (procesadores de 12 núcleos, usando el puente Ivy) y tres procesadores Xeon Phi para un total combinado de 3, 120, 000 núcleos informáticos. Los núcleos Xeon se basan en una próxima versión de 12 núcleos de la familia Xeon # 5-2600, basada en la arquitectura Ivy Bridge de 22 nm. El sistema total consume 17.8MW, la mayor parte de cualquier sistema superior en la lista de los 500 principales, pero debido a que los números de rendimiento son tan altos, todavía se considera relativamente eficiente en cuanto a energía. La lista de junio de las supercomputadoras más eficientes, la Green500, saldrá en breve.
El sistema Titán de ORNL, que encabezó la lista anterior, ahora está en segundo lugar. Esto se basa en un sistema Cray XK7 con 18, 688 nodos, cada uno con un AMD Opteron 6274 de 16 núcleos y un acelerador de la unidad de procesamiento de gráficos (GPU) Nvidia Tesla K20x. Este sistema muestra un rendimiento sostenido de 17.5 petaflops (más de 17, 500 billones de operaciones de punto flotante por segundo) y un rendimiento máximo de más de 27 petaflops en el punto de referencia LINPACK. El sistema Sequoia en el Laboratorio Nacional Lawrence Livermore, basado en el sistema BlueGene / Q de IBM y sus CPU de potencia, ocupó el segundo lugar en la lista Top500 hace un año, pero ha caído al tercer lugar. El sistema del cuarto lugar sigue siendo la "computadora K" en el Instituto Avanzado de Ciencia Computacional RIKEN de Japón, basado en los procesadores Fujitsu SPARC64.
Los cuatro sistemas principales muestran cuatro arquitecturas muy diferentes. Los grandes sistemas tradicionales de hierro, como los basados en las arquitecturas BlueGene (Power) de IBM y SPARC de Fujitsu, todavía están en funcionamiento, pero la mayor parte de la atención se dirige a la nueva arquitectura Xeon Phi de Intel y la arquitectura CUDA de Nvidia. Mientras tanto, sigue habiendo historias de que China está trabajando para crear su propio procesador para supercomputación.
En más detalles, Nvidia anunció ayer que los investigadores de la Universidad de Stanford están utilizando GPU para crear la red neuronal artificial más grande del mundo diseñada para modelar cómo aprende el cerebro humano. También reveló que su kit de herramientas CUDA ahora admitirá plataformas basadas en ARM.
Como parte de la conferencia de supercomputación, Intel también presentó nuevas versiones de su familia de coprocesadores Xeon Phi, incluida la 7100 con 61 núcleos con velocidad de reloj de 1, 23 GHz, 16 GB de capacidad de memoria y más de 1.2TFlops de rendimiento de doble precisión; la familia Xeon Phi 3100 con 57 núcleos a 1.1GHz y 1TFlops de rendimiento de doble precisión; y un nuevo 5100D, diseñado para que los enchufes se puedan conectar a una mini placa para usar en factores de forma de cuchilla. Intel dice que la próxima generación, conocida como "Knights Landing" y basada en la próxima tecnología de proceso de 14 nm, funcionará no solo como coprocesador, sino también como procesador primario, eliminando así la complejidad de mover datos a diferentes grupos de memoria. Esto integrará la memoria del paquete para acelerar el rendimiento.
Intel llama a la combinación de procesadores tradicionales Xeon y Xeon Phi "arquitectura neoheterogénea". La arquitectura de hardware tiene múltiples clases de capacidades informáticas a las que se accede mediante un modelo de programación común. La compañía enfatiza que, dado que todo es x86, podría optimizar el desarrollo y la optimización de formas que serían más difíciles cuando se usa una combinación de CPU y aceleradores de GPU. Nvidia y las otras compañías que impulsan el cálculo de GPU no estarían de acuerdo con esa evaluación.
Intel también habló sobre el uso de la informática de alto rendimiento no solo para usos tradicionales como la investigación gubernamental y militar y aplicaciones comerciales de alta gama como la simulación de petróleo y gas, sino también para aplicaciones como big data. El objetivo es hacer que la supercomputación sea más convencional.
Vea la lista completa de supercomputadoras Top500 aquí.