Video: Las 5 Super Computadoras Más poderosas del mundo | ISO TOPS (Noviembre 2024)
En estos días, hay una serie de enfoques diferentes para la informática de alto rendimiento, los sistemas generalmente conocidos como supercomputadoras. La mayoría de estos sistemas utilizan una gran cantidad de procesadores Xeon, pero estamos comenzando a ver las nuevas máquinas más interesantes que funcionan con aceleradores, como Tesla de Nvidia o Intel Xeon Phi. Incluso se habla de que los sistemas masivos basados en ARM podrían ser efectivos en el futuro. Pero, ¿qué pasaría si pudieras probar todas estas arquitecturas en un solo lugar?
Ese es el desafío y la promesa de la nueva computadora MareNostrum 4, que se está preparando para su instalación en el Centro de Supercomputación de Barcelona. El nuevo diseño incluye un sistema principal para uso general basado en Xeons tradicionales, más tres nuevos grupos de tecnología emergentes, basados en IBM Power y Nvidia, Xeon Phi y computación basada en ARM. Mientras estaba en Barcelona para el Mobile World Congress, tuve la oportunidad de hablar con Sergi Girona, Director de Operaciones del BSC, quien explicó el razonamiento detrás de los cuatro grupos diferentes.
Girona dijo que la misión principal del centro es proporcionar servicios de supercomputación para investigadores españoles y otros investigadores europeos, además de la industria. Como parte de esta misión, el centro quiere tener al menos tres "grupos tecnológicos emergentes" para poder probar diferentes alternativas.
Para el grupo de cómputo general, Girona dice que el centro eligió un diseño tradicional de Xeon porque era más fácil migrar aplicaciones que se ejecutan en el MareNostrum 3 actual, programado para ser desconectado la próxima semana. El diseño también tenía que adaptarse al espacio existente, dentro de una capilla. (Visité el centro el año pasado y la supercomputadora actual hace un año).
El nuevo diseño, que será construido por Lenovo, se basará en el nuevo Xeon v5 (Skylake), con 3, 456 nodos, cada uno con dos sockets, y cada chip contendrá 24 núcleos cada uno, para un rendimiento máximo teórico total de 11.14 petaflops por segundo. La mayoría de los núcleos tendrán 2GB de memoria, pero el 6 por ciento tendrá 8GB, para un total de 331.7TB de RAM. Cada nodo tendrá un SSD de 240GB, aunque eventualmente algunos tendrán memoria 3D XPoint, cuando esté disponible. Los nodos deben conectarse a través de la interconexión Omni-Path de Intel y Ethernet de 10 GB. El sistema también tendrá seis racks de almacenamiento de IBM, con 15 petabytes de almacenamiento, que incluyen una combinación de unidades de disco duro y flash. En general, el diseño ocupará 62 bastidores: 48 para computación, 6 para almacenamiento, 6 para redes y 2 para administración. Ocupará 120 metros cuadrados (creando un ambiente muy denso) y consumirá 1.3 megavatios de potencia, en comparación con el megavatio extraído por el diseño anterior. Se espera que la operación comience el 1 de julio.
Una cosa que encontré interesante aquí es cuán claramente el paso a la nueva generación demuestra el progreso de la tecnología. La generación anterior tuvo un rendimiento máximo de aproximadamente 1 petaflop, y este sistema debería ser más de 10 veces más rápido, mientras que usa solo un 30 por ciento más de energía. A modo de comparación, la supercomputadora MareNostrum original, instalada en 2004, tuvo un rendimiento máximo de 42 teraflops y utilizó 640 kilovatios de potencia. (Los detalles de las mejoras de rendimiento en cuatro generaciones de MareNostrum se encuentran en el cuadro anterior). Girona dice que esto significa que lo que hubiera llevado un año en el MareNostrum 1 se puede hacer en un solo día en el nuevo sistema. Muy impresionante.
Para la tecnología emergente, el sitio tendrá tres nuevos grupos. Uno consistirá en procesadores IBM Power 9 y GPU Nvidia, diseñados para tener una capacidad máxima de procesamiento de más de 1.5 Petaflop / s. IBM construirá este clúster e implica el mismo tipo de diseño que se implementará en las supercomputadoras Summit y Sierra, que el Departamento de Energía de EE. UU. Encargó a los Laboratorios Nacionales Oak Ridge y Lawrence Livermore como parte de su Colaboración CORAL en Oak Ridge, Argonne y Lawrence Livermore laboratorios nacionales.
El segundo clúster estará compuesto por procesadores Intel Xeon Phi, con Lenovo construyendo un sistema que utiliza la próxima versión de Knights Hill (KNH) y OmniPath, con una capacidad máxima de procesamiento de más de 0.5 Petaflop / s. Esto también imita el programa estadounidense CORAL, y utiliza los mismos procesadores que estarán dentro de la supercomputadora Aurora, encargada por el Departamento de Energía de los Estados Unidos para el Laboratorio Nacional Argonne.
Finalmente, se formará un tercer grupo de procesadores ARMv8 de 64 bits que Fujitsu proporcionará en una máquina prototipo, que está diseñada para usar los mismos procesadores que Fujitsu está desarrollando para un nuevo sistema japonés para suplantar la supercomputadora K actual. Esto también debería ofrecer más de 0.5 Petaflop / s de rendimiento máximo. El momento exacto para el comienzo de las operaciones en los grupos emergentes aún no se ha revelado, dijo Girona.
En general, el sistema costará $ 34 millones, en un contrato ganado por IBM y financiado por el gobierno español. Una de las principales razones para tener los cuatro tipos de computación en el sitio es la investigación, dijo Girona. El centro, que emplea a 450 personas en total, tiene 160 investigadores con un enfoque en informática, que incluye arquitectura y herramientas. En particular, como miembro de PRACE (Partnership for Advanced Computing in Europe), BSC está tratando de centrarse en la optimización del rendimiento líder y la computación paralela.
Girona dijo que BSC quiere influir en el desarrollo de nuevas tecnologías, y está planeando usar la nueva máquina para analizar lo que sucederá en el futuro, en particular para asegurarse de que el software esté listo para cualquier arquitectura que la próxima máquina pueda llegar. unos 3 años - habrán. BSC ha trabajado durante mucho tiempo en herramientas para arquitecturas emergentes, señaló.
Otro tema que los investigadores están considerando es si valdría la pena desarrollar un procesador europeo para TI, probablemente basado en la arquitectura ARM.
Barcelona no tendrá la supercomputadora más rápida del mundo; ese récord lo tienen actualmente los chinos, y los estadounidenses y los japoneses intentan ponerse al día. Pero MareNostrum 4 será el más diverso y potencialmente el más interesante.
Michael J. Miller es director de información de Ziff Brothers Investments, una empresa de inversión privada. Miller, quien fue editor en jefe de PC Magazine desde 1991 hasta 2005, es el autor de este blog para PCMag.com para compartir sus opiniones sobre productos relacionados con PC. No se ofrece asesoramiento de inversión en este blog. Todos los deberes son denegados. Miller trabaja por separado para una empresa de inversión privada que puede invertir en cualquier momento en compañías cuyos productos se analizan en este blog, y no se divulgarán las transacciones de valores.