Hogar Con visión de futuro La supercomputadora clasifica en gran medida sin cambios, pero siéntate bien

La supercomputadora clasifica en gran medida sin cambios, pero siéntate bien

Video: La supercomputadora checa con la potencia de trecemil portátiles (Noviembre 2024)

Video: La supercomputadora checa con la potencia de trecemil portátiles (Noviembre 2024)
Anonim

La lista más reciente de las supercomputadoras más rápidas del mundo no cambió mucho, pero el show anual de Supercomputación (SC14) presentó mucha discusión sobre los nuevos sistemas en la lista, así como varios anuncios informáticos de alto rendimiento, como los nuevos aceleradores de Intel y Nvidia

La supercomputadora Tianhe-2 de China, que utiliza CPU Intel Xeon y aceleradores Xeon Phi, se mantuvo en primer lugar en la lista Top500 con un rendimiento máximo de 54.9 petaflops (miles de millones de operaciones de punto flotante por segundo). Este año, de hecho, los nueve sistemas principales fueron idénticos a la nueva incorporación en el décimo puesto: una máquina del sistema del gobierno de EE. UU. No especificada que es una Cray CS-Storm con CPU Intel Xeon E5-2660 v2 y GPU Nvidia K40, conectados a través de Infiniband

Más abajo en la lista, había 78 nuevos sistemas, aunque incluso este es un nuevo mínimo histórico. Y, en general, parece que estamos viendo una desaceleración en la tasa de crecimiento de la potencia agregada de los 500 sistemas.

La clasificación de estos sistemas se basa en el punto de referencia LINPACK, aunque ahora hay una serie de esfuerzos en torno a la creación de nuevos puntos de referencia destinados a diferentes tipos de informática. Me pareció interesante que, en un discurso en el programa, Horst Simon, editor de la lista Top500, dijo que a pesar del objetivo de llegar a una computadora a gran escala (1 exaflops por segundo (aproximadamente 1, 000 petaflops)) para 2020, cree que probablemente llévenos hasta el final de 2024. En parte, esto se debe a que necesitaremos más técnicas de ahorro de energía, como la fotónica de silicio y la integración y empaque 3D, para mantener la potencia necesaria para un sistema de exascale hasta 20 megavatios. Estos son grandes sistemas.

A pesar de la falta de grandes cambios en la parte superior, escuchamos un par de nuevos anuncios, en particular los de Intel y Nvidia, que podrían señalar el camino hacia máquinas más rápidas.

Nvidia, cuyas GPU y lenguaje de programación CUDA realmente comenzaron el movimiento hacia aceleradores y coprocesadores en informática de alto rendimiento, estuvo en todo el show con muchos sistemas. Actualmente ofrece el acelerador K40 y en la feria anunció la próxima versión, el Tesla K80, que utiliza un enfoque de doble GPU para ofrecer lo que la firma dice que es un rendimiento casi dos veces mayor y duplica el ancho de banda de memoria de su predecesor.

Nvidia dice que el K80 ofrece 4, 992 núcleos CUDA y 24 megabytes de RAM y tiene una capacidad máxima de 2.91 teraflops por placa. Es interesante que el K80 esté disponible ahora y que muchos de los fabricantes de sistemas ya estén ofreciendo sistemas con la placa. Por ejemplo, Dell mostró sus nuevos servidores PowerEdge C4130, que le permiten instalar hasta cuatro placas aceleradoras Nvidia (o aceleradores Intel Xeon Phi) en un servidor de 1U, con la versión K80 que ofrece hasta 7.2 teraflops en cada caja. Eso es solo una gran cantidad de potencia informática en un rack (aunque una que usaría mucha energía y necesitaría mucha refrigeración).

Mientras tanto, Intel anunció que la próxima versión de su chip Xeon Phi, una versión conocida como Knight's Landing para la cual los primeros sistemas comerciales deberían comenzar a enviarse el próximo año, ahora tiene más de 50 clientes que planean usar la nueva versión de procesador de la pieza (donde Xeon Phi actúa como el procesador del sistema) en las nuevas supercomputadoras. Muchos más sistemas están utilizando la versión de tarjeta PCIe del coprocesador del producto.

Entre los clientes de Knights Landing se encuentran la supercomputadora Trinity, un esfuerzo conjunto entre Los Alamos y Sandia National Laboratories, y la supercomputadora Cori, anunciada por el Centro Nacional de Investigación Científica (NERSC) del Departamento de Energía de los Estados Unidos (DOE). Se supone que Knight's Landing ofrecerá aproximadamente 3 teraflops de rendimiento e integrará la tecnología Omni-Path Fabric basada en fotónica de silicio de Intel, que según la compañía ofrecería una velocidad de línea de 100 Gbps y una latencia de la tela del interruptor hasta un 56 por ciento más baja que las alternativas InfiniBand. (Tenga en cuenta que los proveedores de InfiniBand ahora también están hablando de nuevas versiones).

Intel dijo que el seguimiento, conocido como Knight's Hill, se construirá utilizando la tecnología de proceso de 10 nm de Intel y utilizará la próxima generación del tejido Omni-Path. Seguirá a Knight's Landing, pero el momento exacto no fue revelado.

No debe quedar fuera de la ecuación AMD, que anunció y mostró su tarjeta de CPU única FirePro S9150, que según dice puede ofrecer 2, 53 teraflops de rendimiento. Este sistema, que se programa utilizando OpenCL, ya está disponible.

De hecho, una nueva supercomputadora llamada L-CSC del GSI Helmholtz Center, basada en las GPU S9150 y las CPU Intel Xeon 2690v2 de 10 núcleos encabezó la nueva versión de la lista Green500, que enumera las supercomputadoras en orden de potencia de procesamiento por vatio. Esto marcó la primera vez que un sistema pudo superar los 5 gigaflops / vatio (miles de millones de operaciones por segundo por vatio). Tenga en cuenta que en esa lista, el segundo sistema fue el Suiren, impulsado por aceleradores de muchos núcleos PEZY-SC y CPU Xeon; mientras que el resto de los 10 principales usan GPU Nvidia Tesla, que muestran el rango de dichos sistemas.

También hay otras opciones más inusuales. Micron está mostrando su chip Automata, esencialmente un chip de propósito especial diseñado para la coincidencia de patrones, para usar en cosas como la seguridad de la red y la búsqueda genómica. Esto se está desarrollando en una placa PCIe 3 con 32 chips y se lanzará en el primer trimestre de 2015, inicialmente en volúmenes bajos. (La compañía también está detrás de su Cubo de memoria híbrido para la memoria de próxima generación para tales sistemas). IBM tiene su procesador TrueNorth, que espera señala el camino hacia una "informática similar al cerebro". NEC está trabajando en la próxima generación de su procesador vectorial SX-ACE, que según dice es más fácil de programar que las GPU. Y, por supuesto, ARM también está tratando de ingresar al mercado de servidores con X-Gene1 de Applied Micro como procesador que se conecta a varias tarjetas aceleradoras.

Varios vendedores mostraban nuevos sistemas. Además del sistema Dell que mencioné anteriormente, Lenovo mostró un sistema de doble procesador refrigerado por agua basado en un procesador Intel Xeon E5-2798A personalizado (con 16 núcleos que funcionan hasta 3.2GHz), que según dice ofrece 1.083 teraflops. Y dijo que el procesador Knights Landing Xeon Phi del próximo año permitirá un sistema "peta-cube" que ofrece más de un petaflop en solo dos bastidores estándar de 42U.

One Stop Servers mostró un acelerador de cómputo de alta densidad, que utiliza PCIe Gen3 para admitir hasta 16 placas de acelerador de alta gama de uno o varios servidores, y la compañía dijo que proporciona hasta 89.6 teraflops con placas Tesla K80. Esto puede funcionar con el procesador Power8 de IBM. Huawei mostró la disponibilidad en Estados Unidos de su servidor de centro de datos X6800 y una versión refrigerada por líquido de su servidor blade FusionServer 9000.

Para vincular sistemas, Obsidian Technologies lanzó su iniciativa InfiniCortex, diseñada para tomar una conexión InfiniBand de 100 Gigabits a largas distancias. La compañía anunció el apoyo de la Agencia de Ciencia, Tecnología e Investigación de Singapur (A * STAR). Y Mellanox mostró 100 Gigabit Infiniband trabajando más de 100 metros a través de fibra y 8 metros a través de cobre.

Para crear las supercomputadoras más grandes, las organizaciones suelen recurrir a compañías como IBM y Cray para que agrupen los sistemas, aunque a menudo lleva años construirlos. El mayor anuncio de Cray de este tipo en la feria fue un sistema de $ 80 millones conocido como Shaheen II en la Universidad de Ciencia y Tecnología King Abdullah en Arabia Saudita para un Cray XC40, que incluye un dispositivo de análisis gráfico Urika-GD.

Y, por supuesto, justo antes del espectáculo, el DOE le otorgó a IBM (y a los proveedores de componentes Nvidia y Mellanox) un gran contrato para lo que serían las dos supercomputadoras más grandes del país, cada una con más de 100 petaflops.

Nota del editor: esta publicación se actualizó el 26/11. El Tianhe-2 tiene un rendimiento máximo de 54.9 petaflops, no teraflops.

La supercomputadora clasifica en gran medida sin cambios, pero siéntate bien