Portada! AMD lanza las Instinct MI100 con 11.5 TFLOPS de potencia

Tbon

Simulation?
Miembro del Equipo
Fundador
ADMIN
Se incorporó
20 Enero 2004
Mensajes
13.680
En medio de la espera de los primeros reviews de las Radeon 6000 que estan por salir esta semana, AMD reveló lo que serán sus aceleradoras para servidores y el mundo de computo de alto rendimiento: las AMD Instinct MI100.

1605610264042.png

Las nuevas aceleradoras de AMD no serán solamente tarjetas de gaming remarcadas para servidores como pudiesemos estar pensando, dado que AMD ha dado detalles que indican que será una nueva arquitectura llamada CDNA, que desecha toda la circuiteria destinada a funciones fijas de una tarjeta de video normal (como los bloques para rasterizacion, el taselado, caches graficos, etc), destinando todos sus transistores a unidades de calculo programable.


1605611164728.png

Diagrama de arquitectura unidad de procesamiento MI100

Esta nueva arquitectura esta basada en GCN (no en RDNA como las tarjetas de gaming actuales) para aprovechar sus caracteristicas de computo general que le permiten manejar de mejor manera el procesamiento de numeros y traen consigo todo un rediseño que incluye una cache L2 de 8MB accesible por todo el chip y nuevas unidades dedicadas para computo matricial que permiten el calculo con inputs de distinto tipo con menos relecturas de registros, algo normal dada la recurrencia de datos en calculos de matrices.

Algunas de sus principales especificaciones:

1605610236562.png

Estas nuevas aceleradoras de AMD vendrian equipadas con 120 compute units, 32GB de memoria HBM2 directo en el package de la GPU con un ancho de bus de 4096bits y 3 links de interconeccion Infinity Fabric para el apilamiento en paralelo con mas aceleradoras, todo esto para lograr la friolera de 11.5 TFLOPS en calculos de doble precision (FP64).


1605610481992.png

Segun la misma AMD, sus nuevas aceleradoras logran superar en calculos matriciales de simple y doble precision a sus contrapartes de Nvidia, y si bien las Tesla A100 de Nvidia logran mejores valores de calculo en FP16, AMD al usar infinity fabric (que otorga comunicacion coherente de memoria entre GPUs) para comunicar sus array de tarjetas, permite un escalado en rendimiento mayor que las soluciones de su competencia que solo se basan en PCI-express. Esto permite poder destinar por ejemplo el poder de computo de multiples GPUs en una tarea especifica.

1605612433959.png


Finalmente AMD pone a disposicion todo un stack de software para la programacion y desarrollo de herramientas para utilizar esta nueva arquitectura: ROCm, no obstante, como ya es constumbre, este nuevo ecosistema de software es abierto por lo cual tambien puede ser aprovechado por plataformas basadas en tarjetas Nvidia dado que se busca que permita a los clientes utilizar un solo "paraguas" para todas sus soluciones.


1605612981714.png


Este nuevo lanzamiento de AMD no solo les permitirá competir en el mercado de alto rendimiento, sino que tambien consolida al fabricante como el principal exponente de computo heterogeneo del mercado y permitiendo entregar soluciones convergentes e integradas con sus actuales arquitecturas de procesadores EPYC2, por lo cual ya estarán disponibles estas soluciones por los principales integradores de la industria.

1605613027332.png

Fuente: AMD
 
Subir