Trabajo Top 500
Trabajo Top 500
Trabajo Top 500
Introducción:
Se conoce como Top500 a la lista que clasifica a los 500 computadores con mayor
rendimiento. Esta lista se empezó a realizar en 1993 y se publica una nueva lista cada
seis meses (en junio y en noviembre), surgió dado que se necesitaban estadísticas
comparables entre computadores. Esta lista está realizada por Erich Strohmaier de
NERSC/Lawrence Berkeley National Laboratory, Jack Dongarra de la universidad de
Tennessee, Horst Simon de NERSC/Lawrence Berkeley National Laboratory, Martin
Meuer de Prometeus y desde 1993 hasta su muerte en 2014 por Hans Meuer de la
universidad de Mannheim.
Para poder realizar esta lista se les aplica el benchmark Linpack a los super-
computadores, aportado al proyecto por Jack Dongarra. Este benchmark realiza un gran
uso de las operaciones de coma flotante y al ser principalmente cálculos con matrices,
es un test que se puede paralelizar para poder medir la capacidad de multiprocesador.
A este benchmark se le conoce de manera más específica como HPLinpack (Linpack's
Highly Parallel Computing benchmark). De este benchmark se sacan los GFLOPS para el
problema más largo que se ejecuta en el computador.
En este trabajo, se van a ver los 10 primeros computadores de la lista del top500 de
noviembre de 2016.
Top 10 computadores:
1- Sunway TaihuLight:
El computador que se encuentra como primero de la lista es el Sunway TaihuLight , que esta
creado por la NRCPC (National Research Center of Parallel Computer Engineering &
Technology) y se encuentra en el centro nacional de supercomputación de Wuxi (China).
Usado para análisis de Big Data, para modelado de terrenos y pronósticos climáticos.
Este computador tiene como máxima puntuación usando el benchmark Linpack, una capacidad
de cálculo de 93.014,6 TFLOPS y 125.436 TFLOPS como rendimiento máximo teórico, con un
tamaño máximo para el problema de 12.288.000.
Este computador tiene 40.960 procesadores SW6010. Este procesador tiene cuatro CPEs
(Compute-Procesing Elements) de 64 bits, cada CPE es capaz de realizar ocho instrucciones en
coma flotante por cada ciclo. Cada uno de estos CPEs tiene un nivel de cache L1 de 16KB para
instrucciones y 64KB de SPM(Scratch Pad Memory), que es una memoria de alta velocidad
para almacenamiento temporal de datos. Cada uno de los CPEs tiene un núcleo auxiliar de 64
bitsdenominado MPE, que sirve para la administración del sistema, teniendo dos niveles de
caché el primero L1 con 32 KB para instrucciones y otros 32 para datos y un nivel L2 con 256
KB para cualquier tipo de propósito. Esto hace que por cada chip de procesador tengamos 260
cores y una total de 10.649.600 cores como total en el computador. Además, cada núcleo del
CPE tiene un pipeline que le permite ejecutar 8 FLOPS por ciclo y cada núcleo del MPE tiene
dos pipelines que trabajan en paralelo, haciendo que cada pipeline ejecute 8 FLOPS por ciclo
(16 FLOPS para la MPE).
Cada uno de los CPE/MPE tiene 8GB de memoria DDR3, haciendo que cada chip procesador
tenga 32GB de memoria principal, dejando al computador con 1.310.720 GB de memoria total.
Por último, este computador utiliza un sistema operativo propio “Raise OS 2.0.5”, que está
basado en Linux, con sus personalizaciones propias para permitir una mayor paralelización del
código. Además incluye compiladores para C/C++ o Fortran.
2- Tianhe-2
El anterior computador más rápido del mundo, hasta la llegada del Sunway TaihuLight.Este
computador fue desarrollado por la NUDT (Universidad de Tecnología de defensa de China) y
por Inspur, una multinacional china. Se encuentra en el Centro Nacional de Supercomputación
de Guangzho (China), y su uso principal es el de investigación en Big Data y en computación en
la nube.
Este computador tiene como máxima puntuación con el benchmark LinPack, una capacidad de
cálculo de 33.862.7 TFLOPS y con un máximo teórico de 54.902,4 TFLOPS, para un problema de
tamaño 9.960.000.
Este computador está formado por 16.000 nodos, en los cuales se encuentran dos
procesadores Intel Xeon IvyBridge E5-2692, cada uno de estos procesadores tiene 12 núcleos y
puede ejecutar 8FLOPS por ciclo (2,2GHz) y tres procesadores Intel Xeon Phi 31S1P, cada uno
con 57 núcleos, cada núcleo tiene 4 hilos de ejecución y puede realizar 16 FLOPS por ciclo (1,1
GHz) y por núcleo. Dando como total 3.120.000 núcleos para la computadora.
Cada uno de los nodos tiene 64GB de memoria total, además de 8GB para cada uno de los
procesadores Intel XeonPhi, haciendo que por cada nodo tengamos 88GB de memoria.
Haciendo que como total tengamos 1.024.000 GB de memoria para todo el computador.
El Tianhe-2 usa es sistema operativo Kylin Linux, que fue desarrollado por la Universidad de
Tecnología de defensa de China, este sistema operativo soporta diferentes múltiples
procesadores y diferentes arquitecturas de computadores. Además incluye compiladores para
Fortran, C/C++ y Java.
3- Titan
Su nombre es Titan - Cray XK7 , Opteron 6274 16C 2.200GHz, Cray Gemini interconnect,
NVIDIA K20x
Su empresa es Cray Inc, es una empresa de EEUU.
Tiene 560,640 cores.
Obtuvo un rendimiento basado en el Benchmark LINPACK de 17,590 TFLOPS, aunque tendría
un rendimiento teórico de 27,112.5 TFLOPS.
Tiene 710,144 GB de memoria.
Tiene un procesador Opteron 6274 16C 2.2 GHz. Este procesador es de 16 cores, es de 64bits,
tiene una velocidad de reloj de 2.2GHz, tiene AMD Opteron 6274 y memoria cache de L3.El
tamaño resultante de la memoria RAM es de más de 710 TiB, con 10 PB de almacenamiento y
cuenta con más de 10.000 discos rígidos de 1 TB a 7200 rpm
Tiene un sistema operativo basado en Unix desarrollado por Cray, su empresa. Este sistema
operativo lo utiliza Cray Inc para sus supercomputadoras. El nombre de este sistema operativo
es Cray Linux Environment.
4- Sequoia
5- Cori
6- Oakforest-PACS
7- K computer
8- Piz Daint
El computador XC50 es un superordenador diseñado por Cray inc, el cual dispone de
uprocesadores Xeon E5-2690v3 12C de 2,6 GHz (12 núcleos y 64GB de RAM por cada uno)
formando un total de 206.720 núcleos de los cuales se obtiene un rendimiento real de
9.779(Rmax) flops y un rendimiento teórico(Rpeak) de 15988 flops con una potencia
desarrollada de 1.312 Kw.
Usa un sistema de interconexión y enrutamiento Aries que es un dispositivo sistema en chip
que comprende 4 NICs y que proporciona la conectividad para esos 4 nodos.
cada uno de los 4 NICs proporciona 16 hosts PCI y cada nodo contiene un par de procesadores
Intel Xeon con 16 núcleos cada uno y 8 DDR3.
la memoria tiene una capacidad de 64 o 128 GB por nodo.
9 - Mira
10- Trinity
Su nombre es Trinity - Cray XC40, Xeon E5-2698v3 16C 2.3GHz, Aries interconnect.
Su empresa es Cray Inc que es una empresa estadounidense.
Tiene 301,056 cores.
Obtuvo un rendimiento basado en el Benchmark LINDPACK de 8,100.9 TFlops pero su
rendimiento teórico es de 11,078.9 TFlops.
Utiliza procesadores Xeon E5-2698v3 16C 2.3GHz. Este procesador es de la empresa Intel,
tiene 16 cores y 3.6GHz de frecuencia de reloj y tiene una memoria cache de 40MB.
Utiliza el sistema operativo de entorno Unix creado por la empresa Cray Inc. Su nombre es
Cray Linux Environment.
Conclusiones:
Después de las comparaciones podemos apreciar que un mayor número de núcleos no implica
un mayor rendimiento , esto se debe a que otros componentes también toman parte en el
transcurso de la ejecución del benchmark, como por ejemplo la memoria o la frecuencia de
reloj.
También podemos apreciar cómo los rendimientos reales están bastante distantes del
rendimiento teórico máximo, esto puede ser debido al conocido fenómeno "cuello de botella"
que provoca la ralentización de algunos componentes, programas en segundo plano
Reparto de trabajo:
Miguel Fernández López- UO246291: Cori, Oakforest-PACS e Introducción.
Pablo González Martínez – UO245699: Titan, Sequoia y Trinity
Kevin Murias García - UO240228: Computador K, Piz DAint y conclusiones.
Fernando Palazuelo Ginzo – UO244588: Introducción,resumen, Sunway TaihuLight, Tianhe-2 y
Mira.
Referencias:
https://www.top500.org/project/authors/
https://www.top500.org/timeline/
https://www.top500.org/lists/2016/11/
https://en.wikipedia.org/wiki/TOP500
https://es.wikipedia.org/wiki/TOP500
https://www.top500.org/project/linpack/
https://es.wikipedia.org/wiki/Linpack
https://en.wikipedia.org/wiki/LINPACK_benchmarks#HPLinpack
https://es.wikipedia.org/wiki/Unidad_de_coma_flotante
https://es.wikipedia.org/wiki/Operaciones_de_coma_flotante_por_segundo
http://www.nsccwx.cn/
http://www.nsccwx.cn/wxcyw/soft1.php?word=soft&i=46
https://es.wikipedia.org/wiki/Sunway_TaihuLight
http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf
https://es.wikipedia.org/wiki/Sunway_TaihuLight#cite_note-dongarra2016-4
https://en.wikipedia.org/wiki/Scratchpad_memory
http://www.netlib.org/utk/people/JackDongarra/PAPERS/tianhe-2-dongarra-report.pdf
https://es.wikipedia.org/wiki/Tianhe-2
https://en.wikipedia.org/wiki/National_Supercomputer_Center_in_Guangzhou
https://es.wikipedia.org/wiki/Kylin
https://en.wikipedia.org/wiki/Tianhe-2
http://en.nscc-gz.cn/
https://en.wikipedia.org/wiki/IBM_Mira
http://www.anl.gov/
http://www.alcf.anl.gov/user-guides/mira-cetus-vesta
https://en.wikipedia.org/wiki/Blue_Gene#Blue_Gene.2FQ
https://www.alcf.anl.gov/mira
http://cyberpunks.es/ordenadores-cyberpunk/Mira-3.html#.WExb_-bhCUk
https://en.wikipedia.org/wiki/CNK_operating_system
http://jcahpc.jp/eng/ofp_intro.html
http://www.nersc.gov/users/computational-systems/cori/
https://www.top500.org/system/178924
https://www.top500.org/system/178932
https://www.top500.org/system/177824
http://www.cray.com/sites/default/files/resources/CrayXCNetwork.pdf
https://es.wikipedia.org/wiki/Computadora_K
https://en.wikipedia.org/wiki/K_computer