В 2010 г. за полгода (с июня по ноябрь) в списке Top500 [1] добавилось 195 новых суперкомпьютеров. Лидером в мире суперкомпьютеров в ноябре 2010 г. стал китайский компьютер Tianhe-1A производительностью 2.57 petaflop/s. На втором месте - лидер предыдущего списка Top500 Cray XT5 “Jaguar” (США) с 1.75 petaflop/s. Третье место занимает опять же китайский суперкомпьютер Nebulae (1.27 petaflop/s). В первой десятке (Top10) находятся пять американских, два китайских и по одному компьютеру из Японии, Франции и Германии, причем японский суперкомпьютер Tsubame 2.0 занимает четвертое место. Из 500 компьютеров 274 находится в США, 124 в Европе, 84 - в Азии (в Китае 41, в Японии 26), 11 - в России. В список не вошли компьютеры с производительностью менее 31.1 teraflop/s. На 17-м месте - российский суперкомпьютер Ломоносов производительностью 350 teraflop/s на процессорах Intel EM64T Xeon X55xx (Nehalem-EP) 2930 MHz (11.72 GFlops), с памятью 54 Тбайт.
Среди вендоров лидером является IBM - 200 суперкомпьютеров, далее следуют Hewlett-Packard - 159 и Cray Inc. - 29 систем. В России система Ломоносов создана в компании T-Platforms (рис. 1).
Рис. 1.   Суперкомпьютер Ломоносов
.
Преобладают системы с кластерной архитектурой (83%) и с архитектурой MPP (16%). В качестве коммутирующей среды (Interconnect Family) используются Gigabit Ethernet (45,6% систем) и Infiniband (42,6%). Операционная система или Linux (91,8%), или Windows (5%).
79.6% систем выполнены на процессорах Intel (преобладают процессоры Xeon E55xx (Nehalem-EP), Xeon E54xx (Harpertown) и Xeon X56xx (Westmere-EP)), 11.4% - AMD Opteron, 8% - IBM Power. Процессоры с шестью и более ядрами имеются в 95 суперкомпьютерах, большинство построено на двухядерных СБИС. В китайских и японском суперкомпьюерах для увеличения производительности использованы графические процессоры NVIDIA. Число процессоров в Tianhe-1A равно 186368, в Ломоносов - 35360, большинство систем имеют число процессоров в диапазоне от 4 до 8 тысяч.
Средняя потребляемая мощность по Top500 - 447 квт (195 Mflops/W), а по Top10 - 3.2 Mвт.
В июне 2011 г. список Top500 воглавил японский суперкомпьютер SPARC64 компании Fujitsu с производительнссостью 8,16 Рflops. Российский суперкомпьютер Ломоносов повысил быстродействие до 674 Tflops и поднялся на 13 место.
Для сравнения и иллюстрации прогресса в области скперкомпьютеров приведем данные по Top500 трехлетней давности. В список Top500 (ноябрь 2007 г.) были включены суперкомпьютеры с производительностью, не менее 5.9 TFlop/s. Общая производительность всех 500 компьютеров составляла 6.97 PFlop/s. 100-й номер в списке имел 9.29 TFlop/s. Семь позиций в списке занимали компьютеры, установленные в России, наиболее производительный среди них имел 33 Tflop/s и находился на 33 месте.
70.8% систем были построены на процессорах Intel, 15.6% — на AMD Opteron, 12.2% — на IBM Power.Наблюдалась тенденция к увеличению доли Intel, среди них — Intel Clovertown quad core chips. В основном использовались двухядерные процессоры.
Кластерами являлись 406 систем из 500. Внутренняя коммутация реализована на Gigabit Ethernet в 270 системах, Infiniband — в 121 системе.
В качестве примера рассмотрим конструкцию лидера списка Top500 от ноября 2007 г. суперкомпьютера Blue Gene/L [2].
Базовым компонентом суперкомпьютера Blue Gene/L является так называемая "вычислительная карта" (compute card), которая состоит из двух вычислительных узлов, где каждый узел содержит 2 процессора PowerPC 440. 16 вычислительных карт группируются в модульную (или узловую) карту, которая, таким образом, содержит уже 64 процессора. В свою очередь, 16 модульных карт устанавливаются на объединительной панели (midplane), и две таких панели монтируются в серверную стойку (cabinet), которая содержит в итоге 1024 узла с общим количеством процессоров 2048.
Процессор PowerPC 440 способен выполнять за такт 4 операции с плавающей запятой, что для заданной частоты соответствует пиковой производительности в 1,4 TFlop/s на одну объединительную панель (midplane), если считать, что на каждом узле установлено по одному процессору. Второй процессор на узле, идентичный первому, призван выполнять телекоммуникационные функции, то есть, он предназначен, преимущественно, для осуществления связи с другими процессорами суперкомпьютера. Кроме того, конструкцией суперкомпьютера, предусмотрена установка некоторого количества двухпроцессорных узлов, которые занимаются исключительно операциями ввода/вывода.
Узлы суперкомпьютера связаны между собой пятью сетями:
Энергопотребление суперкомпьютера Blue Gene/L составляет порядка 1,6 мегаватт.
Список литературы
1. A Steen, J. Dongarra. Overview of Recent Supercomputers. - http://www.top500.org/resources/orsc
2. Ю.П. Сердюк. Кластерные вычисления // Интернет университет информационных технологий. - http://www.intuit.ru/department/calculate/clusterexec/1/2.html