Издательский дом ООО "Гейм Лэнд"СПЕЦВЫПУСК ЖУРНАЛА ХАКЕР #38, ЯНВАРЬ 2004 г.

Игрушки для взрослых

Берд Киви (kiwi@computerra.ru)

Спецвыпуск Xakep, номер #038, стр. 038-080-8


Затем исходные планы претерпели изменения, и появилась "облегченная" архитектура Blue Gene/L, опирающаяся не на сверхплотно упакованные 32-процессорные чипы новой конструкции, а на более традиционные микросхемы, похожие на IBM’овскую линию процессоров PowerPC. Каждый такой чип содержит два процессора (один для вычислений, другой для коммуникаций с остальными процессорами), а также встроенную оперативную память. По скорости передачи данных модифицированная архитектура "L" превосходит исходную архитектуру. Тысяча двухпроцессорных модулей Blue Gene/L монтируются в стойку размером примерно с холодильник, а 65 таких стоек будут занимать в общей сложности площадь размером с половину теннисного корта. Это существенно меньше, чем размеры находящегося в том же центре LLNL суперкомпьютера-чемпиона IBM ASCI White, занимающего одну из верхних строк в Top500 (рейтинг самых быстрых машин планеты), а в здании Ливерморского центра - площадь размером с две баскетбольных площадки. В целом же, по подсчетам IBM, в сравнении с ASCI White машина Blue Gene/L будет в 15 раз быстрее, в 15 раз более экономичной по потреблению энергии и более чем в 50 раз компактней по площади в пересчете на терафлопс производительности.

В параллельном экспериментальном проекте, получившем название Cyclops, ведутся работы по упаковке процессоров Blue Gene/L в единую микросхему. В один чип планируется упаковать до 64 процессоров, а система на основе этой разработки получила название Blue Gene/C. На основании тестовых результатов, сравнивающих производительность систем Blue Gene/L и Cyclops, будет принято решение о конструкции окончательной петафлопсной машины, ныне именуемой Blue Gene/P.

Как работает MD-GRAPE

Плата с MD-GRAPE подключается к обычному компьютеру через шину PCI. В принципе, хост-компьютер может быть каким угодно - от небольшого ПК до гигантского массива работающих в параллели рабочих станций. Через каждый заданный интервал времени хост-машина рассылает на платы MD-GRAPE информацию о последних состояниях взаимодействующих частиц. Платы же автоматически вычисляют и возвращают на хост значения всех сил, действующих на каждую из частиц. На основании этих данных хост-компьютер перемещает частицы, и цикл повторяется.

Если говорить конкретно об архитектуре Protein Explorer, то для этой системы хост-машиной будет служить простой кластер из 256 узлов-ПК. В каждый из этих ПК через шину PCI-X будет вставлена ускорительная плата расширения, несущая по 24 чипа MDGRAPE-3 с 20 конвейерами и широковещательной параллелизацией памяти (общая память для всех конвейеров). Пиковая производительность одного чипа MDGRAPE-3 составляет 165 гигафлопс. Таким образом, производительность одной PCI-X-платы достигает 3,96 терафлопс. Несложно подсчитать, что в целом "Белковый исследователь" будет состоять из 6144 спецпроцессоров с суммарной пиковой производительностью 1 петафлопс.

У тебя стоит персоналка, превосходящая по скорости суперкомпьютер 10-летней давности. Логично предположить, что разработанные сегодня суперкомпьютеры через несколько лет станут обычной настольной персоналкой.

Назад на стр. 038-080-7  Содержание  Вперед на стр. 038-080-9