Швидше за все, США повернуть собі лідерство у рейтингу суперкомп'ютерів TOP500. 8 червня 2018 року оголошено про запуск «найпотужнішого у світі» суперкомп'ютера Summit потужністю 200 петафлоп. І якщо Китай не піднесе жодних сюрпризів, то у червневому TOP500 відбудеться зміна лідера. Заявлених 200+ петафлопс із лишком вистачить, щоб обігнати за результатом тесту Linpack нинішнього чемпіона Sunway TaihuLight (93 PFLOPS).


Суперкомп'ютер Summit важить 340 тонн і займає кімнату площею 860 кв. На його охолодження витрачається 15 тонн води за хвилину. Фото: Національна лабораторія Ок-Рідж

Суперкомп'ютер Summit складається з 4608 вузлів, на кожному з яких встановлено по два 22-ядерні процесори IBM Power9 і шість графічних процесорів Nvidia Tesla V100. Вузли з'єднані мережею Mellanox dual-rail EDR InfiniBand із пропускною здатністю 200 Гбіт/с на кожен сервер. Для IBM це презентація серверів Power9-GPU AC922, яку можна пропонувати іншим замовникам.

При повному обладнанні всіх вузлів одні тільки графічні процесори забезпечать пікову продуктивність 215 петафлоп з подвійною точністю. Крім того, кожен V100 видає ще 125 терафлопс зі змішаною точністю – це основний тип операцій тензорного ядра V100. Таким чином, у додатках глибокого навчання пікова продуктивність може становити близько 125×27648 = 3,46 ексафлопс. Якщо реально, то близько 3,3 ексафлопс, вважають експерти.

Це не просто теоретичні розрахунки. За словами директора Національної лабораторії Ок-Рідж Томаса Захарія (Thomas Zacharia), ще до завершення будівництва системи дослідники запустили на тензорних ядрах GPU обчислення за порівнянні геномів —та зафіксували продуктивність 1,88 ексафлопс. Додаток обробляв геноми у пошуках зразків, що відповідають певним умовам. Це перший випадок в історії комп'ютерної техніки, коли де-факто подолали бар'єр в 1 ексафлопс, тобто 1018операцій з плаваючою комою на секунду. У серверній кімнаті цього монстра такий шум, що там неможливо працювати без навушників (відео).


Вузол Summit. Для суперкомп'ютера в кімнаті прокладено близько 300 км оптоволоконного кабелю. Фото: Національна лабораторія Ок-Рідж (США)

Зрозуміло, крім глибокого навчання Summit підтримує обчислення у стандартному наборі додатків, який цікавить Міністерство енергетики США, зокрема обчислення, пов'язані з термоядерною енергією, альтернативною енергетикою, матеріалознавством, кліматичним моделюванням, обчислювальною хімією та космологією. У той же час Summit залишається відкритою системою, тому клієнти будуть запускати на ньому всі види розрахунків, які забажають, навіть зовсім не пов'язані з енергетикою. Передбачається, що Summit будуть використовуватись для додатків у сфері охорони здоров'я в таких областях, як пошук нових ліків. Як сказав на прес-конференції Томас Захарія, їхній дослідницький центр має стати чимось на кшталт CERN для медичного дата-майнінгу та аналітики.

Суперкомп'ютер Summit. Фото: Національна лабораторія Ок-Рідж

Коли у 2014 році укладався контракт із IBM на будівництво цього суперкомп'ютера, до його складу включили GPU. У той час у Міністерства енергетики були дуже невиразні уявлення, що робити з можливостями глибокого навчання, але компанія Nvidia вирішила впровадити в V100 тензорні ядра — і в результаті Summit раптово перетворився на монстра додатків ІІ. Тож можна припустити, що систему навантажать безліччю передових досліджень ІІ, крім її основним обов'язкам. Поки що проекти для Summit відбирають за заявками, але в 2019 році система стане більш доступною за програмою Innovative and Novel Computational Impact on Theory and Experiment (INCITE).


Багатоядерний мікропроцесор китайського суперкомп'ютера Sunway TaihuLight. До 8 червня 2018 року цей суперкомп'ютер вважався найпотужнішим у світі

Після запуску Summit влада, напевно, ухвалить рішення про виведення з експлуатації його попередника, суперкомп'ютера Titan, який у момент свого запуску в 2012 році був визнаний найпотужнішим у світі і досі залишається найшвидшим суперкомп'ютером у США. Але зараз підтримувати його роботу мало сенсу, тому що він у 8 разів поступається за швидкістю Summit, при цьому поступається енергоефективністю в 5 разів.

 

У Titan встановлені графічні процесори K20X, у яких продуктивність у обчисленнях з одинарною точністю для машинного навчання обмежена скромними чотирма терафлопс на пристрій. Тим більше, всі програми для Titan легко перенести на Summit.

Джерело: https://habr.com/post/413769/