Найзнаковішою подією стала презентація нових серверних процесорів Intel Xeon Scalable, а також пов’язаної з ними платформи Purley. І сьогодні ми розповімо про те, як ці новинки працюють з пам’яттю, чим відрізняються від своїх попередників і які модулі краще з ними використовувати.

За даними IDC, Intel належить понад 90% ринку серверних процесорів, але цього року AMD представила нові потужні процесори EPYC. Лідери не залишилися осторонь і влітку показали всьому світу платформу Purley, яка відрізняється від попередніх рішень, а також від продуктів конкурентів новою схемою роботи з пам’яттю.
Мабуть, найважливішою особливістю Purley є саме архітектура. Виробник одночасно представив процесори Intel Xeon Scalable з вбудованими контролерами та спеціальними оптимізаторами, а також SSD-компоненти Intel Optane і чипсети Intel Xeon Phi. За умови встановлення високопродуктивної пам’яті DRAM усе це працюватиме з максимальною швидкістю, відкриваючи нові можливості для «хмарних обчислень, віртуалізації, телекомунікаційних мереж нового покоління (5G), машинного навчання та штучного інтелекту».
Самі процесори Intel Xeon Scalable відрізняються значно вищою продуктивністю, ніж попереднє покоління. За даними Intel, приріст становить близько 65%. Це стосується топових процесорів Intel Xeon Scalable Platinum, які можуть містити до 28 ядер на кристалі (існують версії з меншою кількістю), що працюють на частоті до 2,4 ГГц. Завдяки новим технологіям передавання даних між процесорами та обчислювальними ядрами новинки дозволяють виконувати погано розпаралелювані задачі, коли неможливо заздалегідь передбачити, яка інформація знадобиться наступної миті. Давайте розберемося, як нова платформа працює з даними.

Нова ієрархія пам’яті
Окрім наявності 6-канального контролера пам’яті DDR4, процесори Intel Xeon Scalable можуть працювати й напряму з SSD-накопичувачами Intel Optane. Завдяки спеціальним оптимізаціям, підключаючись через інтерфейс PCIe 3.0, вони фактично створюють новий рівень оперативного зберігання даних, забезпечуючи процесорам доступ до великого поля пам’яті. Процесори підтримують до 48 інтерфейсів PCIe на платі, що дозволяє встановлювати додаткові накопичувачі Intel Optane у досить великій кількості. Швидкість передавання даних шиною PCIe становить 8 гігатранзакцій за секунду (що еквівалентно 32 Гбіт/с), і Optane можуть працювати зі швидкістю близько 2 Гбіт/с на кожен накопичувач.
За даними Intel, при встановленні 6 накопичувачів Intel Optane та використанні Intel SPDK можна досягти зниження часу відгуку до 40 разів, а також збільшення IOPS (кількості операцій введення-виведення) до 5,2 раза і зниження затримок до 3,3 раза порівняно з роботою на традиційних накопичувачах. Це відбувається завдяки прискоренню доступу до інформації та tiering-розміщенню даних на різних накопичувачах.
Скільки при цьому система отримує пам’яті? Порахуємо: кожен процесор Intel Xeon Scalable підтримує 6 каналів пам’яті по 2 модулі в кожному. Таким чином, можна встановити 12*128 ГБ=1,5 ТБ ОЗП. Додавши до них 6 SSD ємністю 512 ГБ, можна отримати 1,5+3=4,5 ТБ високошвидкісної пам’яті для КОЖНОГО процесора. Ба більше, використання технології Intel Memory Drive Technology (MDT) дозволяє створити програмно-визначене сховище пам’яті для кожного конкретного сервера. Спеціальний драйвер завантажується до ОС і об’єднує в єдине дворівневе сховище всю оперативну пам’ять і накопичувачі. У результаті операційна система отримує готове сховище пам’яті з автоматизованим розподілом даних між «швидкими» та «повільними» сегментами.
Це справді неймовірний результат, враховуючи, що в кожен сервер можна встановити досить багато ємних, але повільніших дисків для статичного зберігання датасетів. Наприклад, 10 дисків SATA ємністю 2 ТБ кожен можуть додати 20 ТБ «повільного» сховища, а для досягнення вищої швидкості можна зробити вибір на користь SSD-накопичувачів. Процесори Intel Xeon Scalable мають вбудований модуль VMD (Virtual Management Device), який самостійно створює RAID-масиви з підключених через PCIe та SATA дисків, підтримуючи «гарячу заміну» компонентів, що виходять з ладу, а також напряму взаємодіє з мережевим контролером для прискорення роботи з даними в усьому обчислювальному кластері.

Кеш і спеціальний доступ до пам’яті
Тепер повернемося до самого процесора. Архітектура SkyLake змінює структуру самої кеш-пам’яті. Кеш L1 розташований всередині ядра, поруч із кожним ядром розміщується «добавка» до кешу L2 у 768 КБ, яка дозволяє йому досягти 1 МБ. А кеш L3, з якого кожне ядро може отримувати дані напряму, розташований в окремому шарі кристала і становить 39 Мбайт — тобто 1,375 Мбайт на ядро. Цей кеш неінклюзивний — дані надходять із пам’яті безпосередньо в L2, а вже непотрібні або спільні для кількох ядер рядки даних витісняються в кеш L3.

Як ви можете бачити на наведеній вище схемі, між’ядерна взаємодія відбувається не кільцевою шиною, як це було в попередньому поколінні процесорів, а згідно з архітектурою Mesh. Вона прискорює обмін інформацією та якісно покращує роботу нових чипів при високих навантаженнях, характерних для задач віртуалізації та складних аналітичних систем, особливо коли запити ядер до пам’яті практично неможливо передбачити.

До речі, така сама архітектура використовується для обміну даними між процесорами в багатопроцесорному сервері. Завдяки шині OmniPath «спілкування» чипів між собою відбувається значно швидше, а архітектура Remote Direct Memory Access дозволяє отримати доступ напряму до «чужих» комірок пам’яті, оминаючи рівень ОС. Таким чином, обчислювальні ядра можуть працювати з даними, що знаходяться в полі пам’яті іншого процесора або навіть іншого вузла обчислювального кластера.

І знову вся справа в пам’яті!
Ієрархія кешу, а також технології доступу до даних, що зберігаються в ОЗП інших процесорів, зокрема через мережу, роблять велике й доступне поле оперативної пам’яті однією з основних переваг нової платформи Intel. І якщо традиційні накопичувачі, підключені через інтерфейс SATA, можна замінювати в режимі hot swap, то оперативну пам’ять необхідно від самого початку вибирати максимально надійну та стабільну. У хмарних ЦОД і важких аналітичних системах оперативна пам’ять відіграє ключову роль, і Kingston уже має пропозицію, створену спеціально для нових процесорів.
Платформа Purley дозволяє встановлювати регістрові модулі пам’яті RDIMM або модулі зі зниженим навантаженням LRDIMM, або 3DS LRDIMM для досягнення енергоефективності. З появою нових платформ Intel і AMD Kingston сертифікувала свої модулі пам’яті для інноваційних серверних платформ.
До речі, зверніть увагу, що для лінійки серверної пам’яті Kingston тепер використовується маркування KSM (Kingston Server Memory), а не KVR, KCP, KTH, KTD, KTL, KCS — чи якось інакше. Поки це стосується модулів зі швидкістю 2666 МГц, але всі нові брендовані модулі серверної пам’яті Kingston матимуть маркування KSM, зокрема ті, що працюють на вищих частотах, випуск яких запланований уже на 2018 рік. Однак у випадку з Xeon Scalable це поки не має значення, оскільки вбудований контролер пам’яті у топових Intel Xeon Scalable працює на частоті 2666 МГц, і швидша пам’ять у Purley просто не потрібна. А для реальних задач і зовсім не завжди потрібні саме найдорожчі чипи. У більшості випадків цілком можна обійтися процесорами Gold 51xx, Silver 41хх і Bronze 31хх на тій самій архітектурі, які підтримують частоти пам’яті 2400 МГц і 2133 МГц.

Як ви можете бачити, при розумному підході можна зекономити й на пам’яті, адже Kingston, звісно, пропонує продукти з будь-якими частотами з наведеної вище схеми. Достатньо визначити спектр задач, які виконуватиме сервер, і встановити в нього пам’ять, що відповідає можливостям процесора. Наприклад, для серії Bronze 31xx немає сенсу купувати навіть DDR4-2400 МГц, оскільки процесор не використовуватиме її можливості.

Замовлення пам’яті нового покоління — модулів KSM — стало помітно простішим. Більше немає жодних відмінностей у маркуванні. Якщо ви купували пам’ять Kingston для серверів, то добре знаєте, що раніше у нас було два види серверної пам’яті — Server Premier і Value RAM. Уся пам’ять KSM має властивості Server Premier, при тому що ціна модулів була знижена відносно преміальної серії. До того ж, якщо раніше потрібно було перевіряти, чи є в маркуванні пам’яті суфікс «i» (що свідчив про сертифікацію Intel), тепер про нього можна забути — вся серія KSM від початку проходить сертифікацію. Тому новинки буде простіше вибирати як збирачам, так і користувачам серверних систем.
Усі модулі KSM використовують фіксований BOM (Bill of Materials). Це означає, що спеціалісти Kingston ретельно вибирають виробників самих мікросхем і допускають у серію лише найякісніші продукти. Інженери проводять тестування кожної комірки пам’яті на етапі виробничого контролю, а також перевіряють самі друковані плати. Ми контролюємо все, аж до ревізії чипів і виробника регістрового чипа. Таким чином, модулі серії KSM є найретельніше контрольованою серією пам’яті Kingston для професійних задач.
Уся інформація про пам’ять тепер легко читається в її парт-номері. Наприклад, якщо ви прочитаєте наступний номер на модулі:

То це означатиме, що виробник чипа H — Hynix, ревізія чипа — А, а виробник регістрового чипа — IDT. До речі, виробниками регістрових чипів можуть бути різні компанії. Окрім IDT (I), також використовуються компоненти від Rambus, раніше відомої як Inphi ®, і Montage (M).
Загалом прозоріше маркування не лише відображає більш цілісний підхід Kingston до випуску серверної пам’яті, а й допоможе виконувати апгрейди модулів, контролюючи всі параметри, аж до виробника чипів. Це дозволить уникнути можливих конфліктів або зниження продуктивності обладнання через неповну сумісність, а також закуповувати однотипні модулі для кількох видів серверів, спрощуючи логістику й обслуговування систем.
Висновок
Підсумуємо. Щоб отримати повну віддачу від нової платформи, необхідно ретельно підібрати всі компоненти та використовувати всі засоби оптимізації Intel, які допомагають розкрити переваги нових процесорів і платформи Purley загалом. Перевагами пам’яті Kingston для серверів уже сьогодні користуються провідні хостингові компанії, і якщо ви встановите максимально продуктивні та надійні модулі, перехід на Intel Xeon Scalable дасть максимально можливий ефект для вирішення важких задач — від віртуалізації до аналітики й моделювання.
Підписуйтесь і залишайтеся з нами — буде цікаво!
Джерело: https://geektimes.ru/company/kingston_technology/blog/296969/