Найвизначнішою подією стала презентація нових серверних процесорів Intel Xeon Scalable, а також пов'язана з ними платформа Purley. І сьогодні ми розповімо про те, як ці новинки працюють з пам'яттю, чим відрізняються від своїх попередників і які модулі краще використовувати з ними.


За даними IDC, Intel належить понад 90% ринку серверних процесорів, але цього року AMD представила нові потужні процесори EPYC. Лідери не залишилися в боргу і влітку показали всьому світу платформу Purley, яка відрізняється від попередніх рішень, а також продуктів конкурентів новою схемою роботи з пам'яттю.

Мабуть, найважливішою особливістю Purley є архітектура. Виробник представив одночасно процесори Intel Xeon Scalable із вбудованими контролерами та спеціальними оптимізаторами, а також SSD-компоненти Intel Optane та чіпсети Intel Xeon Phi. За умови встановлення високопродуктивної пам'яті DRAM все це буде працювати з максимальною швидкістю, відкриваючи нові можливості для «хмарних обчислень, віртуалізації, телекомунікаційних мереж нового покоління (5G), машинного навчання та штучного інтелекту».

Самі процесори Intel Xeon Scalable відрізняються набагато вищою продуктивністю, ніж попереднє покоління. За даними Intel, зростання становить близько 65%. Це стосується топових процесорів Intel Xeon Scalable Platinum, які можуть містити до 28 ядер на кристалі (бувають версії з меншою кількістю), що працюють на частоті до 2,4 ГГц. За рахунок нових технологій передачі даних між процесорами та обчислювальними ядрами новинки дозволяють виконувати погано розпаралелювані завдання, коли ви не можете заздалегідь передбачити, яка інформація буде потрібно в наступний момент. Давайте розберемося з тим, як нова платформа працює із даними.

Нова ієрархія пам'яті

Крім наявності 6-канального контролера пам'яті DDR4, процесори Intel Xeon Scalable можуть працювати безпосередньо з SSD-накопичувачами Intel Optane. Завдяки спеціальним оптимізаціям, підключаючись через інтерфейс PCIe 3.0, вони фактично створюють новий рівень оперативного зберігання даних, забезпечуючи процесорам доступ до великого поля пам'яті. Процесори підтримують до 48 інтерфейсів PCIe на платі, що дозволяє встановлювати додаткові накопичувачі Intel Optane у досить великій кількості. Швидкість передачі даних по шині PCIe становить 8 гігатранзакцій за секунду (що еквівалентно 32 Гбіт/с), і Optane можуть працювати зі швидкістю близько 2 Гбіт/с на кожен накопичувач.

За даними Intel, при встановленні 6 накопичувачів Intel Optane і використанні Intel SPDK можна досягти зниження часу відгуку до 40 разів, а також збільшення IOPS (кількості операцій введення-виведення) до 5,2 разів та зниження затримок до 3,3 разів порівняно з роботою на традиційних накопичувачах. Це відбувається за рахунок прискорення доступу до інформації та Tier-інгу розміщення даних на різних накопичувачах.

Скільки у своїй система отримує пам'яті? Давайте порахуємо: кожен процесор Intel Xeon Scalable підтримує 6 каналів пам'яті по 2 модулі в кожному. Отже, можна встановити 12*128 ГБ=1,5 ТБ ОЗУ. Доповнивши їх 6 SSD ємністю 512 ГБ, можна отримати 1,5+3=4,5 ТБ високошвидкісної пам'яті для КОЖНОГО процесора. Більш того, використання технології Intel Memory Drive Technology (MDT) дозволяє створити програмно-визначуване сховище пам'яті для кожного конкретного сервера. Спеціальний драйвер завантажується до ОС та поєднує в єдине дворівневе сховище всю оперативну пам'ять та накопичувачі. В результаті операційна система отримує готове сховище пам'яті з автоматизованим розподілом даних по «швидких» та «повільних» сегментах.

Це справді неймовірний результат, враховуючи, що в кожен сервер можна встановити досить багато ємних, але повільніших дисків для статичного зберігання дата-сетів. Наприклад, 10 дисків SATA ємністю 2 ТБ кожен можуть додати 20 ТБ «повільного» сховища, для досягнення вищої швидкості вибір можна зробити на користь SSD-накопичувачів. Процесори Intel Xeon Scalable мають вбудований модуль VMD (Virtual Management Device), який самостійно створює RAID-масиви з підключених через PCIe і SATA дисків, підтримуючи «гарячу заміну» компонентів, що виходять з ладу, а також безпосередньо взаємодіє з мережевим контролером для прискорення роботи з даними у всьому обчислювальному кластері.

Кеш та спеціальний доступ до пам'яті

Тепер давайте повернемося до самого процесора. Архітектура SkyLake змінює структуру кеш-пам'яті. Кеш L1 знаходиться всередині ядра, поряд з кожним ядром розміщується «добавка» до кешу L2 в 768 КБ, яка дозволяє досягти 1 МБ. А кеш L3, з якого кожне ядро ​​може отримувати дані безпосередньо, розташований в окремому шарі кристала і становить 39 Мбайт - тобто 1375 Мбайт на ядро. Цей кеш неінклюзивний - дані надходять із пам'яті безпосередньо в L2, а вже непотрібні або загальні для декількох ядер рядки даних витісняються в кеш L3.

Як ви можете бачити на представленій вище схемі, між'ядерна взаємодія відбувається не по кільцевій шині, як це було в попередньому поколінні процесорів, а згідно з архітектурою Mesh. Вона прискорює обмін інформацією та якісно покращує роботу нових чіпів при високих навантаженнях, характерних для задач віртуалізації та складних аналітичних систем, особливо коли запити ядер до пам'яті практично неможливо передбачити.

До речі, така сама архітектура використовується для обміну даними між процесорами на багатопроцесорному сервері. Завдяки шині OmniPath «спілкування» чіпів між собою відбувається набагато швидше, а архітектура Remote Direct Memory Access дозволяє отримати доступ безпосередньо до «чужих» осередків пам'яті, минаючи рівень ОС. Таким чином, обчислювальні ядра можуть працювати з даними, що знаходяться в полі пам'яті іншого процесора або іншого вузла обчислювального кластера.

І знову вся річ у пам'яті!

Ієрархія кешу, а також технології доступу до даних, що зберігаються в ОЗУ інших процесорів, у тому числі по мережі, роблять велике та доступне поле оперативної пам'яті однією з основних переваг нової платформи Intel. І якщо традиційні накопичувачі, підключені через інтерфейс SATA, можна замінювати в режимі hot swap, оперативну пам'ять необхідно спочатку вибирати максимально надійну і стабільну. У хмарних ЦОД та у важких аналітичних системах, оперативна пам'ять відіграє ключову роль, і Kingston вже має пропозицію, створену спеціально для нових процесорів.

Платформа Purley дозволяє встановлювати регістрові модулі пам'яті RDIMM або модулі зі зниженим навантаженням LRDIMM або 3DS LRDIMM для досягнення енергоефективності. З появою нових платформ Intel та AMD Kingston сертифікувала свої модулі пам'яті для інноваційних серверних платформ.

До речі, зверніть увагу, що для лінійки серверної пам'яті Kingston тепер використовується маркування KSM (Kingston Server Memory), а не KVR, KCP, KTH, KTD, KTL, KCS або якось ще. Поки що це стосується модулів зі швидкістю 2666 МГц, але нові брендові модулі серверної пам'яті Kingston матимуть маркування KSM, у тому числі працюючі на більш високих частотах, випуск яких запланований вже в 2018 році. Однак у випадку з Xeon Scalable це поки не має значення, тому що вбудований контролер пам'яті у топових Intel Xeon Scalable працює на частоті 2666 МГц і швидша пам'ять у Purley просто не потрібна. А для реальних завдань і не завжди потрібні саме найдорожчі чіпи. У більшості випадків можна обійтися процесорами Gold 51xx, Silver 41хх і Bronze 31хх на тій же архітектурі, які підтримують частоти пам'яті 2400 МГц і 2133 МГц.

Як ви можете бачити, при розумному підході можна заощадити і на пам'яті, благо Kingston, зрозуміло, пропонує продукти з будь-якими частотами вищенаведеної схеми. Досить визначити спектр завдань, які виконуватиме сервер, і встановити пам'ять, відповідну можливостям процесора. Наприклад, у серію Bronze 31xx немає сенсу купувати навіть DDR4-2400 МГц, оскільки процесор не використовуватиме її можливості.

Замовлення пам'яті нового покоління – модулів KSM – стало помітно простішим. Немає більше жодних відмінностей маркувань. Якщо ви купували пам'ять Kingston для серверів, то знаєте, що раніше у нас було два види серверної пам'яті - Server Premier і Value RAM. Вся пам'ять KSM має властивості Server Premier, при тому, що ціна модулів була знижена по відношенню до преміальної серії. До того ж, якщо раніше потрібно було перевіряти, чи є в маркуванні пам'яті суфікс «i» (що говорить про сертифікацію Intel), тепер про нього можна забути – вся серія KSM спочатку проходить сертифікацію. Тому новинки буде простіше вибирати як збирачам, так і користувачам серверних систем.

 

Усі модулі KSM використовують фіксований BOM (Bill of Materials). Це означає, що фахівці Kingston ретельно обирають виробників самих мікросхем і допускають у серію лише якісні продукти. Інженери проводять тестування кожного осередку пам'яті на етапі виробничого контролю, а також перевіряють самі друковані плати. Ми контролюємо все, аж до ревізії чіпів та виробника регістрового чіпа. Таким чином, модулі серії KSM є найретельніше контрольованою серією пам'яті Kingston для професійних завдань.

 

Вся інформація про пам'ять тепер легко читається у її парт-номері. Наприклад, якщо ви прочитаєте наступний номер на модулі:

Це означатиме, що виробник чіпа H – Hynix, ревізія чіпа – А, а виробник регістрового чіпа – IDT. До речі, виробниками реєстрових чіпів можуть бути різні компанії. Крім IDT (I) також використовуються компоненти від Rambus, відома раніше як Inphi ® та Montage (M).

 

Взагалі прозоріше маркування не тільки відображає цілісний підхід Kingston до випуску серверної пам'яті, але також допоможе виробляти апгрейди модулів, контролюючи всі параметри, аж до виробника чіпів. Це дозволить уникнути можливих конфліктів або зниження продуктивності обладнання через неповну сумісність, а також закуповувати однотипні модулі для кількох видів серверів, спрощуючи логістику та обслуговування систем.

Висновок

Підіб'ємо невеликий підсумок. Щоб отримати повну віддачу від нової платформи, необхідно ретельно підібрати всі компоненти та використовувати всі засоби оптимізації Intel, які допомагають використовувати переваги нових процесорів та платформи Purley загалом. Перевагами пам'яті Kingston для серверів вже сьогодні користуються провідні хостингові компанії, і якщо ви встановите максимально продуктивні та надійні модулі, перехід на Intel Xeon Scalable дасть максимально можливий ефект для вирішення важких завдань – від віртуалізації до аналітики та моделювання.

Підписуйтесь та залишайтеся з нами – буде цікаво!
Джерело: https://geektimes.ru/company/kingston_technology/blog/296969/