HPE выпустила сервер ProLiant RL300 на архитектуре AArch64. Почему это важно для Cloud-рынка?

Дефицит чипов, возникший в 2020-2021 годах, заставил многих производителей и потребителей компьютерного оборудования осознать, что на x86-решениях мир не заканчивается. Компания Apple перевела свои ноутбуки и моноблоки на новые процессоры с архитектурой ARM, а ещё раньше мы рассматривали сервер Huawei Taishan 2280 V2 на базе процессоров Kunpeng 920 с архитектурой ARM, и уже тогда я выразил мнение, что рано или поздно Cloud-мир перейдёт на новую архитектуру, ведь для крупных компаний это возможность контролировать процесс разработки чипа, для поставщиков серверов - возможность предложить что-то новое, чего нет у конкурентов, а для потребителей - дополнительная степень свободы и возможно, решение каких-то локальных проблем. И вот прошло время, и крупнейший вендор серверного оборудования, HPE, выпускает модель Proliant RL300 Gen11 на базе процессоров Ampere Altra (Max). Это 1-сокетные 1-юнитовые серверы, поставляемые как по традиционной модели покупки, так и по относительно новому типу продаж по подписке (Server-as-a-service). Новые машины предназначены для Cloud-окружений, то есть для компаний, предоставляющих услуги хостинга приложений с использованием контейнерной и аппаратной виртуализации, а так же для Web-хостинга и соответствующих приложений.

Кто такие Ampere?

Ampere - это американская компания, которую возглавляет бывший президент Intel, Рене Джеймс, занимающаяся разработкой серверных CPU. Компания не имеет собственного производства, и  использует 7 нм техпроцесс TSMC для выпуска. Помимо Ampere, на рынке ARM-решений также присутствуют процессоры Graviton от Amazon, которые в основном, выпускаются для работы в ЦОД-ах компании для продажи клиентам ресурсов, и вышеупомянутый Kunpeng 920 от Huawei.

Нельзя сказать, что HPE стала первой компанией, предложившей сервер на базе процессоров Ampere. В модельном ряду Gigabyte есть целых 6 моделей разной плотности на процессорах Altra Max, просто HPE - первый крупный поставщик серверов, кто предложил модель, интегрированную в собственную экосистему обслуживания и поддержки, и это очень значимый для всей индустрии шаг. Конечно, шажок выглядит неуверенным: только 1 модель в форм-факторе 1U выглядит слабовато даже на фоне одного Gigabyte, предлагающего полный спектр машин, в том числе для периферийных (Edge) вычислений, в том числе с возможностью установки GPU и в формате 1N4U.

Почему кто-то должен переходить с x86 на ARM?

Прежде всего, ARM-процессоры Ampere могут похвастаться высокой плотностью ядер на сокет: модель Altra Max имеет 128 ядер в 1 сокете, плюс 128 каналов PCI Express Gen4 (до 196 в 2-процессорных серверах), а это открывает возможность смело переходить на 1-процессорные серверы с использованием программно-определяемых распределённых СХД, и нос-в-нос конкурировать с процессорами AMD EPYC там, где нужна высокая плотность ядер и PCI Express накопителей.

Второй момент, это конечно же, цена. В случае с брендовыми серверами HPE трудно сказать, насколько экономия по сравнению с серверами на Intel Xeon и AMD EPYC окажется существенной, но она подразумевается изначально, причём не только на этапе заказа, но и в процессе эксплуатации.

Низкие эксплуатационные расходы достигаются за счёт высокой энергоэффективности ARM-архитектуры: максимальное значение TDP для 128-ядерного Altra Max заявлено на уровне 250 Вт, а типичное даже в синтетическом бенчмарке SPECrate® 2017_int_base - около 178 Вт. Сравнительно низкое энергопотребление ведёт к снижению расходов на охлаждение, и как следствие, более высокой плотности размещения серверов в шкафах.

Одной из ключевых технологий, которую продвигают разработчики Ampere является решение так называемой проблемы "шумных соседей".

Что такое проблема "шумных соседей"

В условиях, когда провайдер сдаёт в аренду мощности в виде VPS розничным клиентам, вполне возможен перекос нагрузки, когда одна или несколько виртуальных машин слишком сильно загружают процессорную шину, подсистему хранения или памяти. Особенно это актуально при выполнении задач, связанных с искусственным интеллектом. Одна такая виртуальная машина может замедлять работу всего сервера, на котором могут хоститься сотни клиентских виртуалок, что неизменно скажется на качестве сервиса в целом. Процессоры Ampere решают эту проблему по-своему. Во-первых, в Altra/Altra Max нет функции HyperThreading, и одно ядро выполняет один поток.

Во-вторых, каждое ядро имеет собственный кэш 1 и 2 уровней, а связь с PCI Express устройствами реализована в виде одноранговой сети. Специально для приложений машинного обучения на аппаратном уровне реализована поддержка форматов данных FP16 (числа половинной точности) и INT8 (однобайтное представление целого числа). Есть также аппаратное ускорение хэширования AES и SHA-256. В целом, процессоры разрабатывались изначально с учётом требований максимальной изоляции пользователей в Cloud-окружениях, и не подвержены атакам на повышение прав доступа типа Spectre/Meltdown.

Основной тормоз на пути развития ARM-решений, это конечно же, несовместимость с существующим программным стеком, развёрнутым в x86-среде на предприятиях. Да, под архитектуру ARM, конечно же, существуют все те же операционные системы, включая Windows, Linux и BSD, но надо понимать, что это всё же другие операционные системы и другой софт, который возможно придётся компилировать из исходников под ARM, и мало того, что общий кластер из x86 и ARM64 не построишь, но и виртуалку или образ контейнера из x86 в ARM не перенесёшь, так что под ARM нужно строить отдельные кубики дата-центра, а целесообразность этого под большим вопросом (см. нашу статью о масштабировании ЦОД облачными провайдерами). Тем не менее, для тех, кто всё же решит вынести часть нагрузки в ARM-область, сервер HPE RL300 предложит все достижения индустрии последних лет.

Ключевые особенности HPE ProLiant RL300

Как уже было сказано выше, HPE ProLiant RL300 - это 1U сервер полноценной глубины с отказоустойчивым блоком питания мощностью 800 Вт. Модель рассчитана на установку 1 процессора Altra или Altra Max с максимальным числом ядер 128, работающих с максимальной частотой 3.0 ГГц.

HPE RL300

Сервер имеет 8-канальный контроллер памяти, всего можно установить до 16 модулей DDR4-3200.

HPE RL300

Интересно, что встроенного сетевого контроллера на материнской плате не имеется, и в любом случае придётся задействовать плату расширения: для этих целей предусмотрено два слота OCP 3.0 под сетевые интерфейсы, а также два слота расширения полной высоты полной длины.

HPE RL300

Подсистема хранения представлена 10 отсеками для 2.5" SSD с интерфейсом SAS (вероятно при заказе можно будет выбрать PCI Express накопители).

Ожидается, что в продажу сервер поступит в 3 квартале сего года.

Выводы

Принципиально, ничего необычного новые серверы собой не представляют. Просто для клиентов, использующих решение HPE появилась возможность строить кластеры на архитектуре ARM без смены вендора. Это может быть как экспериментальный кластер с заделом на будущее, так и планируемый переход с x86 на ARM, например для диверсификации поставщика процессорных решений (см. нашу пророческую статью о диверсификации CPU и чем заменить Intel). Это полезный и важный шаг, который можно только приветствовать.

Михаил Дегтярёв (aka LIKE OFF)
29/06.2022


Похожие статьи:

Обзор Lenovo ThinkAgile VX3320 - гиперконвергентное решение для упрощённого развёртывания vSAN в масштабах предприятия

Гиперконвергентные системы стремительно набирают популярность и уже становятся стандартом для построения платформ виртуализации в корпоративной среде. Компания Lenovo выпустила специальную серию серверов для установки и запуска VMware vSAN с...

Обзор QNAP TS-h1886XU-RP: знакомимся с операционной системой QuTS hero на основе ZFS

Теперь у заказчиков появилась возможность использовать ZFS в СХД начального уровня: теперь у вас есть возможность совместить дедупликацию и SAN-подключение через FC, настроить кеширование Cloud-хранилища на локальном диске и син...

Обзор 4-процессорного сервера Lenovo SR860 V2 на базе Intel Xeon Cooper Lake

Очень интересный сервер ценой под 1M$, созданный для SAP HANA и приложений с большим потреблением ОЗУ. Здесь процессоры расположены один над другим, имеется 3 Тб памяти, 4 блока питания, мониторинг с предиктивным анализом поломо...

Зачем AMD купила Xilinx: простым понятным языком

Когда смотришь как крупные компании гребут под себя всё, что плохо лежит в мире протоколов и сетевых решений, не сразу понимаешь, что происходит, и вот давайте разбираться вместе.