• nav


Диверсификация поставщика CPU: чем заменить Intel в условиях санкций

Держу пари, что большая часть наших читателей слыхом не слыхивали про такой термин, как «диверсификация поставщика CPU», и тем не менее, не важно, видите ли вы суслика или нет, а важно что он есть, а значит о нём нужно знать до того, «грянет гром».

Я думаю, все вы знаете о торговой войне США и Китая, и уж точно вам известно о санкционной войне, при которой какой-то стране запрещается поставка определённого оборудования. Если говорить совсем простыми словами, то сегодня все коммерческие и государственные компании спокойно сидят на Intel, и никуда переходить не собираются, потому что так было заведено с незапамятных времён, и «на переправе коней не меняют». Казалось бы, позиции Intel незыблимы, и пошатнуть их может только что-то такое же сильное, как очередной виток санкций или война (технологическая, торговая, ядерная - не важно). Важно то, что в один прекрасный день кто-то росчерком пера запретит поставлять в Россию процессоры Intel, и синий гигант вынужден будет уйти с нашего рынка.

Вы скажете, что я сгущаю краски, но как бы ни так: никто и никогда не сомневался в позициях Microsoft в наших государственных структурах, но в 2014 году я в статье «Импортозамещение в IT-отрасли: возможности и перспективы» предсказал плановый переход с Windows на Linux в среде госкомпаний. Сегодня об импортозамещении в плане софта говорят все, а особо дальновидные думают о процессорах.

Что могут отключить?

А. Техподдержку

Любой сервер или СХД - это не только груда железа плюс диск с софтом, а это ещё и техподдержка. Как минимум, это человек на том конце провода, который рассматривает вашу заявку на обслуживание и направляет вам ответ, а как максимум - это наличие запчастей на складе в вашем городе и команда специалистов, готовых прилететь в ваш ЦОД для решения задачи на месте. Этот сервис нужен, прежде всего, для того, чтобы IT-департамент компании мог переложить с себя ответственность на производителя оборудования. В стремлении прикрыть свою пятую точку, никто не станет эксплуатировать оборудование и софт, не имеющие техподдержки. И надо ли объяснять, что самая дорогая СХД, самый мощный сервер, без «человека на том конце провода» превратятся в токсичный актив, который срочно нужно будет выводить из эксплуатации.

Б. Содействие в разработках

Крупные производители процессоров, программного обеспечения, да и другого оборудования, как правило, находятся в тесном контакте с разработчиками решений. Например, Intel в своё время активно развивал направление HPC в России, организовывал центры компетенции, и если вы, например, создавали алгоритм для предсказания погоды на процессорах Intel Xeon, и у вас возникали вопросы его работы на этих самых CPU, вы могли обратиться в Intel. Возможно, новый компилятор вам бы и не прислали, но обратная связь существует, и я это знаю на примере некоторых институтов.

Без этой связи вы не сможете «писать под Intel», и именно по этой причине сегодня никто не «пишет под AMD»: пишут «под Intel с поддержкой AMD», но прямым кодингом для процессоров EPYC или Ryzen, насколько я знаю, никто не занимается именно из-за отсутствия подобных «центров компетенций».

В. Прямые поставки

Поставщики серверов в Крым уже сталкивались с тем, что не всё и не всегда туда можно привезти, и хотя шила в мешке не утаишь, полноценный запрет на поставку определённых технологий может привести к тому, что вы просто не сможете масштабировать свой существующий кластер.

Вообще, в той или иной степени запрет на поставку высокотехнологичного оборудования был всегда: одно время говорили про интерфейсы для HPC, потом про системы охлаждения для суперкомпьютеров… Но пока что трудно даже представить во что выльется запрет на поставку хотя бы одного семейства процессоров Xeon.

Г. Программные библиотеки

Мы ещё как следует не сталкивались с возможностями ограничения доступа к Open-Source программному обеспечению. Компания, разрабатывающая библиотеку, запросто может запретить её использование в определённых странах, и хотя физических проблем скачать тот или иной софт не будет, юридические проблемы потянут за собой невозможность поставки целиковых отраслевых решений. И если тогда, в 2014-м, когда я мы только думали о переходе на Linux, мир IT был более «железным», сегодня при всех IoT, 5G, Edge, Agile и AI, это - исключительно «мир софта».

Импортозамещение

Д. Доступ к производственным мощностям

Для российских производителей процессоров отключат возможность заказывать производство на Тайваньских фабриках. Это касается МЦСТ Эльбрус, размещающей заказы на TSMC, да равно как и любых других разработчиков чипов. Так что даже самые патриотично-настроенные, народно-пролетарские российские процессоры не защищены от санкций со стороны "наших друзей".

Этот список можно продолжать бесконечно, и всё равно ты никогда не угадаешь, кто и что отключит. С одной стороны - санкции, с другой - Чебурнет, уж желающих что-то там вырубить / ограничить / запретить у нас в стране на 100 лет припасено. Другой вопрос, что делать?

Шаг 1 - переход к свободному ПО

Сегодня, благо, уже все понимают, что в мире корпоративного софта для компании Microsoft не остаётся места, и в 2019-2020 годах нет ни одной причины использовать Windows Server - у нас есть Linux, который можно скомпилировать для любой процессорной архитектуры, будь то x86, ARM, AMD64 или Raspberri Pi. Существуют достаточно успешные коммерческие дистрибутивы Linux с хорошим уровнем техподдержки. Поэтому первое, что нужно делать в рамках диверсификации CPU - это твёрдо сказать «Нет» продукции таких компаний как Microsoft, VMware, Oracle и переходить на свободное программное обеспечение. Аналогично следует отходить от аппаратных средств сетевой безопасности в пользу программных.

Начинать следует с определения архитектуры программного обеспечения: 32-битные или 64-битные приложения ли у вас используются? Под какую архитектуру они написаны, ведь например системы IBM Power имеют архитектуру RISC, а Intel Xeon - CISC. На уровне приложений следует иметь ввиду различия в API и консольных командах между старыми и новыми версиями.

Нужно понять, какое средство администрирование будет установлено на новых серверах, потому что в AIX-системах используются такие инструменты как SMIT, а управлять Linux-ом можно через Webmin, YaST или другие пакеты. Собственно, ради того, чтобы набить руку на управлении новыми системами и производится плавная диверсификация ЦОДа.

Шаг 2 - начинаем резервировать наш ЦОД

В инфраструктуре любой компании всего около 30% виртуальных машин можно отнести к разряду «боевых», на которых крутятся жизненно-важные сервисы, чувствительные к задержкам и производительности. Среди остальных 70% - тестовые, отладочные, вспомогательные и «не пойми чьи», узнать назначение которых можно только при выключении ВМ. Из какого отдела прибегут ругаться - тех и виртуалка.

Совершенно понятно, что работать предстоит именно с этими 70% машин, которые плавно предстоит вывести в резервную часть ЦОДа.

Вся прелесть современного подхода к ЦОДу на свободном ПО состоит в том, что разные архитектуры могут работать одновременно в рамках одного бизнес-процесса. Вы можете использовать новые x86 серверы в одной среде со старыми IBM Power машинами, подключать в одну сеть программные и аппаратные хранилища, проводя тесты и распределяя нагрузку.

Шаг 3 - выбираем процессоры под резерв

Первое, что нужно ещё раз себе уяснить: в рамках диверсификации мы не должны задаваться вопросом, кто отключит рубильник в первую очередь, а кто во вторую, и какова вероятность этого события. Мы считаем все события равновероятными, и вернёмся к этому вопросу чуть дальше по тексту, а пока давайте составим хит-парад из систем, которые с радостью вытеснят Xeon из вашей сметы.


Суть диверсификации процессоров

А. На первом месте нашего хит-парада - AMD EPYC, эти системы являются Drop-In заменой для Intel Xeon. Прежде всего, это единственное решение, максимально совместимое с процессорами Intel. Почти весь программный стек, написанный под Xeon, можно будет без проблем портировать на EPYC, что мы и делали в статье. Поддерживаются все современные дистрибутивы Linux, Windows и VMWare ESXi. Есть проблемы с установкой FreeBSD на «голое железо», но их можно обойти, запустив FreeBSD приложение под виртуалкой.

Вообще-то, если смотреть серьёзно, то это единственная полноценная альтернатива Intel-у, и что приятно - ни в чём не уступающая: производительность такая же или выше, безопасность выше, цена - ниже, а число ядер на сокет - больше, так что там где у Intel было 2 сокета в сервере, с AMD вы можете обходиться 1 сокетом, экономя на лицензиях.

Б. Десктопные процессоры Intel и AMD как вариант «взломать систему / обойти злые санкции». Сегодня такие производители серверных плат и систем, как Tyan, Asrock Rack и Supermicro предлагают вам установить в сервер процессор для настольных компьютеров. Например, AMD ThreadRipper имеет тот же процессорный сокет, что и EPYC, но работает только на материнских платах с чипсетом, в то время как его серверный брат является полноценным SoC-ом. И всё же эти CPU предлагают до 32 ядер и 128 Мб кэша L3 - на уровне хорошего серверного CPU.

Серверная материнская плата

Даже в случае с топовыми десктопными процессорами вы можете устанавливать ECC память, а материнские платы произведены по серверным стандартам и имеют серверный BIOS. В случае, если санкции коснутся только профессионального оборудования, игровые комплектующие могут свободно поставляться к нам в страну. Использование десктопных CPU позволит сохранить программный стек без изменений.

В. Huawei Kunpeng (920). Добро пожаловать в мир ARM-архитектур, которому стало тесно на наших с вами смартфонах, и он отправился покорять серверные стойки. Процессор, созданный с нуля нашими «китайскими братьями», по тестам SPECint удостаивается 930 баллов. Компания-производитель рекомендует использовать серверы Huawei Taishan для облачных сервисов.

Huawei Kunpeng

Учитывая размеры компании Huawei, не удивляешься их амбициям: не просто выставить на продажу ARM-серверы, а создать целую ARM-экосистему, включающую пресловутые «центры компетенции», обучение студентов в ВУЗах, вложения в НИОКР и исследовательскую работу, а так же тесное сотрудничество с разработчиками софта и интеграторами. Интересно, что в серверах Huawei Taishan даже сетевые чипы так же производства компании Huawei, то есть снижается риск появления аппаратных закладок.

Сегодня процессоры Kunpeng поддерживаются ARM-версиями дистрибутивов Linux, но не поддерживаются ни продукцией VMware, ни Microsoft.

Г. МЦСТ Эльбрус … он покупать себя заставил, и лучше выдумать не мог… На сегодня этот процессор поддерживается лишь несколькими Debian-based российскими дистрибутивами Linux, среди которых AstraLinux и собственная версия разработчиков, МЦСТ Linux. Учитывая сведения о производительности Эльбрусов, можно сказать, что сейчас для этих процессоров можно отвести нишу сетевых шлюзов или обработки данных IoT устройств.

Иметь на вооружении Эльбрус надо обязательно, чтобы хотя бы примерно представлять, с чем работать, если «жахнет по-взрослому».

Д. IBM Power8/9 - архитектура с самым сильным Vendor Lock-ом из всего, что создала IT-индустрия. Я не могу рассматривать архитектуру Power как средство для диверсификации, скорее это объект который нужно диверсифицировать для снижения рисков. Тем не менее, на процессорах Power8 (серия 8247) поддерживаются такие популярные дистрибутивы Linux, как Red Hat Enterprise Linux 7.2/8.0 for POWER8 и Ubuntu версий 14.04.5 / 16.04 / 18.04.

Я не хочу включать в наш хит-парад процессоры на архитектуре SPARC, потому что с моей точки зрения, пациент скорее мёртв, чем жив. Компания Oracle после покупки Sun, разработчика операционных систем Solaris для архитектуры SPARC, поувольняла оттуда большую часть сотрудников, и всё что касается SPARC сегодня выглядит крайне бесперспективно. Да, какие-то задачи типа баз данных определённо хорошо решаются на SPARC-серверах, но в то же время они распараллеливаются и переносятся на x86 или ARM архитектуру.

Поддержка операционных систем различными процессорами


Intel Xeon

AMD EPYC 7000

Intel Core iXAMD Thread ripperHuawei Kunpeng 920МЦСТ ЭльбрусIBM Power 9

Windows Server 2016

Да

Да

Да

Да

Нет

Нет

Нет

Windows Server 2019

Да

Да

Да

Да

Нет

Нет

Нет

Red Hat Enterprise Linux 8

Да

Да

Нет

Нет

Да

Нет

С версии 7.5

Ubuntu Linux

Да

Да

Да

Да

Да

Нет

С версии 18.04

FreeBSD 12

Да

Да

Да

Нет

Нет

Нет

Нет

Пожалуй, на этом процессоры заканчиваются. Как вы можете видеть, «не Intel-ом единым» живёт современная инфраструктура предприятия, и замену найти будет можно.

Рекомендации IT-специалистам

Примерно через 5-6 месяцев после того, как в вашем ЦОД-е появится кластер, собранный на Kunpeng, EPYC или … МЦСТ Эльбрус, ваш персонал уже будет готов к работе с этим оборудованием, и можно сказать, будет обучен вести действия в случае жёстких санкций. Для крупной компании достаточно выделить 10% своего IT-бюджета на диверсификацию, чтобы обучать собственных специалистов и в случае чего, иметь возможность безболезненно отказаться от закупок IT-санкционки.

И насколько бы абсурдно ни выглядело всё вышесказанное, в современных реалиях у вас должен быть план восстановления на случай очередного обострения политической обстановки. И везде, где у вас 1 поставщик, привязка к вендору, или проприетарное ПО наших «американских друзей» - у вас «тонко», и обязательно порвётся. Особенно обидно будет, если в тот же самый момент ваши конкуренты, прочитав нашу статью, подготовятся заранее и легко перенесут «обострение».

Михаил Дегтярёв (aka LIKE OFF)
29/11.2019




ПОХОЖИЕ СТАТЬИ:

Умные чипы сгладят отказ от закона Мура в датацентрах

Закон Амдала задаёт практический предел пользы от распараллеливания, так что дальнейшее ускорение возможно просто путем переопределения общей задачи таким образом, чтобы сделать ранее сериализованные операции распараллеливаемыми.

Секреты профессионалов: как масштабируют ЦОД облачные провайдеры

Вас всегда интересовало, а как операторы ЦОД-ов выбирают и настраивают своё оборудование? Почему, например, они устанавливают сервер «А», а не «Б», на что опираются - на скорость VM или потенциальное их количество в стойке, и как ...

Как работают системы бесперебойного энергоснабжения в ЦОДах

В этой статье мы расскажем как в ЦОД обеспечивается бесперебойная работа оборудования с точки зрения резервирования источников питания. В качестве практического кейса в завершение статьи мы рассмотрим недавний инцидент во время мас...

Каковы шансы у AMD на серверном рынке? Экспертное мнение и аналитика.

Почему AMD возлагает свои надежды на второе поколение процессоров, объявленное 7 августа 2019 года и суждено ли этим надеждам сбыться? Мы совершим небольшой экскурс в историю, и посмотрим, почему так получилось с Opteron-ами, и как...

Технологии телеметрии Mellanox WJH для выявления проблем с сетью и хранилищем

Поскольку сеть позволяет получать доступ к приложениям, обмениваться данными и подключаться к хранилищу, хорошая потоковая телеметрия позволяет обнаружить даже ошибки приложений. Компания Mellanox решила, что её ASIC-и достаточно х...


НА ФОРУМЕ ГОВОРЯТ



НОВЫЕ СТАТЬИ
Обзор трёх miniITX корпусов CrownMicro серии CMC-170

Сегодня речь пойдёт о трёх корпусах бренда CrownMicro для сборки ультракомпактных miniITX систем, а именно: CMC-170-113, CMC-170-303 и CMC-170-803. Эти модели имеют стильный дизайн, внешние блоки питания, VESA крепление...

Экспресс-тест видеокарты Palit GeForce RTX 2080 Super в задачах машинного обучения

Если вы выбираете GPU не только для игр, но и для научных расчётов, вам интересно видеть видеокарту с тензорными ядрами и современной памятью GDDR6 объёмом 8 Гб. Благодаря поддержке FP16, в некоторых теслах она показывает...