• nav


Intel Columbiaville: 800-я серия сетевых карт с поддержкой 100G, ADQ и DDP

Компания Intel решила сократить своё технологическое отставание в сетевом сегменте перед основным конкурентом, израильской Mellanox, представив 100-гигабитные сетевые адаптеры 800-й серии с кодовым названием Columbiaville.

В предыдущем, 700-м поколении сетевых чипов, Intel делала ставку на простоту и доступность, поэтому 40-гигабитные процессоры семейства Fortville не имели большинства механизмов аппаратной разгрузки и позиционировались как решения начального уровня. В новой серии Intel поняла, что к сетевым контроллерам в современном мире требований предъявляется больше, чем раньше, поэтому 800-я серия прежде всего, обрадует тех, кто ждал поддержку RDMA (iWARP & RoCE V2). Эта функция, значительно ускоряющая скорость обмена между СХД и клиентом, была одним из основных козырей компании Mellanox начиная с 3-го поколения их плат ConnectX (к слову, сейчас израильтяне продают уже 6-е поколение ConnectX).

С учётом того, что в современных ЦОД-ах всё больше трафика генерируется приложениями, обменивающимися данными друг с другом до выхода во front-end, Intel посчитала, что на сетевой контроллер можно возложить и механизмы приоритезации и контроля очередности при трансляции данных, например, к кеширующим серверам в NoSQL базах. То есть, на уровне драйвера сетевая карта понимает, с каким приложением она общается и как выстраивать приоритеты на установку новых соединений и обслуживание существующих. Эти две технологии получили название Application Device Queues (ADQ) и Dynamic Device Personalization.

Application Device Queues (ADQ)

Поддержка ADQ появилась в Linux начиная с ядра 4.19, и вы можете использовать её с существующей инфраструктурой без каких-либо изменений в коде.

Что такое ADQ?

  • Выстраивание и разруливание очередей трафика в зависимости от приложения

Как работает ADQ?

  • Фильтрует трафик приложения в соответствии с набором запросов
  • Исполняемые ветви в приложении взаимодействуют с очередью запросов внутри механизма ADQ
  • Сетевая карта может ограничивать исходящий трафик в зависимости от приложения

Что означают эти громкие слова на практике? Фактически, у нас обычный QoS-механизм, регулирующийся не в зависимости от MAC-адреса или сетевого порта, а в зависимости от используемого приложения. Что это даёт?

Предсказуемость приложения, с которым происходит обмен данными, снижение задержек при работе с приложениями и увеличение пропускной способности сервера приложения. 

Конечно, первое, что приходит на ум - это вопрос, о каком таком приложении идёт речь, которое чувствительно к работе 100-гигабитной сети? Intel в рекламных проспектах приводит в пример NoSQL базу Redis, использующую ОЗУ для хранения данных. Redis используется там, где требуются быстрые выборки значения, соответствующего заданному ключу, будь то строка, текстовое поле или даже файл. При хранении миллионов файлов, например, найти нужный в Redis быстрее, чем в любой файловой системе. Поскольку Redis является однопоточным приложением, в типичной инсталляции могут быть использованы десятки инстанций Redis-а, каждая из которых даёт около миллиона транзакций в секунду.

С ростом числа соединений, механизм ADQ позволяет снизить задержки на стороне клиента в два-три раза, и примерно в два раза поднять число транзакций в секунду.

Dynamic Device Personalization (DDP)

Вы хотели аппаратную разгрузку пакетов, которой вам так не хватало в 700-й и 500-й версиях чипов? Вот вам полностью программируемый режим Offload-а: сетевая карта анализирует сетевые пакеты и обрабатывает не только внешний заголовок пакета, но и внутренний. Самый простой пример - iSCSI, здесь сетевая карта разгружает не только заголовки TCP пакетов, но и iSCSI протокола, и так - с любой нагрузкой. То есть, если у вас в системе появляется какой-то новый сетевой протокол, вы можете доверить его разгрузку сетевой карте. Без аппаратного Offload-а, достичь 100-гигабитной скорости на современных процессорах нельзя.

Профайлы DDP могут конфигурироваться при загрузке операционной системы, определяться прошивкой к чипу или даже меняться во время работы сервера.

Вообще, аппаратный Offload - это один из основных критериев выбора сетевых карт со стороны сервисных провайдеров. Такие компании как Amazon AWS и Microsoft Azure, возлагают большую нагрузку на сетевые контроллеры, экономя таким образом ресурсы центральных процессоров.

Заключение

Мир движется в сторону 5G, и эти сети станут одним из основных драйверов растущего спроса на быстрые 100-гигабитные сетевые адаптеры. Продукция Intel это прежде всего, низкая стоимость по сравнению с теми же сетевыми чипами Mellanox, имеющими куда более широкий список поддерживаемых функций. Конечно, DDP можно рассматривать как универсальный оффлоад любого протокола, но как он покажет себя в реальных условиях, можно будет увидеть только по тестам. Жаль, что 800-я серия сетевых чипов Intel не поддерживает технологии PCI Express over Fabric и GPU over Fabric, которые наиболее востребованы в системах с искусственным интеллектом, но видимо полноценной конкуренции Mellanox-у Intel пока что создавать не спешит.

Михаил Дегтярёв (aka LIKE OFF)
08/04.2019




ПОХОЖИЕ СТАТЬИ:

Почему Intel Xeon Platinum 9200 не пошёл в массы

На сегодняшний день ни один крупный поставщик, не объявил о поддержке процессоров Intel Xeon Platinum 9200. В этой статье мы поговорим о том, почему.

...

Как SmartNIC платы меняют концепцию безопасности сервера в частности и облака в целом

SmartNIC использует скорость DMA для быстрого доступа к памяти, работает в изолированном окружении, все вычисления происходят на ARM-процессоре сетевой карты, все вычислительные ресурсы сервера остаются доступными для пользователей...

Asic-процессор Microsoft Project Corsica: 100-гигабитная компрессия для облачных сред

Для таких сервисов, как Microsoft Azure, сокращение хранимых данных на несколько процентов означает экономию миллионов долларов. Microsoft анонсировала проект Corsica на этой неделе как кульминацию разработки своего стандарта сжати...

Что такое SmartNIC и почему сетевые карты для серверов стали умнее

Концепция SmartNIC выходит за рамки простого подключения и уже подразумевает, что сама сетевая карта, а не центральный процессор сервера или СХД производят обработку не только сетевого трафика и протоколов, но даже каких-то вычисле...

Обзор материнских плат ASRock на чипсете Intel B365 Express - ASRock B365 Phantom Gaming 4 и ASRock B365M Phantom Gaming 4

В конце прошлого года Intel представил новый чипсет B365 Express, который призван занять место между B360 и H370, при этом местами новинка лучше B360, местами – хуже. Но самый важный момент заключается в том, ...


НА ФОРУМЕ ГОВОРЯТ



НОВЫЕ СТАТЬИ
Как работают системы бесперебойного энергоснабжения в ЦОДах

В этой статье мы расскажем как в ЦОД обеспечивается бесперебойная работа оборудования с точки зрения резервирования источников питания. В качестве практического кейса в завершение статьи мы рассмотрим недавний инцидент во...

Каковы шансы у AMD на серверном рынке? Экспертное мнение и аналитика.

Почему AMD возлагает свои надежды на второе поколение процессоров, объявленное 7 августа 2019 года и суждено ли этим надеждам сбыться? Мы совершим небольшой экскурс в историю, и посмотрим, почему так получилось с Opteron-ами,...