• nav


Intel Columbiaville: 800-я серия сетевых карт с поддержкой 100G, ADQ и DDP

Компания Intel решила сократить своё технологическое отставание в сетевом сегменте перед основным конкурентом, израильской Mellanox, представив 100-гигабитные сетевые адаптеры 800-й серии с кодовым названием Columbiaville.

В предыдущем, 700-м поколении сетевых чипов, Intel делала ставку на простоту и доступность, поэтому 40-гигабитные процессоры семейства Fortville не имели большинства механизмов аппаратной разгрузки и позиционировались как решения начального уровня. В новой серии Intel поняла, что к сетевым контроллерам в современном мире требований предъявляется больше, чем раньше, поэтому 800-я серия прежде всего, обрадует тех, кто ждал поддержку RDMA (iWARP & RoCE V2). Эта функция, значительно ускоряющая скорость обмена между СХД и клиентом, была одним из основных козырей компании Mellanox начиная с 3-го поколения их плат ConnectX (к слову, сейчас израильтяне продают уже 6-е поколение ConnectX).

С учётом того, что в современных ЦОД-ах всё больше трафика генерируется приложениями, обменивающимися данными друг с другом до выхода во front-end, Intel посчитала, что на сетевой контроллер можно возложить и механизмы приоритезации и контроля очередности при трансляции данных, например, к кеширующим серверам в NoSQL базах. То есть, на уровне драйвера сетевая карта понимает, с каким приложением она общается и как выстраивать приоритеты на установку новых соединений и обслуживание существующих. Эти две технологии получили название Application Device Queues (ADQ) и Dynamic Device Personalization.

Application Device Queues (ADQ)

Поддержка ADQ появилась в Linux начиная с ядра 4.19, и вы можете использовать её с существующей инфраструктурой без каких-либо изменений в коде.

Что такое ADQ?

  • Выстраивание и разруливание очередей трафика в зависимости от приложения

Как работает ADQ?

  • Фильтрует трафик приложения в соответствии с набором запросов
  • Исполняемые ветви в приложении взаимодействуют с очередью запросов внутри механизма ADQ
  • Сетевая карта может ограничивать исходящий трафик в зависимости от приложения

Что означают эти громкие слова на практике? Фактически, у нас обычный QoS-механизм, регулирующийся не в зависимости от MAC-адреса или сетевого порта, а в зависимости от используемого приложения. Что это даёт?

Предсказуемость приложения, с которым происходит обмен данными, снижение задержек при работе с приложениями и увеличение пропускной способности сервера приложения. 

Конечно, первое, что приходит на ум - это вопрос, о каком таком приложении идёт речь, которое чувствительно к работе 100-гигабитной сети? Intel в рекламных проспектах приводит в пример NoSQL базу Redis, использующую ОЗУ для хранения данных. Redis используется там, где требуются быстрые выборки значения, соответствующего заданному ключу, будь то строка, текстовое поле или даже файл. При хранении миллионов файлов, например, найти нужный в Redis быстрее, чем в любой файловой системе. Поскольку Redis является однопоточным приложением, в типичной инсталляции могут быть использованы десятки инстанций Redis-а, каждая из которых даёт около миллиона транзакций в секунду.

С ростом числа соединений, механизм ADQ позволяет снизить задержки на стороне клиента в два-три раза, и примерно в два раза поднять число транзакций в секунду.

Dynamic Device Personalization (DDP)

Вы хотели аппаратную разгрузку пакетов, которой вам так не хватало в 700-й и 500-й версиях чипов? Вот вам полностью программируемый режим Offload-а: сетевая карта анализирует сетевые пакеты и обрабатывает не только внешний заголовок пакета, но и внутренний. Самый простой пример - iSCSI, здесь сетевая карта разгружает не только заголовки TCP пакетов, но и iSCSI протокола, и так - с любой нагрузкой. То есть, если у вас в системе появляется какой-то новый сетевой протокол, вы можете доверить его разгрузку сетевой карте. Без аппаратного Offload-а, достичь 100-гигабитной скорости на современных процессорах нельзя.

Профайлы DDP могут конфигурироваться при загрузке операционной системы, определяться прошивкой к чипу или даже меняться во время работы сервера.

Вообще, аппаратный Offload - это один из основных критериев выбора сетевых карт со стороны сервисных провайдеров. Такие компании как Amazon AWS и Microsoft Azure, возлагают большую нагрузку на сетевые контроллеры, экономя таким образом ресурсы центральных процессоров.

Заключение

Мир движется в сторону 5G, и эти сети станут одним из основных драйверов растущего спроса на быстрые 100-гигабитные сетевые адаптеры. Продукция Intel это прежде всего, низкая стоимость по сравнению с теми же сетевыми чипами Mellanox, имеющими куда более широкий список поддерживаемых функций. Конечно, DDP можно рассматривать как универсальный оффлоад любого протокола, но как он покажет себя в реальных условиях, можно будет увидеть только по тестам. Жаль, что 800-я серия сетевых чипов Intel не поддерживает технологии PCI Express over Fabric и GPU over Fabric, которые наиболее востребованы в системах с искусственным интеллектом, но видимо полноценной конкуренции Mellanox-у Intel пока что создавать не спешит.

Михаил Дегтярёв (aka LIKE OFF)
08/04.2019




ПОХОЖИЕ СТАТЬИ:

Переход с Intel Xeon на AMD EPYC: развенчиваем мифы, обходим подводные камни

Рядовые сисадмины и крупные IT-директора, когда речь заходит об AMD, задают порой совершенно детские вопросы, а мы на них отвечаем. Совместимость с существующим стэком, снижение TCO, вопросы производительности и поддержки.

...

Почему Intel Xeon Platinum 9200 не пошёл в массы

На сегодняшний день ни один крупный поставщик, не объявил о поддержке процессоров Intel Xeon Platinum 9200. В этой статье мы поговорим о том, почему.

...

Как SmartNIC платы меняют концепцию безопасности сервера в частности и облака в целом

SmartNIC использует скорость DMA для быстрого доступа к памяти, работает в изолированном окружении, все вычисления происходят на ARM-процессоре сетевой карты, все вычислительные ресурсы сервера остаются доступными для пользователей...

Asic-процессор Microsoft Project Corsica: 100-гигабитная компрессия для облачных сред

Для таких сервисов, как Microsoft Azure, сокращение хранимых данных на несколько процентов означает экономию миллионов долларов. Microsoft анонсировала проект Corsica на этой неделе как кульминацию разработки своего стандарта сжати...

Что такое SmartNIC и почему сетевые карты для серверов стали умнее

Концепция SmartNIC выходит за рамки простого подключения и уже подразумевает, что сама сетевая карта, а не центральный процессор сервера или СХД производят обработку не только сетевого трафика и протоколов, но даже каких-то вычисле...


НА ФОРУМЕ ГОВОРЯТ



НОВЫЕ СТАТЬИ
Обзор видеокарты Palit GTX 1660 Super: тестируем новинку в задачах вычислений и машинного обучения

Новая серия видеокарт GTX 1660 Super интересна, прежде всего, памятью GDDR6, имеющей высокую пропускную способность. Это именно то, что надо для задач машинного обучения и работы в Tensorflow. Как минимум, вы можете создать...

Neffos C9 Max – недорогой смартфон с большим IPS-экраном

Мы регулярно тестируем смартфоны бренда Neffos, недавно у нас была модель X20 стоимостью 8500 рублей, а сегодня мы познакомимся с моделью чуть дешевле, за 7000 рублей – C9 Max. Это шестидюймовый смартфон с мощным...