Экспресс-тест видеокарты Palit GeForce RTX 2080 Super в задачах машинного обучения
Компания Nvidia планово обновляет свои видеокарты, переводя всю продуктовую линейку на новую память GDDR6. В нашем обзоре Geforce GTX 1660 Super мы уже говорили, что в задачах Machine Learning / Artificial Intelligence пропускная способность VRAM имеет зачастую определяющее значение. И конечно же, если вы выбираете GPU не только для игр, но и для научных расчётов, вам интересно видеть видеокарту с тензорными ядрами и современной памятью GDDR6 объёмом 8 Гб.
Мы рассматриваем новинку от компании Palit. Этот производитель видеокарт сегодня пользуется огромной популярностью у геймеров, благодаря хорошему разгонному потенциалу и тихой системе охлаждения. К слову, высокое TDP видеокарты RTX2080 Super заставляет использовать толстые теплопроводящие трубки и два 8-контактных разъёма питания.
Удерживать низкий уровень шума - та ещё задачка, но вот что интересно: во всех наших тестах мне не удалось как следует прогреть GPU. Видимо, многие блоки видеочипа не задействуются в вычислительных расчётов в отличии от той же GTX 1660, которая легко выходила на проектную мощность в тестах Tensorflow.
Тестирование
Первая часть - синтетические тесты, и начнём мы с оценки целочисленных операций и операций с плавающей точкой.
Продолжим с Geekbench 5 с тестами, использующими базовые алгоритмы распознавания лиц.
Практически в тесте OctaneBench 4.0, использующем реальных движок рендеринга, новинка показывает очень хорошие результаты для одного GPU. Под OpenCL рассматриваемая видеокарта имеет всего на 30-40% меньшую скорость, чем Tesla V100.
Перейдём к тестированию в реальных задачах и измерим скорость в самом популярном фреймворке Tensorflow / Keras.
Начнём с простых тестов, входящих в примеры пакета Keras. Сравнивать будем с Tesla-ми, предоставляемыми в Google Colab. И хотя бесспорно Google делит производительность GPU, для нас важно понять, насколько ваша локальная GPU сопоставима с тем, что вам дают в облаке.
В реальной задаче на обучение модели с помощью цепей Маркова, известной как Textgenrnn при исходном файле объёмом 2.59 Мб и размере батча равном 256, плата в 4 раза обгоняет по скорости серию GTX и в 2 раза - тот вариант Tesla P100, который по большой удаче может выпасть вам ночью, во время малой нагрузки на сервис Google Colab. С такой производительностью Palit RTX2080 Super - это реальная и обоснованная альтернатива облачным вычислениям в пересчёте на 1 GPU.
Задачи генерации хэшей мы оцениваем по работе в майнинг-клиенте Minergate на Etherium. Здесь видеокарта показывает замечательные результаты, но при текущем курсе криптовалюты работает в убыток.
Выводы
Если для вас облако - это небезопасно, а Tesla - это дорого, то Palit Geforce RTX 2080 Super - это прекрасная альтернатива для работы в Tensorflow и других Python-задачах, связанных с машинным обучением и искусственным интеллектом. Очень тихая, холодная и благодаря поддержке FP16, более производительная, чем предыдущие поколения GP-GPU.
Перед покупкой убедитесь, что вы имеете достаточно мощный блок питания и хорошо продуваемый корпус. В большинство телекоммуникационных корпусов, не оптимизированных для установки GPU, эта видеокарта не влезет, но в универсальные 4U/Rack корпуса для рабочих станций поместится без проблем.
Михаил Дегтярев (aka LIKE OFF)
06/12.2019