• nav


Обзор видеокарты Palit GTX 1660 Super: тестируем новинку в задачах вычислений и машинного обучения

Осенью 2018 года Nvidia выпустила линейку видеокарт RTX на чипах с кодовым именем Turing, имеющих встроенные тензорные и RT-ядра. Сообщество энтузиастов, использующих обычные игровые видеокарты для машинного обучения и искусственного интеллекта, встретило новинку без особого энтузиазма: да, с одной стороны вычисления с половинной точностью в операциях Floating Point 16 дают серьёзное увеличение скорости, иногда на 40-50% по сравнению с вычислениями Floating Point 32. Но с другой стороны, высокая стоимость видеокарт подталкивала использовать «облачные сервисы», не всегда удобные, не всегда безопасные, не всегда понятные по настройке.

К счастью, производительность GPU в играх и в задачах машинного обучения часто идут рука об руку, а в области игрового железа у «зелёных» есть очень сильный конкурент в лице AMD. Для борьбы с ними Nvidia выпустила серию GTX 1660 уже без тензорных ядер, но с 6 Гб видеопамяти, в которой до недавнего времени были две модели: GTX 1660 Ti с 1536 потоковыми процессорами частотой 1635 МГц и обычная GTX 1660 с 1408 ядрами CUDA с частотой 1785 МГц. Новая GTX 1660 Super отличается от обычной GTX 1660 только типом памяти - GDDR6 вместо GDDR5, и по этому параметру новинка становится рекордом в серии GTX 1660, предоставляя пользователю рекордную пропускную способность в 336 Гб/с. Это на 75% выше, чем у обычной GTX 1660 и на 16% больше, чем у «титановой серии». Память GDDR6 имеет более высокую пропускную способность на контакт, чем GDDR5, поэтому при более низкой частоте имеет большую скорость обмена данными.

Для сравнения, по пропускной способности ОЗУ новинка приблизилась к GTX 1080 или RTX 2060, имеющим скорость в 352 Гб/с и 332 Гб/с соответственно, но до RTX2080 (Ti) с их рекордными 448 (616) Мб/с им всё ещё далеко. Для сравнения, Nvidia Tesla T4 имеет «всего» около 320 Гб/с, Tesla K80, которую вы можете опробовать в Google Colab - 420 Гб/с, Tesla P100 - 720 Гб/с, а Tesla V100 - 900 Гб/с.

По оценке многих специалистов, именно пропускная способность видеопамяти, а не вычислительная мощность имеет ключевое значение в построении нейросетей. Например, при распознавании лиц объем высококачественных изображений, которые должны быть представлены для обучения, чрезвычайно велик. Так же необходимо постоянно проверять результаты с помощью новых наборов данных, чтобы снизить частоту ошибок. В зависимости от приложения, новые данные могут поступать очень часто и требуют постоянного обучения. Когда модели включают в себя много слоев и узлов, возникает необходимость в высокой пропускной способности памяти и интерфейса, чтобы поддерживать обучение нейронной сети и вывод на пиковых скоростях.

Проще говоря, сегодня GTX 1660 Super - это единственное CUDA-совместимое решение, которое при цене ниже 17 тысяч рублей даст вам скорость видеопамяти в 336 Гб/с.

Наш герой: Palit GTX 1660 Super StormX

Большинство видеокарт на чипах Nvidia GTX 1660 используют 2-вентиляторную систему охлаждения, и наша тестовая Palit GTX 1660 Super в этом плане выгодно отличается своей компактностью: хотите установить в NAS типа QNAP TS-677? Пожалуйста! В короткий Mini-ITX корпус для работы в режиме 24x7? Пожалуйста: никаких ограничений по длине, и лишь высота платы должна иметь для вас значение.

Palit 1660 Super

Система охлаждения использует единый радиатор не только для видеочипа, но и для шести чипов памяти и элементов VRM. В качестве теплопроводящего интерфейса для чипа GPU используется термопаста, а для модулей памяти и VRM - теплопроводящие подушки (aka «жвачка»).

Кулер Palit 1660 Super

При таком скромном размере кулера, компания Palit умудрилась задействовать три симметричные теплопроводящие трубки, и за счёт этого хода видеокарта даже при таких компактных размерах не перегревается.

Система охлаждения

При таком скромном размере кулера, компания Palit умудрилась задействовать две симметричные теплопроводящие трубки, и за счёт этого хода видеокарта даже при таких компактных размерах не перегревается.

Из особенностей платы хочется отметить металлическую защиту от скола видеочипа при перекосе радиатора. Если вы помните времена Athlon XP, вы наверняка поймёте, что на видеокартах Palit можно безболезненно снимать родной кулер, менять термопасту и ставить обратно без риска отколоть уголок GPU.

Palit 1660 Super

Сама плата, судя по пустующим местам под ключи VRM и два чипа памяти, рассчитана на более энергоёмкую компоновку. Обычная, «не-оверклокнутая» версия видеокарты имеет 3-фазную схему питания, благодаря чему разгон получается весьма успешным: 1980/4800 МГц.

Тестирование

Первая часть - синтетические тесты, и начнём мы с оценки целочисленных операций и операций с плавающей точкой.

Результаты тестирования AIDA64

Продолжим с Geekbench 5, оценивающий уже базовые алгоритмы распознавания лиц и наложения графических фильтров на изображения.

Результаты Geekbench

Практически в тесте OctaneBench 4.0, использующем реальных движок рендеринга, новинка показывает очень хорошие результаты для одного GPU.

Результаты тестирования Octanebench

Перейдём к реальному тесту и измерим производительность в самом популярном фреймворке Tensorflow / Keras.

TensorFlow

Начнём с простых тестов, входящих в примеры пакета Keras. Сравнивать будем с Tesla-ми, предоставляемыми в Google Colab. И хотя бесспорно Google делит производительность GPU, для нас важно понять, насколько ваша локальная GPU сопоставима с тем, что вам дают в облаке.

Результаты тестов примеров Keras

Перед нами та самая причина, по которой я решил не делать стандартные тесты Resnet/CIFAR10. Вот, пожалуйста: на простеньких вычислениях 280-долларовая видеокарта показывает сопоставимую производительность с профессиональными GPU стоимостью более 5K$.

Давайте возьмём реальную задачу на реальное обучение, ну например проект анализа текста с помощью цепей Маркова, известный как Textgenrnn и запустим обучение на небольшом текстовом файле объёмом 2.59 Мб с параметром Batch_size=256.

Результат обучения TextgenRNN

Ну практически, реальная скорость видеокарты сопоставима с тем, что вам может выпасть в бесплатном аккаунте Google Colab, и можно сколь угодно долго рассуждать об оптимизации приложений и объёме ОЗУ, который позволяет увеличивать параметр batch_size, но на небольших моделях это не даёт никаких преимуществ, кроме быстрого перехода к "оверфиту".

Minergate

Заканчивая наше тестирование, хочется привести результат работы видеокарты на майнинге Etherium с настройками по умолчанию.

Энергопотребление и тепловой пакет

Игровая видеокарта не нуждается в каком-то дополнительном обдуве, и конечно её система охлаждения не рассчитана на работу в режиме 24x7 при максимальной загрузке. К счастью, максимально загрузить GPU - надо ещё постараться, а в обычном ATX корпусе плата показала следующие результаты:

  • Режим простоя: 17 Вт, 38 градусов Цельсия, 1000 RPM
  • TensorFlow Keras Textgenrnn: 95 Вт, 60 градусов Цельсия, 1753 RPM
  • Furmark: 124.8 Вт, 69 градусов Цельсия, 2271 RPM

Регулировка скорости - плавная, карта подчёркнуто медленно сопротивляется тому, чтобы прибавить скорости на лопастях, но при этом так же неохотно замедляет свой кулер. В общем, с точки зрения акустического комфорта - нормально.

Выводы

Перед нами прекрасная видеокарта для "микро-облака", которое вы можете собрать в форм-факторе Mini_ITX, поставить на шкаф или в кладовку, и периодически нагружать через Jupiter расчётами ваших проектов. На момент нашего обзора для GTX 1660 Super ещё не было официальных драйверов под Linux, но их появление - лишь вопрос времени. А так, хорошая система охлаждения с 3 теплопроводящими трубками и компактный форм-фактор - это практически идеальный вариант для самосбора, в котором надо быть уверенным только в том, что плата влезет в корпус по высоте. Сегодня это любой современный корпус, кроме телекоммуникационных высотой 3U и некоторых лежачих моделей для HTPC под телевизор. Хотя, о чём мы говорим? Не бывает низких игровых видеокарт, и Palit GTX 1660 Super ничем здесь не выделяется.

Конечно, то, что у Palit GTX 1660 Super не останавливается вентилятор в режиме простоя - недостаток, но уровень шума карты в это время находится ниже фона и не поддаётся измерению, то есть пока кулер новый, эта плата вас доставать жужжанием не будет. Ну и три теплопроводящие трубки - это готовность видеокарты работать в любых условиях, даже в компактных плохопродуваемых корпусах.

Михаил Дегтярев (aka LIKE OFF)
12/11.2019




ПОХОЖИЕ СТАТЬИ:

Экспресс-тест видеокарты Palit GeForce RTX 2080 Super в задачах машинного обучения

Если вы выбираете GPU не только для игр, но и для научных расчётов, вам интересно видеть видеокарту с тензорными ядрами и современной памятью GDDR6 объёмом 8 Гб. Благодаря поддержке FP16, в некоторых теслах она показывает кратное п...

Что такое Edge Computing и почему граничные вычисления - это побег из облака

Подумайте об устройствах, которые следят за производственным оборудованием на заводе, или видеокамере, которая отправляет запись в реальном времени из удаленного офиса. Пока устройство одно, передавать их по сети довольно легко, но...

Переход с Intel Xeon на AMD EPYC: развенчиваем мифы, обходим подводные камни

Рядовые сисадмины и крупные IT-директора, когда речь заходит об AMD, задают порой совершенно детские вопросы, а мы на них отвечаем. Совместимость с существующим стэком, снижение TCO, вопросы производительности и поддержки.

...

5 основных отличий рабочей станции от настольного ПК

И маленький компьютер для бухгалтера, и рендер-станцию на 6 видеокарт в понимании производителей ПК можно обозвать словом «Workstation», так что если уж руководство поставило перед вами задачу выбора «Рабочей станции», то чтобы не ...

Каковы шансы у AMD на серверном рынке? Часть 2.

Для успешного возвращения на серверный рынок AMD задумала максимально унифицировать производство, связав воедино принципы микроархитектуры Zen, идеологию чипа и финальной сборки процессоров

...

НА ФОРУМЕ ГОВОРЯТ



НОВЫЕ СТАТЬИ
Обзор трёх miniITX корпусов CrownMicro серии CMC-170

Сегодня речь пойдёт о трёх корпусах бренда CrownMicro для сборки ультракомпактных miniITX систем, а именно: CMC-170-113, CMC-170-303 и CMC-170-803. Эти модели имеют стильный дизайн, внешние блоки питания, VESA крепление...

Экспресс-тест видеокарты Palit GeForce RTX 2080 Super в задачах машинного обучения

Если вы выбираете GPU не только для игр, но и для научных расчётов, вам интересно видеть видеокарту с тензорными ядрами и современной памятью GDDR6 объёмом 8 Гб. Благодаря поддержке FP16, в некоторых теслах она показывает...