NVIDIA Fermi – процессор из трех миллиардов транзисторов
Сама NVIDIA рассматривает Fermi, а также платформу для портативной электроники Tegra в качестве основополагающих элементов для успешного ведения бизнеса в следующем году. По этой причине в NVIDIA пока отказываются раскрывать дополнительную информацию об архитектуре Fermi, в частности, ничего не известно о производительности графических процессоров при обработке трехмерной графики. Сообщается, что грядущие новинки будут производительнее своих конкурентов, но сколь значительным окажется отрыв NVIDIA Fermi, пока не ясно – можно только строить предположения. Впрочем, это абсолютно не отменяет того факта, что архитектура NVIDIA Fermi обладает целым спектром уникальных особенностей, которые уже сегодня привлекают к ней внимание не только пользователей ПК, но и научного сообщества.
Вместо резюме ко всему вышесказанному предлагаем читателям еще раз ознакомиться с основными преимуществами архитектуры NVIDIA Fermi по сравнению со своими предшественниками, и вспомнить, за счет чего новейшие графические процессоры будут завоевывать сердца геймеров и, в не меньшей степени, профессиональных пользователей, работающих с серьезным и чрезвычайно требовательным к аппаратным ресурсам программным обеспечением.
Сравнительные характеристики процессоров G80, GT200 и Fermi:
Процессор |
G80 |
GT200 |
Fermi |
Количество транзисторов |
681 млн |
1,4 млрд |
3,0 млрд |
Вычисления с плавающей запятой двойной точности |
Не поддержи- ваются |
30 FMA операций за такт |
256 FMA операций за такт |
Вычисления с плавающей запятой одинарной точности |
128 MAD операций за такт |
240 MAD операций за такт |
512 MAD операций за такт |
Warp-планировщики (на один SM-блок) |
1 |
1 |
2 |
Блок специализированных функций (на один SM-блок) |
2 |
2 |
4 |
Разделяемая память (на один SM-блок) |
16 Кб |
16 Кб |
С возможно- стью конфигу- рации 16 Кб или 48 Кб |
Кэш-память первого уровня (на один SM-блок) |
Нет |
Нет |
С возможно- стью конфигу- рации 16 Кб или 48 Кб |
Кэш-память второго уровня |
Нет |
Нет |
768 Кб |
Поддержка кода коррекции |
Нет |
Нет |
Да |
Параллельная обработка программных ядер (kernels) |
Нет |
Нет |
До 16 |
Адресация памяти |
32 разрядная |
32 разрядная |
64 разрядная |
Главные особенности архитектуры NVIDIA Fermi:
- увеличение количества CUDA-блоков до 32 штук на каждый потоковый процессор;
- восьмикратное увеличение пиковой производительности при вычислениях с плавающей запятой двойной точности (по сравнению с GT200);
- двойной блок планировки Dual Warp Scheduler одновременно планирует и отправляет на обработку инструкций из двух пулов (warp) одновременно;
- 64 Кб RAM-памяти с конфигурируемым разделением и кэш-память первого уровня;
- унифицированное адресное пространство с полной поддержкой языка С++;
- оптимизация для работы с OpenCL и DirectCompute;
- IEEE 754-2008 32-разрядная и 64-разрядная точность;
- значительно улучшенная подсистема памяти: иерархия NVIDIA Parallel DataCache с конфигурируемой кэш-памятью первого уровня и унифицированной кэш-памятью второго уровня;
- впервые для графических процессоров реализована поддержка кода ECC;
- значительно повышенная производительность при работе с атомарными операциями;
- параллельная обработка программных ядер (kernels).
Proteus
08/10.2009