VK
Twitter
Telegram
Viber
Linkedin
WhatsApp

С момента летнего анонса графических процессоров NVIDIA мы посвятили немало страниц продуктам на основе нового кремния — GeForce RTX 2080, RTX 2080 Ti, да и самой архитектуре Turing. И судя по тому, как выступили в тестах старшие модели двадцатой серии, складывается впечатление, что главное в видеокартах RTX — это именно новые функций рендеринга, трассировка лучей и акселерация сетей машинного обучения, а вовсе не «сырая» производительность. Это особенно заметно на примере GeForce RTX 2080, который оказался полным аналогом GeForce GTX 1080 Ti в существующих играх и продается по сопоставимым ценам. Зато младшая модель, GeForce RTX 2070, по всей видимости, готова предложить то, чего хотят геймеры, без энтузиазма настроенные по отношению к трассировке лучей в компьютерных играх, а именно — больше FPS за те же деньги!

⇡#Технические характеристики

TU106 — единственный из трех процессоров архитектуры Turing, который дошел до потребительских устройств с нетронутой конфигурацией вычислительных блоков, в то время как GeForce RTX 2080 и RTX 2080 Ti получили урезанные варианты TU104 и TU102. По количеству CUDA-ядер одинарной точности и блоков наложения текстур RTX 2070 находится в промежутке между двумя устройствами на основе GP104 — GeForce GTX 1070 и GTX 1080. Кроме того, согласно референсным данным, RTX 2070 рассчитан на боле низкие тактовые частоты, чем GTX 1080, а кристалл сам по себе содержит в полтора раза больше транзисторов. Неудивительно, что вопрос сравнения с GTX 1080 стоит для RTX 2070 столь же остро, как для RTX 2080 — с GTX 1080 Ti. Однако графическим процессорам Turing помогает обновленная архитектура потоковых мультипроцессоров (SM) и большой объем кешей L1 и L2. Благодаря этим нововведениям новинке будет проще достигнуть проектного быстродействия в реальных задачах, чем GTX 1080, пусть на бумаге чип семейства Pascal имеет большое преимущество. Наконец, GeForce RTX 2070 и GTX 1080 обладают одинаковой разрядностью шины памяти (256 бит), но пиковая пропускная способность у RTX 2070 на целых 40 % больше за счет микросхем GDDR6, работающих на скорости 14 Гбит/с на контакт, даже без учета прогрессивных алгоритмов компрессии цвета, появившихся в архитектуре Turing.

Что касается логики трассировки лучей и обработки данных нейросетями (inference), то внутри потокового мультипроцессора Turing соотношение между вычислительными блоками различных типов, включая CUDA-ядра FP32, блоки наложения текстур, RT- и тензорные ядра, не зависит от общего количества SM, поэтому ошибочно считать, что новые функции даны GeForce RTX 2070 лишь для того, чтобы оправдать буквы RTX в названии. В играх, которые освоят новые приемы рендеринга, скорее всего, сохранится тот баланс быстродействия между различными моделями 20-й серии, который сегодня мы увидим в тестах стандартного ПО под Direct3D 11 и 12.

Производитель NVIDIA
Название GP104 GP102 GP100 GV100 TU106 TU104 TU102
Микроархитектура Pascal Pascal Pascal Volta Turing Turing Turing
Техпроцесс, нм 16 nm FinFET 16 nm FinFET 16 nm FinFET 12 нм FFN 12 нм FFN 12 нм FFN 12 нм FFN
Число транзисторов, млн 7 200 12 000 15 300 21 100 10 800 13 600 18 600
Площадь чипа, мм2 314 471 610 815 445 545 754
Конфигурация SM/TPC/GPC
Число SM 20 30 60 84 36 48 72
Число TPC 20 30 30 42 18 24 36
Число GPC 4 6 6 6 3 6 6
Конфигурация потокового мультипроцессора (SM)
FP32-ядра 128 128 64 64 64 64 64
FP64-ядра 4 4 32 32 2 2 2
INT32-ядра Н/Д Н/Д Н/Д 64 64 64 64
Тензорные ядра Н/Д Н/Д Н/Д 8 8 8 8
RT-ядра Н/Д Н/Д Н/Д Н/Д 1 1 1
Программируемые вычислительные блоки GPU
FP32-ядра 2 560 3 840 3 840 5 376 2 304 3 072 4 608
FP64-ядра 80 120 1 920 2 688 72 96 144
INT32-ядра Н/Д Н/Д Н/Д 5 376 2 304 3 072 4 608
Тензорные ядра Н/Д Н/Д Н/Д 672 288 384 576
RT-ядра Н/Д Н/Д Н/Д Н/Д 36 48 72
Блоки фиксированной функциональности
TMU (блоки наложения текстур) 160 240 240 336 144 192 288
ROP 64 96 128 128 64 64 96
Конфигурация памяти
Объем кеша L1 / текстурного кеша, Кбайт 48 48 24 ≤ 128 из 128, общий с разделяемой памятью 32/64 из 96 (общий с разделяемой памятью) 32/64 из 96 (общий с разделяемой памятью) 32/64 из 96 (общий с разделяемой памятью)
Объем разделяемой памяти / SM, Кбайт 96 96 64 ≤ 96 из 128 (общий с кешем L1) 32/64 из 96 (общий с кешем L1) 32/64 из 96 (общий с кешем L1) 32/64 из 96 (общий с кешем L1)
Объем регистрового файла / SM, Кбайт 256 256 256 256 256 256 256
Объем регистрового файла / GPU, Кбайт 5 120 7 680 15 360 21 504 9 216 12 288 18 432
Объем кеша L2, Кбайт 2 048 3 072 4 096 6 144 4 096 4 096 6 144
Разрядность шины RAM, бит 256 384 4 096 4 096 256 256 384
Тип микросхем RAM GDDR5/GDDR5X GDDR5X HBM2 HBM2 GDDR6 GDDR6 GDDR6
Шина NVLINK Н/Д Н/Д 4 × NVLink 1.0 x8 6 × NVLink 2.0 x8 Н/Д 1 × NVLink 2.0 x8 2 × NVLink 2.0 x8

Формально GeForce RTX 2070 пришел на замену GTX 1070, и в этой паре техническое преимущество Turing не вызывает сомнений, но рекомендованные розничные цены ($499 для партнерских видеокарт) сделали новинку преемником GeForce GTX 1080. Видеокарты Founders Edition, доступные напрямую от NVIDIA, в этом поколении стали дороже ($599 за GeForce RTX 2070 FE вместо $549 за GeForce GTX 1070 FE) и фактически конкурируют с топовыми модификациями сторонних производителей — повышенные тактовые частоты и качество конструкции это позволяют.

Производитель NVIDIA
Модель GeForce GTX 1070 GeForce GTX 1080 GeForce GTX 1080 Ti GeForce RTX 2070 GeForce RTX 2080 GeForce RTX 2080 Ti
Графический процессор
Название GP104 GP104 GP102 TU106 TU104 TU102
Микроархитектура Pascal Pascal Pascal Turing Turing Turing
Техпроцесс, нм 16 нм FinFET 16 нм FinFET 16 нм FinFET 12 нм FFN 12 нм FFN 12 нм FFN
Число транзисторов, млн 7 200 7 200 12 000 10 800 13 600 18 600
Тактовая частота, МГц: Base Clock / Boost Clock 1 506 / 1 683 1 607 / 1 733 1 480 / 1 582 1 410 / 1 620 (Founders Edition: 1 410 / 1 710) 1 515 / 1 710 (Founders Edition: 1 515 / 1 800) 1 350 / 1 545 (Founders Edition: 1 350 / 1 635)
Число шейдерных ALU 1 920 2 560 3 584 2304 2944 4352
Число блоков наложения текстур 120 160 224 144 184 272
Число ROP 64 64 88 64 64 88
Оперативная память
Разрядность шины, бит 256 256 352 256 256 352
Тип микросхем GDDR5 SDRAM GDDR5X SDRAM GDDR5X SDRAM GDDR6 SDRAM GDDR6 SDRAM GDDR6 SDRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с) 2 000 (8 000) 1 250 (10 000) 1 376,25 (11 010) 1 750 (14 000) 1 750 (14 000) 1 750 (14 000)
Объем, Мбайт 8 192 8 192 11 264 8 192 8 192 11 264
Шина ввода/вывода PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты) 6 463 8 873 11 340 7 465 / 7 880 (Founders Edition) 10 069 / 10 598 (Founders Edition) 13 448 / 14 231 (Founders Edition)
Производительность FP32/FP64 1/32 1/32 1/32 1/32 1/32 1/32
Пропускная способность оперативной памяти, Гбайт/с 256 320 484 448 448 616
Вывод изображения
Интерфейсы вывода изображения DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DL DVI-D, DisplayPort 1.3/1.4, HDMI 2.0b DisplayPort 1.3/1.4, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b
TBP/TDP, Вт 150 180 250 175/185 (Founders Edition) 215/225 (Founders Edition) 250/260 (Founders Edition)
Розничная цена (США, без налога), $ 349 (рекомендованная) / 399 (Founders Edition, nvidia.com) 499 (рекомендованная) / 549 (Founders Edition, nvidia.com) НД (рекомендованная) / 699 (Founders Edition, nvidia.com) 499 (рекомендованная) / 599 (Founders Edition, nvidia.com) 699 (рекомендованная) / 799 (Founders Edition, nvidia.com) 999 (рекомендованная) / 1 199 (Founders Edition, nvidia.com)
Розничная цена (Россия), руб. НД (рекомендованная) / 31 590 (Founders Edition, nvidia.ru) НД (рекомендованная) / 45 790 (Founders Edition, nvidia.ru) НД (рекомендованная) / 52 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 47 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 63 990 (Founders Edition, nvidia.ru) НД (рекомендованная) / 95 990 (Founders Edition, nvidia.ru)

На примере Founders Edition мы познакомились со старшими моделями 20-й серии, но в случае GeForce RTX 2070 сразу начнем с партнерских видеокарт. AORUS GeForce RTX 2070 — наиболее совершенная модификация RTX 2070 в каталоге GIGABYTE. Базовый вариант этого устройства (артикул GV-N2070AORUS-8GC) работает на более высоких тактовых частотах, чем RTX 2070 Founders Edition (1770 против 1710 МГц) а у версии XTREME (GV-N2070AORUS X-8GC) расчетная частота GPU под нагрузкой составляет 1815 МГц. Кроме того, в AORUS GeForce RTX 2070 XTREME разогнана оперативная память, пусть и на чисто символические 142 МГц эффективной частоты. Штатное энергопотребление видеокарт производитель не указывает, но оба устройства наверняка выходят за пределы 185 Вт, заявленных для GeForce RTX 2070 FE.

Во всяком случае тот аспект, в котором видеокарта GIGABYTE явно не уступает GTX 2070 Founders Edition, — это розничные цены: на площадке Newegg просят $599 за базовую AORUS GeForce RTX 2070 и $620 за версию XTREME. В России, напротив, цены начинаются с 46 865 руб., а это даже меньше, чем стоимость Founders Edition в официальном магазине NVIDIA. С другой стороны, самые доступные модификации GeForce RTX 2070, которые только можно найти на торговых площадках США и в московских интернет-магазинах, продаются за $500 либо 36 581 руб. Да и видеокарты прошлого поколения заметно упали в цене, после того как в продаже появились GeForce 20-й серии — вплоть до $470 за GeForce GTX 1080 и $449 за Vega 64. Российский рынок эту коррекцию принимает с опозданием, у нас GeForce RTX 2070 оказывается самым выгодным предложением в своей категории производительности, тогда как GTX 1080 и Vega 64 пока только начали терять в цене.

⇡#Конструкция

Пусть графический процессор TU106 относится к третьему эшелону чипов Turing, фактические характеристики кремния задают совсем иные требования к обвязке видеокарт, нежели у GP106. С такими габаритами, как у AORUS GeForce RTX 2070 XTREME, система охлаждения вполне смогла бы обслужить и более мощные GPU. По высоте видеокарта занимает три полных слота расширения, но большая часть объема приходится вовсе не на радиатор, а на блок вентиляторов. Разработчики поместили внутрь пластиковой рамы три крыльчатки диаметром 100 мм, но длину устройства удалось сэкономить за счет того, что ребра вентиляторов имеют разую высоту и их окружности пересекаются. Центральный вентилятор вращается по часовой стрелке, а боковые — против, благодаря чему снижается турбулентность воздушного потока. К счастью, столь сложная конструкция защищена от повреждений перекладинами кожуха, ведь посторонний предмет, попавший в лопасти, может мгновенно привести в негодность все три крыльчатки.

Когда видеокарта включена, каждый вентилятор окружен ярким ободком, который пропадает, как только кулер переходит в пассивный режим. Раскрыть иллюзию не так уж просто, ведь здесь нет ни прозрачных колец, ни спрятанных под вентиляторами источников света. На самом деле, в одну из лопастей крыльчатки встроен RGB-светодиод, синхронизированный с тахометром вентилятора таким образом, что человек видит разноцветные полоски, медленно ползущие вокруг центра вращения.

Окошки с логотипом AORUS в торце и на задней поверхности кожуха имеют собственную подсветку. Оттенок и режим работы всех светодиодов регулируются фирменным ПО AORUS Engine. Вот только для того, чтобы постоянно лицезреть это великолепие, владельцу устройства GIGABYTE понадобится не только корпус с прозрачным окном, но и райзер PCI Express, позволяющий смонтировать видеокарту параллельно системной плате.

Охлаждение компонентов PCB выполняет радиатор, скрепленный пятью тепловыми трубками. В то время как иные производители используют для передачи тепла с кристалла GPU полированное основание, а подчас даже испарительную камеру, GIGABYTE предпочитает прямой контакт между чипом и расплющенными концами тепловых трубок. Для чипов памяти GDDR6 и компонентов регулятора напряжения (причем не только полевых транзисторов, но и дросселей с конденсаторами) к оребрению припаяны отдельные пластины. Даже алюминиевый щиток на задней стороне печатной платы участвует в охлаждении текстолита под микросхемами RAM.

⇡#Печатная плата

Первое, что бросается в глаза на PCB этой видеокарты, — семь разъемов для вывода изображения (три DisplayPort, три HDMI и USB Type-C с интерфейсом DisplayLink), в то время как GeForce RTX 2070 Founders Edition и большинство партнерских видеокарт имеют лишь пять. Но не все так просто: сам графический процессор способен одновременно использовать четыре выхода, а на плате нет коммутатора видеосигнала для того, чтобы преодолеть это ограничение. В итоге пользователю всегда доступны только три разъема — DisplayPort, HDMI и USB. Оставшиеся четыре разделены на два блока: активна либо пара DisplayPort, либо два HDMI — в зависимости от того, к какому блоку подключено устройство вывода изображения. Причем сменить конфигурацию на лету нельзя, активный блок разъемов определяется при перезагрузке компьютера.

Напряжение на видеокарту подается по шести- и восьмиконтактному разъемам, что в комбинации с силовыми линиями слота PCI-Express обеспечивает резерв мощности в 300 Вт. VRM содержит 10 фаз питания графического процессора и две — чипов GDDR6 (GeForce RTX 2070 Founders Edition ограничена формулой 6+2). На текстолите пустуют места для распайки элементов двух дополнительных фаз питания GPU — по всей видимости, такая же плата, но с полностью укомплектованным VRM, лежит в основе модели AORUS GeForce RTX 2070 WATERFORCE. Как и в Founders Edition, здесь используются только твердотельные конденсаторы и полевые транзисторы с интегрированным драйвером, а также сразу два ШИМ-контроллера uPI uP9512P (разработчики не пошли по простому пути удвоения фаз), которые умеют варьировать число активных фаз для поддержания высокого КПД во всем диапазоне потребляемой мощности.

Микросхемы памяти с маркировкой 8SA77 D9WCW выпущены на фабрике Micron и характеризуются пропускной способностью 14 Гбит/с на контакт. Говорят, что NVIDIA уже применяет аналогичные чипы Samsung в потребительских видеокартах семейства Turing, но нам такие устройства пока не попадались.

Источник: 3dnews