Сегодня Nvidia выпускает GeForce RTX 4090, а вместе с ней и новое поколение GeForce. Для самых требовательных RTX 4090 — первая топовая модель в линейке.Прирост производительности по сравнению с предыдущим поколением экстремальный, и за это платят потребление и цена. Но, что удивительно, эксплуатационные характеристики от большого расхода существенно не страдают.
GeForce RTX 4090: введение и параметры
Мы уже немного рассказывали о GeForce RTX 4090 на PCTuning во время его презентации и распаковки. Сегодня я предлагаю вам первую партию тестов. У меня не было много времени, чтобы протестировать все, поэтому для начала это будет короче, чем обычно, а подробности и более подробные тесты мы рассмотрим в следующих статьях.
Я тестировал в основном в разрешении 4K, но часто можно найти результаты и в более низких разрешениях. Иногда на них видно, что замер часто показывает не производительность карты по сравнению с предыдущим поколением, а то, что текущее поколение процессоров часто не успевает ее подпитать.
Графики прекрасно ясны, потому что в них не будет многого. Из-за нового поколения я заменил старый Core i9-10900K на более новый Core i7-12700K с более высокой тактовой частотой и более быстрой памятью DDR5. Большинство игр также были изменены на более новые, и это не окончательная методология, а все еще в некоторой степени предварительная, потому что в последнее время не было выпущено много графически сложных, требовательных и хорошо оцененных игр. Другая проблема заключается в том, что методология тестирования новых карт плохо подготовлена без новых карт — по крайней мере, в случае с GTX 4090, которую вы понимаете только в тот момент, когда берете ее в руки, что тесты недостаточно требовательны. В этом году, надеемся, нас ждет несколько интересных вещей, возможно, они будут добавлены в методику.
Мы представили карту снаружи, когда распаковывали ее на прошлой неделе, если вы пропустили, в следующей главе я повторю хотя бы основы построения карты. RTX 4090 Founders Edition представляет собой массивный металлический кирпич, занимающий место трех слотов в компьютере, а четвертый слот под ним все же хорошо оставить свободным, чтобы кулеру было куда подсасывать воздух. Причина в основном в высоком потреблении карты — предел мощности у нее сумасшедшие 450 Вт, но я вас, наверное, уже ничем не удивлю. Удивительно, но трехслотовому кулеру это доставляет не так много проблем — по эксплуатационным характеристикам он лучше многих моделей предыдущих поколений при значительно меньшем потреблении.
Параметры задаем через таблицу, параметры других карт предыдущих поколений на одну таблицу ниже.
Модель | RTX Титан | RTX 3080 Ти | RTX 3090 | RTX 3090 Ти |
Графический чип | ТУ201-400-А1 | ГА 102-225-А1 | ГА 102-300-А1 | ГА 102-350 |
Производственный процесс | TSMC 12 нм | Самсунг 8 нм 8N | Самсунг 8 нм 8N | Самсунг 8 нм 8N |
Площадь чипа | 754 мм² | 628 мм² | 628 мм² | 628 мм² |
Количество транзисторов | 18,6 млд. | 28,3 млд. | 28,3 млд. | 28,3 млд. |
Кластер графической обработки (GPC) | 6 | 7 | 7 | 7 |
Потоковая мультипроцессорность (SM) | 72 | 80 | 82 | 84 |
Потоковая мультипроцессорность (SM) | 96 | 112 | 112 | 112 |
Потоковые процессоры (ядра CUDA) | 4 608 | 10 240 | 10 496 | 10 752 |
Блоки текстурирования (TMU) | 288 | 320 | 328 | 336 |
Ядра РТ | 72 | 80 | 82 | 84 |
Тензор Ядра (Tensor Colors) | 576 | 320 | 328 | 336 |
Основной ритм | 1 350 МГц | 1 365 МГц | 1 395 МГц | 1 560 МГц |
Повышение такта | 1 770 МГц | 1 665 МГц | 1 695 МГц | 1 860 МГц |
Объем памяти | 24 ГБ | 12 ГБ | 24 ГБ | 24 ГБ |
Тип памяти | GDDR6 | GDDR6X | GDDR6X | GDDR6X |
Ширина шины | 384 б | 384 б | 384 б | 384 б |
Скорость памяти | 14,0 Гбит/с | 19,0 Гбит/с | 19,5 Гбит/с | 21,0 Гбит/с |
Удар памяти | 1 750 МГц | 1 188 МГц | 1 219 МГц | 1 313 МГц |
Общая пропускная способность памяти | 672,0 ГБ/с | 912,4 ГБ/с | 936,2 ГБ/с | 1,0 ГБ/с |
Интерфейс | PCIe 3.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
Дополнительный источник питания | 2 × 8 контактов | 1 х 12 контактов (2 х 8 контактов) | 1 х 12 контактов (2 х 8 контактов) | 1 х 12 контактов (3 х 8 контактов) |
Максимальная мощность карты | 280 Вт | 350 Вт | 350 Вт | 450 Вт |
Начальная цена | 2 499 долларов США | 1 199 долларов США | 1 499 долларов США | 1 999 долларов США |
начальная цена с НДС (примерно 23,40 чешских крон/долл. США) |
74 700 чешских крон | 35 800 чешских крон | 44 800 чешских крон | 59 700 чешских крон |
Подробности о BIOS и других ограничениях Founders Edition будут раскрыты GPU-Z:
Ключевое новшество — технология DLSS 3. Повторю то, что мы написали друг другу после презентации:
ДЛСС 3
В DLSS 3, помимо возможности создавать новое изображение путем объединения неполного текущего изображения и более старых изображений с более высокой детализацией, также добавляется возможность добавления между ними другого изображения.
Кроме того, Nvidia добавляет технологию Optical Multi Frame Generation в сочетании с технологией ко всему процессу. Нвидиа Рефлекс для достижения низких задержек. Он обходит стандартную очередь рендеринга и в некоторой степени компенсирует задержку, вызванную необходимостью вставки пост-вычисленного кадра перед последним кадром рендеринга. Насколько сильно варьируется от названия к названию в зависимости от того, насколько Reflex помогает в этой игре. Но задержка по понятным причинам будет больше, чем с активным Reflex без использования DLSS 3.
Мы упоминали, что с DLSS алгоритм получает карту векторов движения. Но он не идеален, фиксирует, какие объекты движутся на изображении, но не содержит вещей, которые только накладываются на объекты при рендеринге в виде карты (текстуры) — например, к ним можно добавить отражения или тени.
Это происходит, например, с тенями мотоцикла, едущего по дороге:
Текстура дороги движется, но мотоцикл и его тень не двигаются относительно камеры, они отбрасываются на движущуюся дорогу. Нейросеть получает от игры информацию о том, что дорога на экране движется, и на основе этого стремится сдвинуть текстуру тени вместе с текстурой дороги.
Предполагается, что оптический поток обнаруживает и исправляет эти проблемные области. В (почти) реальном времени он генерирует другую карту с векторами движения элементов изображения на основе уже отрендеренных изображений. Благодаря этому он узнает, по каким элементам движение отличается от первой карты с векторами движения, и может передать их в нейросеть. В результате получается комбинация карты векторов движения из игры и карты векторов движения из визуализированных изображений, на основе которых DLSS может более точно реконструировать изображение. Затем он может уменьшить артефакты, возникающие там, где движение тел и движение других элементов изображения расходятся.