Home » Новости архитектуры RDNA 3 и представление Radeon RX 7900 XTX и RX 7900 XT

Новости архитектуры RDNA 3 и представление Radeon RX 7900 XTX и RX 7900 XT

Вчера вечером AMD представила новое поколение Radeon серии RX 7000 с новой архитектурой RDNA 3. У нас есть больше информации об изменениях в архитектуре, первые снимки производительности без трассировки лучей и с ней, подробные параметры, цены. Чего не хватает, так это сравнения производительности с конкурентами, но даже с этим хоть что-то можно сделать.

13 декабря должны быть запущены первые две модели нового поколения Radeon с архитектурой RDNA 3, которую AMD описывает как «самую передовую игровую графику в мире». AMD представила их вчера после девяти часов в виде вечерней презентации.

Предполагается, что более мощная модель RX 7900 XTX обеспечит до 70% прироста производительности в разрешении 4K по сравнению с топовой моделью предыдущего поколения RX 6950 XT.

На данный момент, пожалуй, самое полное выступление с полной презентацией. Опубликовано Anandtech, вы также можете найти его в конце статьи в галерее. В статье Anadtech также есть некоторые детали, которые не были услышаны в презентации на Youtube, поэтому мы будем использовать ее как первоисточник. Информации было много, но времени не хватило, поэтому, наверное, буду добавлять понемногу на регулярной основе. Дополнительную информацию вы можете найти непосредственно на сайте AMD, где вскоре после публикации презентации я Страницы продукта RX 7900 XTX, РХ 7900 ХТ а также немного разговоров к архитектуре RDNA3.

Navi 31 — это первый игровой графический чип, в котором используется чиплетная конструкция. Чип разделен на два типа блоков: графический вычислительный кристалл (GCD), произведенный по 5-нм техпроцессу TSMC, и несколько кристаллов кэш-памяти (MCD), произведенный по 6-нм техпроцессу TSMC.

Весь графический чип, включая чиплеты, имеет 58 миллиардов транзисторов (у Navi 21 их было 26,8 миллиардов). AMD не указывает количество транзисторов в чиплете. Сам графический чип GCD имеет площадь 300 мм².

Он содержит вычислительные блоки, вспомогательные блоки, дисплейный движок и медиа-движок, практически все, что было в прошлом поколении. Убраны Infinity Cache и контроллеры памяти.

Чипы с архитектурой RDNA3 могут быть оснащены различным количеством микросхем MCD. Каждый из шести чиплетов MCD содержит буфер Infinity Cache второго поколения (кеш L3) и контроллер памяти GDDR6 64b (или 2x 32b) и имеет площадь 37 мм², количество транзисторов в чиплете не уточняется. драм.

Read more:  Обзор "Jane's Patisserie Everyday" - Entertainment Focus

Маркетинг AMD пытается продавать чиплеты так, как будто они произвели ту же революцию с RDNA3, что и с Ryzen несколько лет назад, но я не могу не чувствовать, что в этой форме это не то же самое. В случае с Ryzen основная часть процессора — вычислительные ядра — перенесена в чиплеты, а в чиплетах Radeon есть бесконечный кеш, т.е. буферная память, и контроллеры памяти.

А вот чиплеты с памятью рядом с GPU — не такая уж и революционная вещь для Радеонов. AMD уже пробовала их с Radeon Fury и Vega, у которых были «чиплеты» с памятью HBM и HBM2, расположенные рядом с графическим процессором. В принципе, разница скорее в том, что если в R9 Fury и RX Vega чиплеты выполняли непосредственно функции видеопамяти карты, то в Radeon RX 7900 они имеют значительно меньший объем, подключаются гораздо более быстрым интерфейсом и функционируют как видеопамять. Бесконечный кэш-буфер. Но произошел значительный сдвиг в плане скорости связи с чиплетами и общей пропускной способности. А еще в чиплетах есть контроллеры, роль видеопамяти играет классическая GDDR6, с которой чип общается через контроллеры в чиплетах.

Чиплеты RDNA3 больше похожи на момент «дзен» в процессорах тем, что, перемещая бесконечный кэш за пределы графического процессора, монолит можно разрезать на более мелкие части, тем самым повышая производительность и удешевляя производство. Это также позволяет изготавливать различные части чипа с использованием различных производственных процессов. Но даже здесь я не могу отделаться от ощущения, что в этом поколении экономия не будет такой драматичной. Сам GPU должен иметь площадь всего 300 мм², а содержит шесть более дешевых чипсетов площадью 37 мм². По сравнению с RTX 4090, чей чип AD102 имеет площадь 608,5 мм², это огромная разница, но все строят новые Радеоны больше против GeForce RTX 4080, чей чип AD103 должен иметь площадь 379 мм². , и пусть он дороже в производстве, но для разнообразия у него будет более простая и дешевая герметизация.

Read more:  Водитель UBER остановил гонку, чтобы помочь жителям

В полной конфигурации у RX 7900 XTX активны все шесть MCD, у RX 7900 XT — 5 активных MCD, один нерабочий и служит прокладкой. Преимущества производства MCD с использованием лучшего 5-нм техпроцесса будут минимальными, поэтому AMD решила использовать для них более дешевый 6-нм техпроцесс.

RX 7900 XTX с шестью активными MCD предлагает 384-битную шину памяти GDDR6 и 96 МБ кэш-памяти L3.

С пятью активными MCD в RX 7900 XT мы получаем шину 320 бит для GDDR6 и 80 МБ кэш-памяти L3. Даже у более мощной модели кэш Infinity немного меньше, чем у RX 6800 XT и выше моделей с Navi 21, у которых объем кэша составлял 128 МБ. Говорят, что уменьшение емкости стало возможным благодаря улучшениям, позволяющим повторно использовать данные, хранящиеся в кеше. AMD не предоставила более подробной информации.

Для достижения необходимой пропускной способности AMD использовала технологию инкапсуляции Elevated Fanout Bridge (EFB), впервые примененную в ускорителях серии MI200 (CDNA2). В них он соединял GPU и память HBM2e, в RDNA 3 используется для подключения MCD к GCD. Общая пропускная способность между MCD и GCD составляет 5,3 ТБ/с.

RDNA3 наследует ряд элементов от RDNA2 и RDNA, но также произошли частичные, но существенные изменения.

Наиболее значительным изменением в чипе является редизайн АЛУ. AMD удвоила количество ALU (потоковых процессоров) в вычислительном блоке (CU) с 64 ALU в одном двойном вычислительном блоке до 128. AMD добилась этого не за счет их удвоения, а за счет предоставления им возможности двойной обработки с помощью инструкций по обработке. . Таким образом, каждая дорожка SIMD может выполнять до двух инструкций за один цикл. Однако это можно сделать не всегда, только для инструкций, которые могут выполняться параллельно. Если его нельзя выполнять параллельно, АЛУ работает как классический.

Read more:  Обзор Афкона: ДР Конго обыграла Египет по пенальти и вышла в четвертьфинал Гвинеи | Кубок африканских наций 2023

На практике это означает, что не всегда возможно полностью использовать АЛУ, а теоретическое значение FLOPS, заявленное для RDNA3, нельзя напрямую сравнивать с FLOPS для RDNA2. В идеальном случае вычислительная мощность 7900 XTX в FP32 составляет 2,6 раза, а в реальности она ниже, из-за чего AMD заявляет о приросте производительности в 1,7 раза.

Из-за этого изменения, вероятно, будет некоторая путаница в отчетах о количестве потоковых процессоров, прежде чем номенклатура каким-то образом утрясется. В спецификациях AMD указано 6144 потоковых процессора для RX 6700 XTX и 5376 потоковых процессоров для RX 7900 XT, но в некоторых материалах вы найдете удвоенные значения.

Еще одно существенное изменение — это отдельные блоки ускорения вычислений, используемые для ИИ. AMD пока ничего о них не рассказала. Говорят, что каждый CU RDNA 3 содержит два ускорителя ИИ с поддержкой новых инструкций, благодаря которым RX 7900 XTX должен выполнять вычисления с bfloat16 в 2,7 раза быстрее, чем RX 6950 XT.

AMD может использовать их в будущем, например, как Nvidia для DLSS, но пока нет информации о том, что разработчики планируют это сделать (и это также будет означать, что новые итерации FSR ограничены Radeon 7000). На данный момент они будут более важны для профессионального использования.

Еще одно изменение, внесенное AMD, — это разделение шейдерных и внешних часов. AMD говорит, что это должно обеспечить большую эффективность. Шейдеры работают на частоте 2,3 ГГц (это заявленная игровая частота), в то время как передняя часть чипа работает на более высокой частоте 2,5 ГГц. На чипе шейдеры занимают значительно большую площадь, чем фронтенд, поэтому небольшое снижение тактовых частот положительно сказалось на потреблении всего чипа. В то же время это должно помочь обеспечить более сбалансированную работу обеих частей и отсутствие недостатков ни в одной из них.

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.