Через год AMD произведёт очередное массированное обновление линейки своих процессоров. Изменения коснутся основных вычислительных блоков, что должно положительным образом сказаться на росте производительности. Однако пока неизвестно, помогут ли эти изменения противостоять Intel Core Architecture на равных...
Всего каких-то 10 лет назад на компьютерном рынке всё было предельно просто. Intel производила самые быстрые и популярные процессоры для потребительского рынка, то и дело превосходя свои собственные достижения. У её конкурентов не было достойного аналога. Поэтому никакого усложнения не происходило: для трёх сегментов рынка (бюджетного, потребительского и серверного) выпускалось по одному семейству процессоров.
Выход процессора AMD Athlon перевернул всё с ног на голову. У Intel не было достойного ответа на момент анонса Athlon. С тех пор AMD хоть и осталась в отстающих, но её стали принимать всерьёз. Представление в 2003 году архитектуры AMD64 подтвердило серьёзные намерения второго производителя ЦП отвоевать как можно большую долю рынка.
Как раз в то время началось то самое усложнение. Вместе с Athlon 64 был выпущен первый Athlon 64 FX, который на самом деле был переименованным Opteron серии 100. Intel в ответ выпускает Pentium 4 Extreme Edition, оснащённый кэшем третьего уровня. По сути, это была разогнанная версия Xeon MP, выпускаемая в те времена.
Далее события стали развиваться по нарастающей: Pentium 4 5xx, Pentium 4 6xx, Pentium D, Core 2 Duo – все эти процессоры производятся до сих пор, и все они предназначаются только для настольного сегмента. Но на основе одних можно собирать более дешёвые компьютеры, а на основе других – более дорогие.
У AMD ситуация не лучше. Сегодня в настольном сегменте у неё минимум четыре процессора: Athlon 64 Sempron, Athlon 64, Athlon 64 X2 и Athlon 64 FX. Все они существуют в четырёх (!) исполнениях: Socket 754, Socket 939, Socket 940 и Socket AM2. Но в последнее время AMD встала на путь унификации процессорного разъёма, за что честь ей и хвала. Вскоре все настольные чипы перейдут «под крыло» Socket AM2, а экстремальные (как в плане быстродействия, так и в плане стоимости) Athlon 64 FX опять станут походить на серверные Opteron, но уже серии 2ххх, что выпускаются под Socket F.
Однако следующие два года готовят нам встречу с тремя новыми процессорными разъёмами AMD: Socket AM2+, Socket AM3 и Socket F+. С ними будут выпускаться чипы, основанные на архитектуре, условно названной K8L. Что это такое, какие процессоры будут представлены на её базе, а также смогут ли они дать достойный ответ производительным Intel Core 2 Duo – в этом мы и попробуем разобраться.
Архитектурные изменения Главная особенность обновлённой архитектуры K8 заключается во внесении изменений в алгоритмы вычисления. Эти так называемые архитектурные изменения должны будут вывести производительность процессоров AMD хотя бы на сравнимый с Core 2 Duo уровень. Конечно, при работе на одинаковых тактовых частотах.
Все процессоры K8 производят выборку команд из L1-кэша блоками по 16 байт. Такой темп позволяет умещать в один блок до четырёх команд длиной по 4 байт или до трёх длиной по 5 байт. Однако длина может быть и больше. Таким образом, эффективность может оказаться ниже заявленной. Процессор Core 2 Duo также делает выборку по 16 байт. Но у него есть специальный буфер, кэширующий циклы размером до 64 байт. Отчасти это позволяет обойти ограничение 16-байтной выборки. В K8L AMD планирует увеличить выборку команд до 32 байт.
Помимо этого, будет улучшена схема работы с SSE-командами. Как известно, их разрядность составляет 128 бит. Но из-за 64-битных регистров процессора их приходится обрабатывать по частям: сначала одну половину, а потом вторую. В K8L разрядность блоков, работающих с SSE, будет увеличена до 128 бит. Таким образом, AMD избавится от ещё одного узкого места.
Одним из самых узких мест в архитектуре K7 и K8 была разрядность шины, объединяющей кэши первого и второго уровней. Если в K7 с этим было совсем плохо (её ширина составляла 64 бит, тогда как уже в Pentium III на ядре Coppermain она была 256 бит), то в K8 AMD несколько улучшила ситуацию. Она добавила второй 64-битный канал. Однако каждый из них используется для передачи данных только в одну сторону. То есть шина кэша как бы равна 128 бит, но на самом деле более 64 бит данных в одну сторону не передашь. Выходит, что двукратная эффективность достигалась далеко не во всех случаях.
Насчёт изменения этой ситуации в K8L пока известно только то, что процессор одновременно сможет производить либо две операции чтения, либо одно чтение и одну запись. Но этого также может оказаться недостаточно, если ширина каналов, связывающих кэши L1 и L2, не возрастёт.
Продолжая тему кэша, необходимо упомянуть и кэш третьего уровня. По вышеприведённому слайду ясно видно, что процессор будет выполнен по «настоящему» четырёхъядерному дизайну. Судя по всему, это означает наличие общего для всех ядер L3-кэша. Это нововведение должно поднять эффективность обмена данными между ядрами. Сегодня обмен производится с использованием шины памяти, что, согласитесь, совсем малоэффективно из-за высокой латентности такого способа.
В Core 2 Duo эта проблема решается благодаря использованию общего кэша второго уровня. Но в своих первых четырёхъядерных процессорах Intel собирается отказаться от такой схемы. В ЦП Kentsfield (версия для производительных настольных компьютеров) и Clovertown (серверная версия) она банально объединит в одном корпусе два кристалла Conroe и Woodcrest соответственно. Получится, что четыре ядра будут иметь попарно общий L2-кэш, но для обмена информацией с другой парой придётся прибегать к системной шине, что ещё менее эффективно, чем в случае с процессорами AMD64, где контроллер памяти встроен прямо в процессор. Так что будет очень интересно, что же окажется быстрее: K8L или новые четырёхъядерники Intel.
Процессорные разъёмы, новый тип памяти и HyperTransport 3.0 AMD всегда гордилась тем, что после очередного обновления линейки процессоров не приходится менять материнскую плату для их использования. Формально почти любой чип Socket A можно установить в любую плату, причём так, чтобы это всё заработало (конечно, не без шаманства с бубном и танцами, но всё же). Однако перенос контроллера памяти на кристалл изменил эту ситуацию.
При смене типа памяти или добавлении ещё одного канала теперь приходится менять и процессорный разъём. Это случилось уже два раза: при переходе от Socket 754 к Socket 939 (был добавлен второй канал памяти) и от Socket 939 к Socket AM2 (внедрена поддержка DDR2). В будущем нас ждёт как минимум ещё один тип памяти: DDR3. Неудивительно, что многие потенциальные покупатели систем Socket AM2 насторожились, – его может хватить опять на год-два, а после этого для замены процессора придётся докупать новую плату и память.
И действительно, так и есть, но только отчасти. К 2008 году современный Socket AM2 сначала сменится на Socket AM2+, а затем на Socket AM3. Сведём все свойства этих разъёмов в одну таблицу:
Первое, что бросается в глаза, – обратная совместимость процессоров под Socket AM2+ и Socket AM3 с Socket AM2. Да, да – даже внедрение поддержки DDR3 никак не отразится на совместимости современных плат с будущими ЦП. AMD смогла достичь этого довольно просто: новый контроллер памяти сможет работать как с DDR2, так и с DDR3. Нечто подобное мы могли наблюдать при переходе на DDR2: первая серия чипсетов Intel 915 могла работать как с DDR, так и с DDR2. Конечно, не одновременно. То же самое произойдёт и при переходе на DDR3. В следующем году Intel представит чипсеты серии Bearlake, которые смогут работать с двумя типами памяти – DDR2 и DDR3.
Вместе с тем в серверном сегменте наблюдается несколько иная ситуация. С выходом Xeon на ядре Woodcrest Intel выпустила новый чипсет, поддерживающий FB-DIMM. Главное преимущество этих модулей заключается в большой ёмкости. Но вместе с тем мы получили очень большие задержки (а, как известно, именно из-за них AMD в своё время не торопилась с переходом на DDR2) и тепловыделение.
С тепловыделением вообще отдельная история. На недавно проведённой презентации в Москве AMD открыто говорила о высокой тепловой эффективности новых чипов Xeon. Но из-за сильно греющихся чипсетов и модулей памяти энергопотребление всей системы в целом оказывается выше, чем у основанной на базе Opteron. Неудивительно, что AMD изначально относилась к FB-DIMM скептически. И, судя по всему, даже Intel начинает признавать очередное своё упущение в вопросе памяти (заметим, далеко не первое упущение такого рода).
Сегодня второй производитель процессоров принимает активное участие в разработке нового типа памяти DDR3. Новые модули позволят поднять пропускную способность в два раза в сравнении с DDR2. Кроме того, новый тип позволит выпускать планки ёмкостью от 512 Мбайт до 32 Гбайт, что уже как минимум сравнимо с современными FB-DIMM. Кстати, если FB-DIMM каким-то макаром всё же выживет и получит широкое распространение, AMD внедрит и его поддержку. Так что здесь всё зависит от «as market requires».
Вернёмся к нашим процессорным разъёмам. Единственным серьёзным отличием Socket AM2 от Socket AM2+ станет внедрение поддержки новой шины HyperTransport 3.0. Она должна будет поднять пропускную способность на участке «процессор-чипсет», а также «процессор-процессор» в случае Opteron и будущих Athlon 64 FX. Что интересно, скорость новой шины будет зависеть от частоты процессора. Эту зависимость хорошо отражает следующая таблица:
В сравнении с HyperTransport, что применяется в современных чипах AMD, пропускная способность возрастёт минимум в два раза (сегодня она составляет 6,4 Гбайт/с). А для самых быстрых представителей новых процессоров, частота которых достигнет в ближайшие год-два 2,9-3,0 ГГц, этот показатель возрастёт в три раза.
Кроме того, нам гарантируется обратная совместимость со старой шиной. Конечно, если установить ЦП с поддержкой HT 3.0 в Socket AM2, он будет обмениваться данными с чипсетом на сниженной скорости. Но благодаря тому, что контроллер памяти встроен в процессор, это вряд ли приведёт к серьёзному падению производительности. Исключением могут стать четырёхъядерные процессоры – там повышенная пропускная способность HT 3.0 может оказаться более востребованной.
Все остальные изменения, ожидаемые при переходе на Socket AM2+ и Socket AM3, не столь значительны. Они касаются нового типа BIOS, а также изменённого мониторинга рабочего состояния процессора (температуры, напряжения). Что касается сроков появления новых разъёмов на рынке, то Socket AM2+ мы сможем «потрогать» уже через год, а Socket AM3 выйдет не ранее второго квартала 2008 года. Но, опять же, это неофициальная информация, и она может измениться.
Новый техпроцесс, частоты процессоров, технологии энергосбережения Не секрет, что AMD всегда отставала от Intel в плане внедрения новых технологических процессов производства. Например, Intel сегодня уже прекратила выпуск чипов по техпроцессу 0,09 мкм и перешла на нормы 0,065 мкм, а AMD сделает это только в следующем году, когда Intel уже представит чипы 45 нм. Однако второй производитель процессоров доводит свои технологии до такого уровня, что при сравнимых показателях производительности тепловыделение процессоров если и выше, чем у конкурента, то не намного.
Современные ЦП AMD в среднем выделяют 68 Вт тепла. У самых производительных версий этот параметр увеличивается до 95 Вт, а у экстремальных Athlon 64 FX составляет внушительные 120 Вт. Примерно такая же схема сохранится и при переходе на архитектуру K8L.
Первоначально четырёхъядерные процессоры будут доступны только в сегменте для энтузиастов, поэтому их тактовые частоты постараются поднять до максимума, который, по неофициальным данным, составит 2,9 ГГц. Согласитесь, весьма неплохо для процессора с четырьмя ядрами. Но вот TDP таких чипов будет далек от идеала. 125 Вт – это максимум для современных процессоров, и именно таким тепловым пакетом будут обладать новые Athlon 64 FX (ядро Altair FX) и Athlon 64 X4 (ядро Altair).
Более скромны в этом отношении будут Athlon 64 X2 (ядро Antares). В зависимости от тактовой частоты их тепловыделение будет равно 35, 65 или 89 Вт. При этом данные ЦП сохранят двухмегабайтный L3-кэш. Похоже, новые двухъядерные процессоры AMD будут получены путём отключения двух ядер у Athlon 64 X4. Но в отличие от них обновлённые Athlon 64 X2 будут выпускаться с гораздо большим разбросом тактовых частот: от 2,0 до 2,9 ГГц.
Современные одноядерные Athlon 64 будут заменены на более упрощённую версию будущих Athlon 64 X2 (те, что основаны на ядре Antares). В упрощённых Athlon 64 X2 (ядро Arcturus) не будет кэша третьего уровня, а их тактовые частоты составят 2,1-2,3 ГГц. При этом максимальное тепловыделение не превысит 65 Вт.
Что касается бюджетного сегмента, то двух ядер там пока что не предвидится. Причём это касается как Intel, так и AMD. AMD собирается представить чипы, известные сейчас под кодовым именем Spica. Сохранят ли они официальное название Sempron, пока не ясно. Также не ясно, какими характеристиками они будут обладать. О последних известно только то, что будет поддерживаться шина HyperTransport 3.0.
Кстати, всё следующее поколение процессоров AMD будет поддерживать технологию виртуализации AMD-V, ранее известную под названием Pacifica. Это касается даже бюджетного ядра Spica. Не исключено, что Intel пойдёт на такой же шаг. Судя по всему, её внедрение обходится совсем «дёшево».
В числе нововведений архитектуры K8L также планируется внедрение новых технологий энергосбережения. Именно благодаря им тепловыделение новых чипов возрастёт не так значительно. Ожидается, что процессоры смогут динамически регулировать тактовую частоту своих ядер. То есть если одно загружено на 100%, а другие, например, на 30%, то их частота будет пропорционально снижена. Современные двухъядерные процессоры пока умеют только отключать одно ядро целиком, если оно не занято.
Системная логика Вполне естественно, что с внедрением поддержки шины HyperTransport 3.0 потребуется обновить все современные чипсеты. Формально все выпущенные ранее наборы микросхем будут совместимы с новыми процессорами, однако их (процессоров) потенциал будет раскрыт не полностью. Так что выпущенные в этом году nForce серии 500 станут далеко не самыми последними.
Но не одна NVIDIA будет обновлять свои продукты. Недавняя покупка ATI компанией AMD позволит ей начать выпуск чипсетов для собственных процессоров, да ещё и под собственной торговой маркой. Буквально на днях появились слухи, на основе которых можно составить более-менее целостную картину выхода системной логики для ЦП AMD.
Сегодня наиболее прогрессивным чипсетом ATI для процессоров AMD64 является Radeon Xpress 3200, также известный как RD580. Тем не менее в первом квартале 2007 года он будет обновлён. Если сейчас предлагается поддержка технологии CrossFire, позволяющей устанавливать две видеокарты в два полноскоростных разъёма PCI Express x16, то в новой версии таких разъёмов будет три. Две видеокарты будут вместе трудиться над построением кадра, а третья будет использоваться для расчёта физики. Кроме того, в этом наборе микросхем будет добавлена поддержка платформы 4х4. То есть на его основе будут представлять платы с двумя разъёмами Socket F, а впоследствии и Socket F+ (он обеспечит поддержку шины HyperTransport 3.0). По сути, обновлённый RD580 – это аналог RD600, что предназначается для платформы Intel.
Следующим шагом станет выход RD790. Этот чипсет уже будет ориентирован на новые процессоры K8L. Поэтому в числе нововведений значатся шина HyperTransport 3.0, а также разъём Socket F+. Вместе с тем не исключается возможность внедрения поддержки интерфейса PCI Express 2.0, который позволит увеличить пропускную способность в два раза в сравнении со своей первой версией. Также возможна поддержка установки до четырёх видеокарт по схеме 4x PCI Express x8 или двух по схеме 2x PCI Express x16. Не исключено, что это станет своеобразным «нашим ответом Quad SLI».
Довольно скоро может появиться новая линейка чипсетов RX690, RS690 и RS690C. Все они будут предназначаться для более дешёвых сегментов, нежели RD580. Первый из них будет основой для компьютеров среднеценовой категории. Он не будет поддерживать технологию CrossFire, в нём не будет встроенного графического ядра. Его включат в RS690. Ожидается, что в основу интегрированной графики ATI нового поколения ляжет GPU Radeon X700. Правда, число пиксельных конвейеров будет урезано с 8 до 4. Но всё равно это будет куда как более быстрым решением, нежели теперешнее встроенное ядро класса Radeon X300SE с двумя конвейерами.
Следующее поколение серии 700 уже будет ориентировано исключительно на архитектуру K8L. К сожалению, из характеристик этих чипсетов известно совсем немного. В них будет интегрирована поддержка HyperTransport 3.0 (кто бы сомневался?). Интегрированная версия RS790 получит в своё распоряжение графическое ядро с поддержкой DirectX 10, а в бюджетном RS740 останется совместимость со «старым» DirectX 9.
Также к концу 2007 года можно ожидать появления нового южного моста SB700. Он заменит современный SB600. Число портов USB возрастёт до 12, а число каналов Serial ATA II до 6. Вместе с тем возможно внедрение поддержки встроенной флэш-памяти. Не исключено, что это будет чем-то вроде аналога технологии Intel Robson.
Выводы Через год AMD произведёт очередное массированное обновление линейки своих процессоров. Внесённые изменения коснутся основных вычислительных блоков, что должно положительным образом сказаться на росте производительности. Однако пока что неизвестно, помогут ли эти изменения противостоять Intel Core Architecture, если сравнивать чипы с одинаковыми тактовыми частотами.
Несмотря на переход на новые производственные нормы, частотный потенциал процессоров K8L будет примерно таким же, как и у современных ЦП. Это объясняется увеличением числа ядер у старших моделей с двух до четырёх. Это изменение также повлияет и на максимальное тепловыделение наиболее производительных чипов. Оно будет достигать 125 Вт, что много даже по меркам особо «горячих» Pentium 4.
Также, что немаловажно, ожидается обратная совместимость новых процессоров с современными материнскими платами под Socket AM2. Это коснётся даже чипов 45 нм, контроллер памяти которых будет поддерживать работу с DDR2 и DDR3.
В отношении чипсетов произойдёт логическое обновление, которое должно обеспечить полноскоростной канал шины HyperTransport 3.0. Хотя не исключено, что некоторые из наборов микросхем станут поддерживать вторую версию шины PCI Express, но первое время это будет касаться преимущественно версий для самого производительного сегмента.
Intel, конечно же, не будет стоять в стороне, почивая на лаврах после выпуска Core 2 Duo. Несомненно, она представит четырёхъядерный процессор, дизайн которого будет специально разработан под четыре ядра. Возможно, им станет Yorfield, чьи примерные спецификации приведены в сводной таблице характеристик. В любом случае в ближайшие 2-3 года нас ждёт ожесточённая конкуренция на рынке процессоров, что должно будет вылиться в более высокую производительность, а заодно и в более низкую стоимость.