MirZnaet.ru

Лучшее из переведенного

AMD A8-3850 Review: Llano Rocks Entry-Level Desktops просмотров: 2151


 



Обзор процессора AMD A8-3850







Обзор процессора AMD A8-3850: Llano взорвёт рынок недорогих настольных компьютеров


 


12:00 - 30 июня 2011 года, Крис Ангелини


 


Содержание статьи:


 


1 - Встречайте линейку процессоров AMD Llano для настольных компьютеров


2 - Технология Dual Graphics: как это работает?


3 - Duel Graphics: стоит ли игра свеч?


4 - Чипсеты


5 - Производительность системы хранения данных


6 - Быстрая память снова в центре внимания


7 - Пару слов о разгоне Llano


8 - Тестируемая конфигурация и сравнение с конкурентами


9 - Результаты тестирования: PCMark 7


10 - Результаты тестирования: 3DMark Vantage


11 - Результаты тестирования: Sandra 2011


12 - Результаты тестирования: Metro 2033 (DirectX10)


13 - Результаты тестирования: Call of Duty: Modern Warfare 2 (DirectX 9)


14 - Результаты тестирования: World of Warcraft: Cataclysm (DirectX 9 and 11)


15 - Результаты тестирования: создание контента (Content Creation)


16 - Результаты тестирования: производительность


17- Результаты тестирования: кодирование медиа-файлов


18 - Энергопотребление


19 – Заключение


 


В начале месяца был опубликован обзор архитектуры AMD Llano для ноутбуков и мобильных компьютеров. Сейчас у нас есть версия для настольных компьютеров с тепловым пакетом 100 Вт. Какую производительность сможет продемонстрировать теперь эта компания, подняв так высоко потолок термопакета и увеличив частоту?


Примечание редактора: как мы уже не раз поступали в подобных случаях, на этот раз мы вместе с компанией CyberPower предлагаем нашим читателям выиграть один из самых первых компьютеров, собранных на базе AMD Llano. Серийное название этой модели - Gamer Ultra. Пролистайте эту статью до конца и на последней странице вы сможете заполнить форму для участия в розыгрыше нового компьютера, любезно предоставленного компанией CyberPower!


 


НАСТОЛЬНЫЙ ДЕБЮТ А8-3850


Дон Уолигроски проделал невероятно сложную работу, подготовив первый обзор архитектуры AMD Llano. Если вы ещё не читали эту статью и хотите узнать больше о массовом устройстве ускоренной обработки данных (APU) компании AMD, то перед тем, как продолжить чтение этого обзора, вам обязательно надо ознакомиться с «Обзором AMD A8-3500M APU: Llano спущен с цепи».


Так как Дон прекрасно описал всю суть архитектуры Llano, мы собираемся посвятить наше первое знакомство с AMD Llano для настольных компьютеров под кодовым названием Lynx результатам тестирования и анализу - темам, которые все вы так любите. Какую производительность можно ожидать от режима Dual Graphics? Что он покажет сравнение с Sandy Bridge с дискретной видеокартой? Какой эффект оказывает производительность памяти на частоту кадров в играх? Насколько встроенная поддержка USB 3.0 соответствует требованиям некоторых дополнительных контроллеров, которые мы уже видели? На все эти вопросы мы и постараемся ответить в этом обзоре.


Но сначала давайте вкратце вернёмся к основным базовым характеристикам этого первого устройства ускоренной обработки данных (APU) компании AMD для настольных компьютеров.


 


Рис. 1: Антикризисный процессор


 


В Audi могли бы гордиться тем, что у процессоров AMD такие же названия, как и у их машин (а может, и нет, учитывая их низкий ценовой диапазон). AMD использует маркировку А8 и А6 для того, чтобы чётко разграничить по производительности свои первые четыре модели.


Существуют две модели А8 и две - А6. Первая модель - А8-3850 со 100-ваттным термопакетом, графической видеокартой Radeon HD 6550D, четырьмя ядрами, каждое с 1 Мб кэша второго уровня L2, и частотой 2,9 ГГц. Данная версия не поддерживает режим Turbo Core, поэтому единственный способ заставить процессор работать быстрее 2,9 ГГц - это разгон. В AMD предполагают, что цена этой модели будет в районе 135 американских долларов.


 


Рис. 2


Модель А6-3650 обладает таким же термопакетом в 100 Вт, однако у него уже попроще видеокарта - Radeon HD 6530D и меньше частота - 2,6 ГГц (режим Turbo Core тоже отсутствует). У неё на борту те же четыре ядра, 4Мб кэша второго уровня L2 и поддерживает память DDR3-1866, как и остальные три модели. Предполагаемая цена продажи 115 американских долларов.


 


 


Интересно отметить, что снижение теплопакета до 65 Вт не приводит к серьёзному снижению функциональных возможностей. У модели AMD A8-3800 довольно серьёзный движок Radeon HD 6550D, 4-ядерная архитектура Stars и солидный запас из 4 Мб кэша второго уровня L2. Наличие режима Turbo Core, тем не менее, позволяет компенсировать значительное снижение частоты процессора, - 2,4 ГГц, - увеличивая её до 2,4 ГГц, когда это позволяет температурный режим. К сожалению, AMD не предоставила для тестирования ни одного процессора с опцией Turbo Core, поэтому пока нельзя точно сказать, сколько времени они могут работать в этом режиме.


Модель А6-3600 тоже принадлежит к 65-ваттным процессорам. У неё более простые характеристики: наряду с пониженной частотой процессора - по умолчанию в нормальном режиме она составляет 2,1 ГГц, а в режиме Turbo Core - 2,4 ГГц - производительность графики тоже слабее из-за не столь навороченного движка Radeon HD 6530D. Тем не менее, у неё есть 4 Мб кэша второго уровня L2, т.е. по 1 Мб на каждое ядро.


В чём же именно заключается разница между движками графических процессоров Radeon HD 6550D и Radeon HD 6530D? По сути, только в одном движке SIMD.


 


 


 


Если посмотреть на диаграмму графического процессора Llano, то становится ясно, как AMD разграничивает эти две линейки. Каждый движок SIMD содержит 80 арифметико-логических устройств (АЛУ) и объединён с 4 текстурными блоками. Таким образом, отключение одного движка SMID выводит из игры сразу 320 шейдеров и 16 текстурных, как это мы видим у Radeon HD 6530D.


 


Торопиться нужно медленно


 


И без того короткая продуктовая линейка процессоров Llano, состоящая всего из 4 моделей, в день анонса сразу уменьшилась наполовину: было объявлено, что выпуск 65-ваттных процессоров А8-3800 и А6-3600 задерживается на неопределённое время, в связи с чем в наличии остались только 100-ваттные А3850 и А6-3650. В связи с этим мы не сможем протестировать режим Turbo Core в моделях Llano до тех пор, пока AMD не сообщит об их наличии.


 


 


Технология Dual Graphics: как это работает?


 


Настройка режима Dual Graphics


Дон уже описал технологию Dual Graphics AMD в своём обзоре архитектуры Llano. Теперь же мы можем протестировать её в реальных условиях.


В процессе подготовки статьи Дон обнаружил, что в некоторых случаях, когда технология Dual Graphics не работала, по умолчанию включался режим работы более медленного графического процессора. В AMD сказали, что так не должно быть, система по умолчанию должна работать с производительностью более быстрого графического процессора. Мы полагаем, что AMD пытается предложить решение этой непредвиденной проблемы путём использования дополнительной внешней видеокарты в качестве основной, в то время как внутри главного процессора уже есть два графических процессора. В результате процесс установки превращается в довольно сложную и неприятную процедуру.


 


По умолчанию, Llano является основным устройством. Поэтому при конфигурации BIOS, установке Windows и установке драйверов AMD рекомендует использовать выводы устройства ускоренной обработки данных ( APU). При установке внешней видеокарты автоматически включается функция поддержки CrossFire. На этом этапе необходимо установить последнее обновление Application Profiles, отключить поддержку CrossFire, выключить компьютер и переключиться на разъём внешней видеокарты. Видео сигнала не будет на экране до полной загрузки Windows. После этого необходимо включить поддержку CrossFire, перезагрузить компьютер ещё раз и после этого можно будет использовать технологию Dual Graphic. Согласитесь, сущие пустяки!


По крайней мере, с этого момента Dual Graphics начинает поддерживать технологию мультидисплейного подключения Eyefinity. Используя разъёмы каждого графического процессора, можно подсоединить три или даже более мониторов в расширенной конфигурации настольного компьютера. Необходимо только не ошибиться с разъёмом. Некоторые производители материнских плат используют одноканальные выводы DVI, а другие - двухканальные. Из тех материнских плат, которые есть у нас здесь, некоторые имеют VGA и HDMI разъёмы. У Gigabyte есть ещё DisplayPort.


 


 


Итак, о каком же аналогичном графическом процессоре идёт речь?


Дон в своём обзоре также объяснил, что AMD для определения аналогичных по производительности графических процессоров в одном и том же устройстве использует специфическую систему названий. Например, Radeon HD 6550D в AMD А8-3850, плюс дополнительная видеокарта Radeon HD 6630D2, с которой мы сейчас выполняем тест, называются Radeon HD 6630D2. Такая маркировка означает, что совокупная производительность двух графических процессоров должна быть выше, чем производительность каждого отдельно взятого. Во-вторых, она показывает, что это конфигурация для настольного компьютера (в отличие от более ограниченных по температуре мобильных конфигураций, собранных в одном корпусе, маркировка которых имеет букву «А»). И в-третьих, это указывает на наличие в системе двух графических процессоров.


 


Хотя нам и нравится подобная систематизация, она всё равно вызывает определённую путаницу. Технология Dual Graphics ещё далека от совершенства. Она поддерживает приложения DirectX 10/11, и производительность в этом случае зависит от оптимизации драйвера. То есть, зная, что ожидать от Radeon HD 6850, в случае с Radeon HD 6630D2 можно получить совсем непредсказуемые результаты.


Как же всё это работает?


Для того, чтобы протестировать технологию Dual Graphics, мы взяли три игры - Call Of Duty: Modern Warfare 2,работающую под DirectX 9, Metro 2033 - под DirectX 10 Word of Warcraft: Cataclysm - под DirectX11.


 


 


Тестирование игры под DirectX 9 показало хорошие результаты. Как и ожидалось, технология Dual Graphics в этом случае не работает. Как и обещали в AMD, в настройках по умолчанию выставлена скорость самого быстрого графического процессора, а не самого медленного, как это было в случае с версией Llano для мобильный компьютеров.


В Metro 2033 вначале заметно серьёзное ускорение, которое потом при разрешении 1680х1050медленно сползает до двух кадров в секунду. Объяснение в данном случае заключается в том, что по мере нарастания нагрузки платформа не справляется с ним и поэтому разрыв сокращается. Между прочим, это не оправдывает надежды, которые обычно возлагаются на систему с более накачанной графической мускулатурой (платформа ограничивает производительность при низком разрешении, и графика работает с задержкой). Об этом полезно будет вспомнить на следующей странице, где мы будет тестировать одну из теорий, используя Core i3.


Игра Word of Warcraft: Cataclysm не такая интенсивная, как Metro 2033, и рендеринг DirectX 11 помогает увеличить производительность графики. Ускорение это довольно незначительное, учитывая уже существующую нормальную игровую производительность при разрешении 1680х1050, однако частота кадров действительно возрастает, когда Radeon HD 6570 работает на платформе А8-3850.


Технология Dual Graphics: стоит ли игра свеч?


Мы уже не раз сталкивались с ситуациями, когда недостаточно мощный процессор ограничивал производительность графической системы. По сути, результаты Metro 2033 на предыдущей странице выглядели именно так - как будто архитектура AMD Stars сдерживала её работу.


Первоначально возникло предположение, что если 4 ядра А8-3850 недостаточно быстры, чтобы справиться с 400 потоковыми ядрами графического процессора, то покупка Radeon HD 6570 за 80 долларов вряд ли что-то изменит. Если говорить о замене внешеней видеокарты, то такой апгрэйд выглядит довольно глупо, потому что процессор Core i3-2105 в комбинации с точно такой же картой (по цене одного чипа AMD) обеспечивает более высокую производительность, не обладая при этом технологией Dual Graphics.


На следующих трёх диаграммах производительность Intel HD Graphics 3000 показана синим цветом. Зелёным отмечены результаты AMD A8-3850 с дополнительной внешней видеокартой Radeon HD 6570, а серым - результаты процессора Intel Core i3 с той же внешней видеокартой Radeon HD 6570.


 


 


В играх под DirectX 9, где технология Dual Graphics в любом случае не работает, обе конфигурации - и Intel с Radeon HD 6570, и A8-3850 с Radeon HD 6570 - демонстрируют приблизительно одинаковую производительность, обеспечивая нормальную работы игры, в то время как HD Graphics 3000 показывает довольно обескураживающие результаты.


 


А вот на это уже стоит обратить внимание: во всех трёх случаях с разными разрешениям пара Intel/AMD показывает более быстрые результаты, чем пара AMD/AMD, несмотря на ускорение , которое обеспечивает технология Dual Graphics.


 


Однако, перефразируя знаменитое выражение «мне с тобой милее», игра World of Warcraft явно предпочитает конфигурацию с двумя графическими процессорами. Может быть, игра лучше работает с четырьмя физическими ядрами главных процессоров, чем с двумя, а, может, в этой платформе просто не происходит задержка вывода графики для World of Warcraft, что позволяет технологии Dual Graphics показать себя во всей своей красе.


В любом случае, разница между Radeon HD 6570 и HD Graphics 3000 видна невооружённым глазом. Вполне очевидно, что встроенный графический движок Intel не в состоянии поддерживать ту частоту кадров, которая необходима игрокам для нормальной игры даже при не самом низком уровне детализации.


Чипсеты


Устройства ускоренной обработки данных Llano комплектуются двумя чипсетами AMD: A75 и A55. Первый относится к современному поколению чипсетов, а второй уже явно устарел.


Оба чипсета поддерживают интерфейс Socket FM1 (905-пиновый) для настольной компьютеров на платформе Lynx. Также у них есть шесть портов SATA, HD Audio, поддержка программного обеспечения RAID 0, 1 и 10, четыре двунаправленных последовательных соединения для PCI Express второго поколения и шина PCI. Оба чипсета совместимы с интерфейсом mSATA.


 


Большинство пользователей предпочитают чипсет А75


Чипсет A55 ограничен поддержкой дисков 3 Гбит/с, не поддерживает режим одновременного доступа к нескольким дискам (FIS) и USB 3.0. Таким образом, мы можем предположить, что чипсет A55 будет ограничен рынком мобильных компьютеров, где производительность не так важна, как цена и внешний вид, хотя USB 3.0, видимо, вскоре появится и на этом рынке.


 


Чипсет A75 представляет собой более совершенное решение. У него все шесть портов SATA обеспечивают поддержку 6 Гбит/с. По сравнению с A55, у которого есть 14 портов USB 2.0 и 2 порта 1.1, чипсет A75 использует из них 4 порта для поддержки USB 3.0, предоставляя производителям самим решать, что делать с остальными 10-ью, которые поддерживают USB 2.0. Также чипсет A75 поддерживает режим одновременного доступа к нескольким дискам (FIS).


 


Режим одновременного доступа к нескольким дискам (FIS): процессор посылает и получает команды от любого диска; обеспечивает хранение считанной информации на промежуточном 3Гб диске


Эта функция важна, если вы собираете компьютер несколькими жёсткими дисками. Режим одновременного доступа к нескольким дискам (FIS) обеспечивает одновременно связь между контроллером промежуточного устройства хранения данных и другими дисками, что позволяет использовать аппаратную установку очерёдности команд (Native Command Queuing) так, как она и должна работать. Контроллер без поддержки режима одновременного доступа к нескольким дискам (FIS) работает в режиме последовательного командного доступа, что не позволяет процессору выдавать больше одной команды одному диску за раз. Естественно, это самым непосредственным образом сказывается на производительности системы хранения данных.


Производительность системы хранения данных


На сегодняшний день чипсет AMD A75 работает системами хранения данных намного лучше, чем любой другой чипсет, который предлагает Intel. К сожалению, чипсет A55, по сравнению со старшей моделью, производит удручающее впечатление.


Платформа чипсета A75 поддерживает шесть портов SATA 6 Гбит/с, программный RAID 0, 1 и 10, р одновременного доступа к нескольким дискам (FIS) и четыре порта USB 3.0. Хотя из всего этого набора встроенная поддержка USB 3.0 оказалась единственной новинкой, нам хотелось протестировать все системы хранения данных данной платформы.


SATA 6 Гбит/с: должно быть, немного лучше?


В AMD особо не отмечают изменения, внесённые в контроллер SATA 6 Гбит/с. Тем не менее, при использовании 240 Гб OCZ Vertex 3 Pro мы заметили небольшое повышение производительности при последовательной записи и улучшенную пропускную способность при операциях произвольного чтения/записи.


Хотя в целом, по совокупности характеристик, контроллеры Intel обычно оказываются более производительными, чем AMD, доработки последнего оказались достаточно серьёзными, чтобы продемонстрировать лучшую производительность последовательного чтения, более высокую скорость при операциях произвольного чтения и почти полное равенство с Intel по рабочей нагрузке компьютера.


 


USB 3.0: лучше, чем дополнительный внешний контроллер


Нельзя сказать, что поддержка USB 3.0, совсем новая функция. Такая опция ожидается на материнской плате одного полного энтузиазма производителя, хотя количество устройств, созданных для полноценного использования преимуществ порта SuperSpeed, пока ещё слишком мало. Однако в нашей лаборатории на момент тестирования уже было несколько высокопроизводительных устройств, подсоединяющихся к компьютеру через USB 3.0, поэтому было логично посмотреть, как с ними будет работать интегрированный контроллер AMD.


Всё, что у нас было, это - материнская плата Asus M4A89GTD Pro/USB3 на базе 890GX с контроллером NEC µPD720200; материнская плата Asus P8Z68-V Pro на базе Z68 с резвым контроллером ASMedia ASM1042 и ASRock A75 Extreme6 с основным интегрированным контроллером AMD и дополнительным - ASM1042. Для тестирования производительности использовалась USB-флэшка Kingston DataTraveler HyperX Max 3.0. Хотя максимальная скорость чтения этого устройства - 195 Мб/с - даже не приближается к максимальной нагрузке интерфейса, налицо поразительная разница в скорости по сравнению с теми USB 2.0 устройствами, к которым мы привыкли. Тестирование заключалось в перемещении 12 772 файлов из 621 папок объёмом 56,9 Гб.


 


Все три контроллера быстрые - перемещение 50 Гб заняло не более 6-8 минут. Однако контроллер AMD со встроенной логикой справился с задачей быстрее, чем немного отставший от него контроллер ASMedia. Оба контроллера тестировались на одной и той же материнской плате с чипсетом A75. Контроллер NEC занял третье место, а ASMedia на материнской плате Intel Z68 Express потребовалось больше всех времени, чтобы справиться с задачей.


Однако, несмотря на встроенный контроллер AMD пользоваться интерфейсом USB 2.0 не очень удобно. Разъёмы для USB 3.0 не работают до тех пор, пока не установлены драйверы, а разъёмы USB 2.0 придётся использовать для мыши и клавиатуры, особенно, если возникнет необходимость установить Windows или изменить настройки BIOS.


 


 


 


 


Быстрая память снова в центре внимания


Архитектура Nehalem компании Intel серьёзно заморочила голову производителям на рынке памяти. Intel не только ввела жёсткое ограничение на потребляемое контроллером напряжение, но ещё заявила о трёхканальной конфигурации, внедрение которой не уменьшало пропускную способность. Целая куча производителей прислали нам комплекты «2000+ миллионов операций в секунду», но даже внеся изменения и выполнив все требования, необходимые быстрой работы памяти (повысив напряжение на блоке Uncore процессора), положительного результата достигнуто не было.


Можно было бы предположить, что встроенная в Clarkdale и Sandy Bridge графика поможет вернуть памяти прежнюю скорость. На самом деле не помогла, причём даже после отключения у контроллера одного канала.


Дело в том, что до того, как заставлять кого-то думать о масштабировании встроенной графики, сам графический движок должен быть достаточно производительным. Например, HD Graphics 2000, применяемый в большинстве процессоров Intel на базе Sandy Bridge, работает ничуть не лучше, чем наводящий тоску графический процессор Clarkdale. Только сейчас Intel начинает понимать, что необходимо оснащать свои основные процессоры графическим ядром HD Graphics 3000, что, в принципе, надо было делать с самого начала. Поэтому теперь в нашей лаборатории тоже есть процессоры, которые мы можем протестировать, как и Core i3-2105.


Как мы уже видели, ядро Radeon HD 6550D - это сердце AMD A8-3850 - заслуживает уважения своей производительностью. Она настолько высока, что ограничение пропускной способности памяти для 1333 миллионов операций в секунду, причём даже в двухканальной конфигурации, буквально подрезает ему крылья, как птице.


Поэтому давайте попробуем, используя SiSoftware Sandra 2011, посмотреть, что же у нас происходит в пропускной способностью памяти, начиная с DDR3-800 и заканчивая DDR3-1866. Для обеспечения максимальной масштабируемости использовался комплект модулей памяти Kingston KHX2133C9AD3T1K2/4GX. Для всех режимов памяти до DDR3-1333 схема задержек (тайминги) CAS 7 оставалась без изменений, остальные режимы, превышающие это значение, для обеспечения надёжной работы потребовали настройки задержек CAS 8.


 


В принципе, пропускную способность памяти можно увеличить в два раза - с 800 миллионов операций в секунду до 1866, но по мере повышения скорости и снятия задержек для увеличения частоты значения будут расти всё медленнее. Это тоже полезно знать. Теперь давайте посмотрим на производительность приложений, и как она меняется в зависимости от разных условий.


 


Переход с DDR3-800 на DDR3-1600 в игре Metro 2033 почти вдвое повысил её производительность, полностью подтвердив аналогичные результаты по улучшению пропускной способности памяти в Sandra 2011. Это довольно сложный графический тест, и дойдя до уровня DDR3-1866 уже не имеет смысла его продолжать, потому что улучшений в производительности практически нет.


 


Игра Call of Duty давно известна своими возможностями подстраиваться под разные платформы, не сильно загружая, при этом, видеокарту карту. И снова вовремя тестирования произошло почти двукратное увеличение при переходе с DDR3-800 на DDR3-1600. При попытке принудительного использования задержек CAS 8, был явно заметен провал на кривой производительности, а когда дело дошло до DDR3-1866 и для поддержания стабильной работы потребовалось уменьшить параметр tRCD до 9, кривая производительности сползла вниз. Результаты были бы другими, если бы под рукой оказалась какая-нибудь хорошая память, типа DDR3-1600 CAS 7.


 


Архитектура процессора AMD не так зависит от производительности памяти, как графический движок. Тем не менее, при переходе с DDR3-800 на DDR3-1333 происходит значительное улучшение работы. Других отличий нет. Поэтому переплачивать только за то, чтобы получить более продвинутую память, не имеет смысла.


 


Перекодировка ещё меньше зависит от быстрой памяти, чем процесс сжатия файлов. Да, незначительное увеличение скорости при переходе с DDR3-800 на DDR3-1333 заметно, но сэкономить время в таком приложении, как, например, MainConcept, не получится.


Быстрая/низколатентная память (память с малым временем ожидания)


Несмотря на незначительные улучшения в работе приложений, вывод из всего этого простой - если надо получить максимум из APU на базе Llano, то графический движок должен иметь возможность работать, а не задыхаться от нехватки ресурсов. Память с поддержкой высокой скорости обмена данных и малым временем ожидания (низколатентная) - единственный способ добиться в играх максимальной частоты кадров.


Не стоит прельщаться скоростью DDR3-1866, если для этого придётся устанавливать задержки CAS 8 или 9. Более мощная модель DDR3-1600 выглядит куда более привлекательно. Нам повезло протестировать на паре материнских плат наш набор Kingston HyperX DDR3-2133 с DDR3-1600 CAS 7. К сожалению, не удалось это сделать на плате ASRock, которая в этот момент использовалась для других тестов. Но даже в режиме CAS 8 производительность была невероятно высокой.


 


Пару слов о разгоне Llano


Llano с трудом поддаётся интеграции. AMD специально заблокировала множители частоты по всей линейке. При этом, компания считает, что, увеличив тактовую частоту до 133 МГц и уменьшив множитель (уменьшать можно, а повышать - нет), в 3DMark Vantage реально добиться повышения производительности на целых 30%,. Однако в связи с тем, что генератор частоты на данной платформе встроенный, (как в Intel P67/H67/Z68), то путаница с изменением тактовой частоты также приведёт к разгону северного моста, графического ядра и шины PCI Express.


 


 


Более быстрый северный мост довольно-таки спокоен, поэтому можно использовать разделители памяти, чтобы вернуть значения оперативной памяти до исходного уровня. Более того, разгон графического ядра можно только приветствовать - ведь именно так и добиваются в играх высокой частоты кадров. А вот разогнанная шина PCIe может привести к проблемам.


Пару раз нам пришлось задержался допоздна, обсуждая всевозможные проблемы с классными парнями из ASRock и Gigabyte, которые практически в реальном времени помогали нам разобраться с настройками BIOS. В конце концов, при помощи множителя 23,5x и тактовой частоты 145 МГц, показанной как 143,5 МГц, нам удалось разогнать A75M-UD2H на материнской плате Gigabyte почти до 3,4 ГГц (можно было и больше, но при нагрузке он срывался). Устройству ускоренной обработки данных (APU) потребовалось ещё 0,05 В, чтобы достичь такого же результата.


 


 


Проблема была в том, что нельзя было использовать SSD. При превышении тактовой частоты в 110 МГц BIOS на материнской плате сразу переставал её определять. Даже с установленным жёстким диском надо было три или четыре перезагрузить систему, чтобы BIOS смог определить его. Эта проблема известна, и в Gigabyte как-то пытается её решить, и проявляется она в превышении значений тактовых частот выше указанных в спецификации. У ASRock после разгона проявилась другая проблема - перестала работать поддержка USB 3.0. Другие платы просто не разгонялись, отказываясь работать задолго до того момента, когда надо было начинать сражаться с своеобразными настройками скорости шины.


Разгон четырёх ядер A8-3850 с 2,9 ГГц до 3,4 ГГц однозначно повысит производительность процессоров в соответствующих тестах, но для игровых приложений гораздо полезней будет просто установить быструю память.


В общем, вывод такой: разгон Llano - это что-то, типа использование турбонаддува в Ford Fiesta. Ведь этот автомобиль покупается не за его скоростные характеристики на трассе, а за его относительную дешевизну и приемлемую скорость, чтобы просто ездить на нём, а не участвовать в гонках.


 


 


Идея установления мирового рекорда по интегрированной графике вызывает, по меньшей мере, улыбку, но не по причине нашего высокомерия, а потому, что всего за 70 долларов можно купить Phenom II X3 720 Black Edition или 1-Гб Radeon HD 6570, получив, при этом, более высокую графическую производительность без лишних усилий, плюс, незаблокированный процессор с 6 Мбайт общего кэша L3. Если же вы любитель «погонять», то второй вариант для вас окажется более подходящим, потому что AMD Llano предназначен совсем для других целей.


 


Есть ли будущее у разгона Llano?


У некоторых из протестированных нами плат есть возможность устанавливать более высокие значения множителей и изменять тактовую частоту графического процессора. Естественно, поменять эти настройки у устройства ускоренной обработки данных (APU), у которого все эти опции заблокированы, ни к чему не приведёт. Тогда почему эти настройки видны?


По нашим источникам, AMD планирует начать отдельные продажи устройства ускоренной обработки данных Black Edition APU на базе архитектуры Llano. Как скоро - неизвестно. Но если будет открыт доступ к разблокированным настройкам основного и графического процессоров, то тогда станет гораздо легче разогнать каждый из компонентов этого 32-нанометрового устройства до максимальной скорости, не запутавшись в настройках других интерфейсов.


 


Тестируемая конфигурация и сравнение с конкурентами


Вначале необходимо сказать несколько слов о тех устройствах, которые мы собираемся тестировать. Для сравнения мы выбрали три базовые конфигурации. Мы хотели добавить ещё несколько, но у нас просто не хватило времени на подбор альтернативных устройств, которые бы соответствовали стабильным, беспроблемным настройкам Llano, типа AMD Phenom II X3 720 и других недорогих популярных решений энтузиастов в этой области. Если будет интерес, мы с радостью проведём дополнительное тестирование с этой моделью, недорогими процессорами Intel Pentium на базе Sandy Bridge и подберём что-нибудь ещё.


Для всех трёх машин было решено использовать одну и ту же подсистему памяти, которая была бы совместима с частотой передачи DDR3-1333. Зная, что Llano демонстрирует значительную производительность при более агрессивных частотах и задержках, мы провели тестов на целую страницу, чтобы досконально исследовать эффекты быстрой памяти. В процессе анализа результатов мы будем постоянно показывать вам , где большая пропускная способность реально помогает увеличить производительность.


Первоначально планировалось протестировать Core i3 на материнской плате низкого ценового диапазона на базе H67, однако перед самым тестированием один чересчур усердный инженер из нашей команды погнул пины процессора на единственной H67, которая у нас была, и, тем самым, заставил нас выбрать другую плату - Z68. Эта плата была чуть дороже, но это, в любом случае, не повлияло бы на результат, потому что в тестировании использовалась всего одна видеокарта, а процессор Core i3 нельзя было разогнать по определению.


 


Результаты тестирования: PCMark 7


В связи с тем, что AMD (а также Nvidia и VIA) недавно покинули BAPCo, мы логично решили больше не использовать пакет SYSmark в наших тестах, в связи с чем считаем необходимым отдельно остановиться на том, почему мы начинаем тестирование м обзора синтетической производительности в таких пакетах, как PCMark 7, 3DMark Vantage и SiSoftware Sandra.


Синтетические измерения производительности наиболее полезны в тех случаях, когда эффективно изолируют какую-либо подсистему, загружая её работой так, как, порой не может загрузить ни одно реальное приложение. В конце концов, реальные приложения не предназначены для того, чтобы должны перегрузить или подвесить ту или иную систему компьютера. Тем временем, синтетическое приложение, как раз наоборот, может специально быть нацелено на передачу максимального объёма данных через какую-то конкретную шину, на измерение эффективности работы распараллеленного процессора или на проверку работы конкретного компонента по специальному алгоритму.


PCMark 7, как синтетический тест, не совсем подходит для такой работы, потому что его он основывается на компонентах операционной Windows, а она, по своей сути, - реальное рабочее приложение. Futuremark создаёт такие тесты таким образом, что их описание было бы довольно сложным и заняло бы очень много времени.


 


Данный тест больше подходит для сравнения тестируемых компонентов между собой путём повторения каждого задания три раза. После этого он выдаёт суммарный результат, умножая коэффициент на среднее геометрическое значение каждого теста в пакете. Результат, близкий к 5000, означает, что производительность протестированных устройств близка к эталонным значениям Core i7-980X, GeForce GTX 580 и Crucial C300, которые Futuremark использует в качестве основы для сравнения.


 


Тот факт, что ни одно из трёх устройств не достигло отметки 5000, является хорошим индикатором их относительной производительности. Потому что это не самые мощные и топовые конфигурации, а устройства, ориентированные на массовый рынок.


Учитывая всё это, можно сказать, что тесты пакета PCMark 7 ориентированы больше на нагрузку процессора, а не графического ядра. Основная идея технологии Fusion, скорей всего, заключается в том, чтобы улучшить работу игр и развлекательных приложений, а базовый пакет PCMark явно нацелен на тестирование более продуктивных приложений.


Если поглубже заглянуть в документацию Futuremark, то там сказано, что этот пакет состоит из тестов источников хранения данных, перекодирования и воспроизведения видео, обработки изображений, web-браузеров, дешифровки и графики DirectX 9. Мы были немного озадачены этим выбором, потому что не понимали, зачем использовать DirectX 9, в то время как другие компоненты PCMark 7 уже используют DirectX 10, а их флагманский тест 3DMark 11 - даже DirectX 11.


Вот почему пакет PCMark не совсем подходит для такого тестирования. Он показывает действительные результаты тех тестов, которые выполняет, но они все - Windows-ориентированные, а, следовательно, их результаты - относительные. Поэтому если ориентироваться только на результаты этого пакета, из поля зрения исчезнут основные изюминки конструкторских решений AMD.


Пакет Lightweight ещё больше ориентирован на загрузку процессора, с акцентом на тестировании устройств хранения данных, редактировании текста, обработке изображений и работе web-браузеров с тремя вкладками. Ничего из перечисленного не нагружает графические ресурсы A8-3850, поэтому Llano остаётся далеко позади.


Для защиты своих позиций у AMD есть Phenom II X4 965, который стоит чуть больше Llano, но зато все транзисторы в нём работают внутри четырех ядер. Этих ресурсов вполне достаточно, чтобы догнать двухъядерный Core i3-2105, но ещё не сравняться.


 


 


Учитывая результаты PCMark 7 и Lightweight, трудно было ожидать от Llano высоких результатов, потому что эти тесты основывались в основном на выполнении объёмных задач, таких как тестирование устройств хранения данных, работа web-браузеров, дешифровка и редактирование текста.


Поэтому A8-3850 вполне закономерно финиширует здесь последним. Но стоит задать вопрос: какая производительность действительно нужна для работы web-браузера? Как надо работать с текстовым редактором, чтобы перегрузить свой процессор? В AMD надеются, что пользователи перед тем, как купить процессор и видеокарту, зададут себе именно эти вопросы. И тогда возникнет другой вопрос: а не лучше ли выбрать один «кусок силикона» вместо двух, тем более, что он прекрасно работает и в той, и в другой области?


 


 


Хотя A8-3850 не может догнать Core i3-2105 по производительности, тем не менее, он прекрасно демонстрирует, что игровые и развлекательные приложения лучше работают с технологией AMD Fusion.


Не забывайте, что PCMark - это всего лишь один из пакетов, которые мы собираемся сегодня использовать для тестирования. Он не выносит вердикт и претендует на истину в последней инстанции. Поэтому давайте перейдём к следующему тесту Futuremark, - 3DMark Vantage, - чтобы который позволяет оценить игровые возможности процессора. Наверное, Нет смысла говорить, что здесь уже всё было совсем по-другому.


Результаты тестирования: 3DMark Vantage


Несмотря на то, что 3DMark 11 является более новым пакетом, но единственное, что нам удалось сделать, - это запустить тест Vantage. Как оказалось, программное обеспечение на основе DirectX 10 ограничивает не только встроенную графическую карту Intel HD Graphics, но ещё и графический процессор Radeon HD 4290, который встроен в чипсет AMD 890GX.


 


В подтверждение наших выводов о синтетических тестах, которые нацелены на максимальную загрузку определённого устройства без учёта требований реально работающих приложений, Vantage действительно демонстрирует, как невероятно далеко уходит вперёд графическая система AMD от преследователей.


У Intel в процессор встроено уже второе поколение графического ядра. У AMD - первое. Но на диаграмме прекрасно видно, что решение компании выделить больше места для графического процессора на кристалле приводит к более, чем в двукратному превосходству над Intel.


 


Когда начинаешь разбираться в цифрах, то причина превосходства AMD становится очевидной. Графический движок Radeon HD 6550D просто сводит на нет все усилия HD Graphics 3000, что уже само по себе должно подтвердить преимущества совместного расположения основного и графического процессоров на одном кристалле, разрушив некогда впечатляющие результаты чипсета 890GX.


 


Результаты тестирования: Sandra 2011


 


SiSoftware Sandra 2011 идёт ещё дальше в вопросах разделения процессов тестирования. Тест Arithmetic отдельно оценивает производительность процессора при обработке целых чисел и чисел с плавающей запятой. Тест целых чисел Dhrystone является многопоточным, 64-битным и масштабируемым до 64 ядер; результат выводятся в миллионах инструкций в секунду. То же самое происходит и в тесте Whetstone, однако здесь результаты фиксируются в миллионах операций с плавающей запятой в секунду.


Четырёхядерная архитектура теста Deneb демонстрирует лучшие результаты с плавающей запятой, а двухъядерный Intel Sandy Bridge оказывается немного лучше в работе с целыми числами. Низкочастотный A8-3850 явно отстаёт от них по этим параметрам .


 


 


 


Разница между устройством ускоренной обработки данных (ALU) и математическим сопроцессором (FPU) сразу же проявляется в тесте Multimedia. Процессоры AMD обеспечивают лучшую производительность при обработке операций с плавающей запятой. Однако при использовании целых чисел для имитации чисел с плавающей запятой архитектура Intel Sandy Bridge явно оказывается впереди.


 


Обычно в данном тесте всегда доминирует Intel, однако компания решила серьёзно ограничить возможности своих процессоров нижнего ценового диапазона, отключив в них ускорение для шифрования и дешифрования симметричного алгоритма блочного шифрования (AES). Из-за этого Core i3-2105 занял последнее место, уступив грубой силе четырёх ядер Phenom II X4 с частотой 3,4 ГГц и четырём ядрам A8-3850 с частотой 2,9 ГГц.


Нет ничего удивительного в том, что двухканальная память Intel DDR3-1333 по пропускной способности оказалась на самом верху. Интересно другое - то, что при той же частоте и задержках Llano показал результат лучше, чем Deneb. Как уже отмечалось, пропускная способность памяти является очень важной характеристикой, от которой зависит производительность A8-3850 при выполнении серьёзных графических задач во время тестирования.


 


С помощью OpenCL мы смогли протестировать криптографический потенциал графических решений, интегрированных на кристалле и в чипсете. Llano оказался абсолютным лидером и в симметричном алгоритме блочного шифрования (AES), и в безопасном алгоритме хэширования (SHA); процессор Intel оказался в состоянии работать с кодом OpenCL только через ядра своего основного процессора.


Если вы ещё не нашли практического применения этим результатам, прочитайте статью «Пора взрослеть: можно ли взломать пароль с помощью графического процессора?», в которой мы использовали графический процессор для взлома пароля. Информация абсолютно легальная.


 


Результаты тестирования: Metro 2033 (DirectX 10)


 


Тестирование в режиме DirectX 10 позволяет сравнить AMD Radeon HD 6550D, Intel HD Graphics 3000 и AMD Radeon HD 4290.


Metro 2033 - довольно требовательная к ресурсам игра, поэтому не вызвал удивления тот факт, что все три графических движка при разрешении 1024х768 и Medium качестве настроек так и не смогли обеспечить для неё нормальную производительность.


Также логичным выглядит то, что AMD при переходе с интегрированного в чипсет графического ядра Radeon HD 4290 на встроенное в кристалл Radeon HD 6550D получает более чем 3xкратное увеличение производительности. Более того, Llano оказался в состоянии почти в два раза обойти HD Graphics 3000 при каждом разрешении.


 


 


В случае, если вы заинтересуетесь, почему и как производительность памяти отбрасывает назад всю платформу, вернитесь к той странице, где мы рассматривали вопросы масштабируемости памяти. Хотя переход с DDR3-1333 на DDR3-1600 и позволяет добавить пару кадров в секунду, переход ещё выше, на DDR3-1866, не приносит в Metro 2033 никакой пользы.


 


Результаты тестирования: Call of Duty: Modern Warfare 2 (DirectX 9)


 


Call of Duty, наоборот, вполне нормально работает на графическом ядре Radeon HD 6550D процессора A8-3850.


При разрешении 1680×1050 достигается почти 4-xкратное увеличение скорости по сравнению с предыдущим графическим решением AMD, интегрированным в чипсет. А скорость лучшего графического ядра Intel с выключенной функцией сглаживания оказывается в два раза меньше. Увеличиваем нагрузку при помощи режима сглаживания 4х АА, и скорость кадров у AMD почти в три раза превышает значения Intel.


Так как Call of Duty хорошо реагирует на изменения платформы, мы решили использовать стандартную память DDR3-1333, что немного снизило результаты A8-3850. Но у нас также есть результаты тестирования другой памяти, работающей на более высокой частоте. Мы уже показывали эту диаграмму, но можно показать её ещё раз:


 


 


Максимальное увеличение производительности происходит при переходе с памяти DDR3-800 на DDR3-1066, а потом - на DDR3-1333. Но даже при переходе на DDR3-1600 наблюдается серьёзный прирост, хотя при этом придётся изменить скорость подачи команд ( Command Rate) на значение 2Т (перед этим он был 1Т. «Быстрый» 1T плохо дружит с высокими частотами памяти).


Переход на DDR3-1866 на самом деле оказался пагубным для производительности, потому что из-за этого пришлось уменьшить пару других задержек, хотя CAS 8 всё-таки удалось сохранить. Идеальным решением в этой ситуации, однозначно, будет DDR3-1600 с наименьшими задержками.


Результат тестирования: World Of Warcraft: Cataclysm (DirectX 9 и 11)


 


Игроки World Of Warcraft - радуйтесь! Именно для таких игр и разрабатывался Llano. Вряд ли можно найти более популярную игру, чем World of Warcraft, и даже при разрешении 1680×1050 частота кадров остаётся ровной и непрерывной, хотя, при этом, необходимо выбрать для качества графики в настройках параметров Good и отключить функцию сглаживания. И там, где Core i3-2105 и 890GX падают ниц и сдаются, A8-3850 с гордостью продолжает работать.


В этой игре у AMD есть двойное преимущество. Оно проявляется не только в том, что AMD использует в этой перестрелке своё самое крупнокалиберное оружие, но ещё и в том, что A8-3850 - это единственный графический процессор с поддержкой DirectX 11 из всех остальных, участвующих в тестировании. Как это обычно бывает, последний патч 4.1 добавил официальную поддержку DirectX 11 в этой игре, в то время как раньше она была экспериментальной. Если в общем DirectX 11 может улучшить качество графики, то в дополнении Cataclysm его задача - улучшить производительность. Эффект от включения DirectX 11 рассматривался в статье «World Of Warcraft: Cataclysm -Tom’s Performance Guide».


В результате оба графических процессора - Intel Core i3 и AMD 890GX - пришлось тестировать под DirectX 9, в то время как под DirectX 11 APU Llano с лёгкостью выигрывает это соревнование.


 


 


 


Результаты тестирования: Content Creation (cоздание контента)


 


Игры, несомненно, являются наиболее захватывающим и интересным сегментом сегодняшних тестов. Но, начиная с этого момента, нам придётся иметь дело с ограничениями архитектуры Stars и теми компромиссами, на которые пришлось пойти AMD, чтобы, урезав кэш L3, высвободить дополнительное место для графики.


Наш многопоточный тест Photoshop лучше работает с 4-хъядерной архитектурой AMD Deneb внутри Phenom II X4. Двухъядерный Intel i3-2105 занимает второе место, а четырёхъядерный A8-3850 - третье, отстав от него на одну секунду.


 


Premiere Pro CS5 значительно увеличивает скорость работы после установки дополнительной внешней видеокарты CUDA, способной ускорять движок Mercury Playback Engine. Ни одна из тестируемых платформ не имеет такой функции, поэтому нам остаётся довольствоваться только кодированием на базе программного обеспечения. Интересно, что двухъядерный Core i3-2105 в этом случае показал наилучший результат, за ним следуют Phenom II X4 и A8-3850.


Подозревая, что Premiere Pro не хватит памяти после установки четырёхъядерного процессора, мы заменили наш 4-Гб DDR3-2133 на 8 Гб DDR3-1333 и попробовали пройти тест ещё раз. Phenom II X4 показал результат 3556 секунд. Это доказывает, что дополнительная память не помогает архитектуре AMD работать лучше; данный тест просто лучше подходит под процессоры Intel.


 


 


After Effects либо не хватает кэша L3 ядра Deneb, либо преимуществ его тактовой частоты, так как AMD A8-3850 уступает в сравнении с Phenom II X4 965 Black Edition. Intel Core i3-2105 не нужна большая скорость, как, впрочем, и большой кэш L3, чтобы отстать от Phenom.


 


 


Четырёхъядерные процессоры оправдали себя в Blender, где Phenom II X4 с частотой 3,4 ГГц финишировал первым, A8-3850 - вторым, а Intel Core i3-2105 - третьим, так как его два ядра оказались не в состоянии достойно конкурировать с соперниками.


 


Как и ожидалось, самым наилучших результатов в графической дисциплине добился AMD A8-3850, а самым быстрым процессором стал четырёхъядерный Phenom II X4. Примечательно, что APU Llano оказался лучше Intel Core i3-2105 в обоих тестах.


Результаты тестирования: производительность


 


 


Этот сложный многопоточный показал незначительное преимущество четырёхъядерного AMD над двухъядерным Intel с технологией Hyper-Threading. На диаграмме видно, что процессоры A8-3850 и Core i3 финишируют почти одновремено. Phenom II X4 оказался быстрее, но значительно уступил в работе с графикой (из-за своего медленного чипсета 890GX). Стоит Phenom II X4 - 130 американских долларов.


 


 


В данном тесте многопоточность была загружена не на полную мощность, поэтому четырёхъядерному A8-3850, работающему на более низких частотах, показать было нечего. Это была территория Intel - их технология потактовых операций оказалась эффективней, что и позволило Core i3 подняться на первое место, несмотря на частоту 3,1 ГГц.


Даже 3,4-ГГц Phenom II не в состоянии выполнить за один такт такой объём работы. Поэтому вполне естественно, что флагман AMD на основе Llano, работающий на частоте 2,9-ГГц, оказывается ещё в более тяжёлом положении.


 


При тестировании в WinZip 14 наблюдается точно такая же картина, потому что этот тест тоже однопоточный. Правда, на этот раз Phenom II X4 финиширует с меньшим отставанием от Core i3, но A8-3850 всё ещё далеко до них.


 


 


В WinRAR многопоточность тестируется явно сильнее. Однако Intel удаётся остаться на первом месте, за ним следует Phenom II X4 и A8-3850 занимает третью строчку в списке.


 


 


И вот наконец-то четыре ядра обходят два ядра с технологией Hyper-Threading. AMD Phenom II X4 выходит на первое месте в тесте 7-Zip, а четырёхъядерный A8-3850 финиширует вторым. Intel Core i3 вынужден довольствоваться третьим местом, оказавшись на три секунды медленнее, чем самый быстрый APU Llano.


 


Если вас беспокоит настройка пропускной способности DDR3-1333, не забывайте, что пропускная способность памяти влияет на графические приложения больше, чем всё остальное. DDR3-1600 может сэкономить пару скудных секунд при выполнении сжатия в WinRAR, но этого всё равно будет недостаточно, чтобы Llano сравнялся с Phenom II X4, имеющего огромный кэш L3

- 0 +    дата: 18 декабря 2013

   Загружено переводчиком: Евтишенков Игорь Николаевич Биржа переводов 01
   Язык оригинала: английский    Источник: www.professionaltranslation.ru