ГлавнаяКонтактыКарта сайта
ЕПОС
О компанииКомпьютерная криминалистикаВосстановление информацииЗащита информацииПроизводство и ITСервисНаши разработки

Расследование инцидентов, компьютерная криминалистика, информационная безопасность

Книжная серия Взгляд на жесткий диск изнутри




Архив статей


26.09.2003
64 бита - роскошь или необходимость?

Богдан ПЕНЮК
Вячеслав ОВСЯННИКОВ

 

23 сентября официально анонсированы новые 64 битные процессоры от AMD, Athlon 64 3200+ и Athlon 64 FX-51. Однако, пользователи сети интернет уже давно знакомы с этими процессорами, поскольку первые процессоры архитектуры AMD64 (Opteron) появились еще в начале этого года. Да и отдельные экземпляры процессоров Athlon 64 за это время у многих побывали в руках. ЕПОС также имел возможность всесторонне исследовать производительность и возможности новых процессоров, а также отработать новую модель графической станции. Соответственно, доступны и результаты их тестирования, и достаточно подробно описаны архитектурные особенности этих процессоров. Мы тоже рассмотрим некоторые технические решения, примененные в новых процессорах (как мы это видим) и приведем некоторые результаты тестирования.

Кому нужны эти 64 бита?

Главное отличие новых процессоров AMD от выпускаемых ранее - они 64 битные. К тому же с новыми процессорами от AMD нам обещают легкий переход к 64 битным вычислениям. Но хотим ли мы к ним идти? Прежде чем обсуждать, хороша или плоха архитектура AMD64 вообще и новые процессоры в частности, необходимо определиться, а нужно ли это нам вообще?

Прежде всего нас всегда интересует, конечно, быстродействие. Однако, переход к 64 разрядным вычислением, оказывается, сам по себе не сулит нам повышения этого самого быстродействия. Вспомним историю. К примеру, первый 32 разрядный процессор - это процессор i386. При одинаковой тактовой частоте его производительность оказывалась в точности равной производительности i286 процессора. Так же будет и с переходом к 64 битным вычислениям. Только очень немногие задачи, например криптография, сразу получат выигрыш в виде большей скорости, так как оперируют с цифрами очень большой разрядности (мегабит сейчас в этих задачах далеко не предел).

Второе преимущество 64 битных вычислений - возможность прямой адресации большого объема памяти. Тут выигрыш от 64 разрядов очевиден. 32 разряда позволяют адресовать напрямую только до 4 Гбайта, а 64 разряда позволят адресовать просто астрономический объем памяти.

Единственный вопрос, который при этом возникает: а зачем?

Этот вопрос довольно часто встречается в обзорах, посвященных 64 битным процессорам. Иногда обращается внимание на то, что сейчас и гигабайт оперативной памяти встречается не так уж часто. И в большинстве случаев высказывается мнение, что большой объем непосредственно адресуемой памяти - это не плохо, но не предмет первой необходимости.

Но на самом деле, речь ведь идет не о доступном объеме оперативной памяти, а об общем объеме адресуемой памяти. А это далеко не одно и то же. И оказывается, что 4 Гбайта для некоторых задач уже сейчас мало. Обратите внимание на рис.1:

 


Рис.1. Сообщение о невозможности выполнения приложения ввиду нехватки виртуальной памяти

 

На жестком диске свободного пространства было достаточно, других открытых приложений тоже не было, но, тем не менее, предельный размер файла подкачки Windows составляет 4095 Мбайт, и это ограничение связано не с прихотью разработчиков, а с ограничением 32 разрядной архитектуры. Приведенный же на рис.1 скриншот явно показывает, что уже сейчас хотелось бы снять это ограничение на объем адресуемой памяти в 4 Гбайта.

Конечно, способы преодоления 4 Гбайтного барьера известны очень давно. Уже в упоминавшемся выше процессоре i386 был встроен администратор памяти, который позволял работать с виртуальной памятью объемом до 64 Тбайт. Однако, все известные методы увеличения объема адресуемой памяти основаны на разбиении доступного адресного пространства на страницы. При этом необходимо вначале выбрать нужную страницу, а затем указать требуемый адрес в пределах страницы. Это приводит к значительному (иногда более 30%) снижению производительности процессора. Поэтому такие методы применяются только в случае крайней необходимости.

Таким образом, расширение адресуемого напрямую адресного пространства уже сейчас востребовано и востребовано из соображений производительности.

В связи с вышесказанным, подспудно возникает еще один вопрос: Если сохранение высокой производительности при адресации большого объема памяти возможно только в 64 разрядных приложениях, то где взять эти приложения, и что делать, пока таких приложений еще нет? Подсознательно возникают сомнения, а не рано ли внедрять повсеместно 64 битные процессоры. Странная ситуация: с одной стороны нет смысла приобретать 64 разрядный процессор, пока нет 64 битных приложений, а с другой стороны - кому же охота разрабатывать серьезные приложения для процессоров, которые никто не покупает. Просто замкнутый круг какой-то.

Давайте еще раз вспомним историю, как прошел переход от 16 к 32 разрядам. А этот переход происходил не очень быстро, и почти незаметно для нас. 32 разрядный процессор (i386) появился в 1985 году. Первые системы на базе процессора i386 выпущены в конце 1986года. Но большинство систем еще очень долго продолжало работать под управлением 16 разрядной операционной системы (MS DOS). Конечно, любое приложение имело право перевести процессор в защищенный режим и работать в 32 разрядной среде. Однако, особого смысла в этом не было. По крайней мере, приложения от этого не становились быстрее. Поэтому весь компьютерный "IBM совместимый" мир еще долго оставался в подавляющем большинстве 16 разрядным. И только с появлением массовой 32 разрядной операционной системы Windows 95 и эффективных 32 разрядных компиляторов началась эпоха массового применения 32 разрядной архитектуры.

Отметим, что успех Windows 95 определялся не столько более быстрой работой приложений, сколько тем, что под управлением 32 разрядной операционной системы выполнялись все старые 16 разрядные приложения. И выполнялись не медленнее, чем под управлением MS DOS. Отвлекаясь от темы, заметим, что второй важнейшей составляющей успеха Windows 95 являлся великолепно отработанный анинсталлер. Благодаря ему неискушенные в инсталляциях пользователи раз по 20 безболезненно устанавливали и деинсталлировали Windows 95, пока не привыкли к ней и не убедились, что 32 разряда все же лучше, чем 16.

Таким образом, 32 разрядные процессоры появились тогда, когда без них еще можно было обойтись. Но их широкое распространение стимулировало разработку 32 разрядных приложений. Благодаря этому, когда 16 разрядов действительно стало недостаточно, весь мир очень быстро перешел к 32 разрядам. Весь переход прошел за каких-нибудь 12..15 лет, из которых ровно 10 ушло на осознание того, что 32 это все же больше, чем 16.

Также будет и с переходом к 64 битам. Мы хотим перейти к 64 битам, переходить к 64 битам уже пора, но ведь достаточно долго без этого еще можно будет обойтись. Самый лучший вариант перехода - иметь уже сейчас 64 битный процессор, но на котором все имеющиеся 32 разрядные приложения исполняются не медленнее, чем на 32 разрядной платформе. По мере появления 64 битных приложений мы будем иметь возможность их использования, не теряя возможность использования остальных (32 битных) приложений. Сам же переход к 64 битам обещает не затянуться на десятилетия. По крайней мере, сейчас, к моменту анонса 64 битных процессоров для настольных систем, уже существуют несколько чипсетов, поддерживающих новые процессоры, есть 64 битные компиляторы, существует версия Linux для 64 битных процессоров AMD, есть бета-версия 64 битной системы Windows ХР.

Тем не менее, тестируя сейчас 64 битные процессоры, мы в первую очередь интересуемся, как они ведут себя под 32 битными приложениями. Тем более что в новых 64 битных процессорах от AMD применены весьма оригинальные решения, обещающие повышение производительности как под 64 битными, так и под 32 битными приложениями.

Что такое Athlon 64?

В первую очередь, нужно подчеркнуть, что в архитектуре AMD64 основное внимание было уделено вопросу совместимости с широко распространенными сейчас 32 битными приложениями. Новые процессоры полностью совместимы с 32 разрядными (вообще говоря, даже и с 16 разрядными) приложениями. Совместимость достигнута за счет того, что архитектура AMD64 является расширением архитектуры х86. Существующие в архитектуре х86 регистры расширены до 64 бит, при этом младшие 32 бита каждого регистра могут использоваться 32 битными приложениями так же, как и в архитектуре х86:

 


Рис.2. Принцип использования 64 битных регистров в 32 и 16 битных приложениях

 

Благодаря такому решению процессоры Athlon 64 и Opteron в определенной степени сейчас занимают то же положение, что в свое время занимал процессор i386. На машине с процессором Athlon 64 можно запускать все приложения, с которыми пользователь работает в настоящее время. По мере появления 64 битных приложений на этой же машине можно будет запускать и старые и новые приложения. Благодаря этому переход к 64 разрядным вычислениям обещает быть безболезненным.

В структуре ядра процессора произошли довольно серьезные изменения. Некоторые изменения касаются только 64 битных приложений. Это, в частности, возможность прямой адресации свыше 4 Гбайт, из-за чего, собственно, все и затевается.

Приняты определенные меры к улучшению производительности на 64 битных приложениях. Так, в архитектуре AMD 64 можно использовать в два раза больше регистров, что, безусловно, позволяет повысить скорость выполнения приложений. Естественно, эту возможность нельзя использовать в 32 разрядных приложениях, так как эти приложения "не знают" о наличии дополнительных регистров.

Улучшению подверглись и многие другие узлы процессора. Так, в частности, блоки декодирования команд х86 преобразуют входную последовательность в заметно меньшее количество микрокоманд.

Но об одной архитектурной особенности, способствующей улучшению производительности как в 64, так и в 32 битном режиме, необходимо остановиться. Речь идет о "контроллере памяти, встроенном в процессор".

На самом деле эта фраза не совсем корректна. Вспомним, как устроен компьютер. На материнской плате запаян определенный чипсет - набор микросхем, обеспечивающих взаимодействие всех элементов компьютера. В основе любого чипсета традиционно лежат две микросхемы, одна из которых это "северный мост", другая - "южный мост". К северному мосту подключается процессор, память, видеосистема (AGP) и южный мост. Южный мост обеспечивает интерфейсы со всеми стандартными периферийными устройствами.

Как правило, о компьютере судят прежде всего по установленному в нем процессору. Поэтому и считается, что северный мост обеспечивает связь процессора с остальными элементами компьютера. Однако на самом деле северный мост обеспечивает в первую очередь обмен информацией между всеми элементами (включая и процессор) с памятью. Именно память является самым узким местом компьютера. Ведь практически все элементы компьютера работают только через память. Поэтому правильнее считать, что северный мост - это элемент, который обеспечивает связь памяти со всеми элементами компьютера (в том числе и с процессором). Давайте посмотрим на структурную схему процессора Opteron.

 


Рис.3. Упрощенная схема процессора Opteron

 

В состав микросхемы процессора входит Crossbar - коммутатор, который обеспечивает взаимодействие памяти с процессором и периферией (по шинам HyperTransport) Именно Crossbar, а не процессор взаимодействует с контроллером памяти. Таким образом, правильнее будет считать, что 64 битные процессоры AMD - это на самом деле северный мост со встроенным в него процессором. Собственно говоря, именно так и задумывалось разработчиками. Взгляните, например, на рис 4, взятый из официального документа "AMD OpteronT Processor. Data Sheet".

 


Рис.4. Блок - схема процессора Opteron

 

Такое построение позволяет реализовать очень высокую скорость обмена данными с процессором. Как таковое исчезает понятие "Front Side Bus", обозначавшее шину процессор - северный мост. Так же как и понятие тактовой частоты этой шины. Весь обмен происходит на тактовой частоте ядра процессора.

На рис.5 и рис.6 приведены результаты измерения скорости обмена данными процессора с кэш и памятью для процессора AMD Athlon64 3200+ на плате MSI MS-6702 (чипсет VIA K8T800) и процессора AMD Athlon XP 3200+ на плате ASUS A7N8X Deluxe (чипсет nVidia nForce2 Ultra) соответственно.

 


Рис.5. Скорость обмена данными и задержки для процессора Athlon 64 3200+

 

 


Рис.6. Скорость обмена данными и задержки для процессора Athlon XP 3200+

 

Скорость обмена данными процессора Athlon 64 с памятью ограничивается только пропускной способностью самой памяти, и задержки у процессора Athlon 64 заметно меньше, чем у процессора Athlon XP.

Скорость обмена данными с периферийными устройствами также ограничивается фактически только пропускной способностью памяти.

Безусловно, высокая скорость работы с памятью означает, что в большинстве приложений такой процессор при одинаковой тактовой частоте покажет большую производительность.

Производительность

Определение производительности процессора сейчас - это самая неблагодарная задача. Что бы мы ни намеряли, всегда останутся недовольные полученными результатами. Тем более, что все современные процессоры имеют существенные отличия друг от друга во внутренней структуре и каждый из них имеет преимущества перед другими на определенном круге задач. Тем более бесполезно сейчас сравнивать производительность компьютеров по тактовой частоте их процессоров. Это еще хуже, чем оценивать скоростные характеристики автомобилей по показаниям тахометра их двигателей.

Для процессоров AMD производительность оценивается по результатам совокупности определенных тестов, и индекс производительности указывается в обозначении процессора как номер модели ("Model number"). Не следует думать, что это какой то обман. И к "Пентиум-рейтингу" "Model Number" не имеет отношения.

Первыми, кто понял, что нельзя по тактовой частоте судить о производительности процессора, была Intel. Именно она ввела так называемый iCOMP - индекс (Intel COmparative Microprocessor Performance). Индекс iCOMP выводился по результатам нескольких контрольных тестов (так же, как сейчас выводится Model Number для процессоров AMD, но конечно, на другом наборе тестов). В 1996 году был введен iCOMP Index 2.0 для более корректного отражения новейших на то время 32 разрядных процессоров. В частности, процессор Pentium-MMX 233 имел iCOMP Index 2.0 равный только 203, а процессор Pentium II 233 - iCOMP Index 2.0 равный 267. Беда была только в том, что iCOMP Index даже в первоначальном виде почему-то оказался сильно "заточенным" под процессоры Intel. Поэтому другие производители процессоров стали измерять производительность своих процессоров на другом наборе тестов. Это и называлось "Pentium-рейтинг".

Таким образом, нет ничего страшного в том, что вводится какой-то искусственный индекс, связанный с производительностью процессора. В любом случае такой индекс более правильно характеризует производительность процессора, чем его тактовая частота. Плохо только то, что нет единого мнения, каким должен быть этот набор тестов, чтобы правильно характеризовать производительность любого процессора. Поэтому в настоящее время реально оценить производительность различных процессоров можно только по результатам замера времени выполнения различных операций в реальных приложениях, производительность в которых наиболее важна конкретному пользователю.

Мы тоже сторонники делать выводы только по результатам выполнения операций на реальных приложениях, но некоторые общеупотребительные тесты мы все же проведем, чтобы разобраться, есть ли разница между Athlon XP 3200+ и Athlon 64 3200+, если последний вынужден еще долго работать под 32 разрядными приложениями.

Итак, какова же скорость выполнения арифметических операций, если вычислительные конвейеры у процессоров Athlon XP и Athlon 64 в принципе одинаковые, но тактовая частота ядра процессора Athlon XP 3200+ составляет 2,2 ГГц, а тактовая частота ядра процессора Athlon 64 3200+ только 2 ГГц?

 


Рис.7. Результаты выполнения теста SiSoftware Sandra

 

Из результатов, приведенных на рис. 7, видно, что производительность процессора Athlon 64 3200+, имеющего тактовую частоту ядра 2000 МГц, на операциях с фиксированной точкой только немногим превышает производительность на этих операциях процессора Athlon XP 2400+, также имеющего частоту ядра 2000 МГц. Впрочем, уже хорошо, что все же превышает при той же тактовой частоте. На операциях же с плавающей точкой производительность этих процессоров оказывается практически одинаковой (если не учитывать операции с SSE2). И только поддержка системы команд SSE2 позволила процессору Athlon 64 3200+ обогнать на операциях с плавающей точкой даже процессор Athlon XP 3000+.

В этих результатах в принципе ничего удивительного нет. Если конвейеры одинаковые, то быстрее будет тот процессор, у которого выше тактовая частота. Однако нужно учитывать, что реально практически невозможно найти задачу, в которой львиная доля операций - это выполнение арифметических действий. В конце концов, процессор хотя бы должен получать новые данные для расчетов, т.е. обращаться к памяти. Поэтому тест SiSoftware Sandra - очень хороший тест, если правильно трактовать его результаты. В большинстве же случаев его результаты не намного отличаются по информативности от показаний тахометра двигателя автомобиля.

Существуют тесты, более приближенные к "боевым условиям". Например, 3D Mark. Приведем, например, результаты теста 3D Mark 2001 SE (кстати, это один из тестов, на основании которых выводится "Model Number").

 


Рис.8. Результаты теста 3D Mark 2001 SE

 

Результаты показывают, что при обработке графики Athlon 64 3200+ должен оказаться предпочтительней, чем Athlon XP 3200+. Однако, в этом тесте задействовано слишком много элементов компьютера, а не только процессор. Простым изменением настроек видеокарты мы могли бы легко уменьшить результаты любого процессора, по крайней мере, вдвое.

Более приближены к реальным условиям "игровые" тесты, в частности, Quake III.

 


Рис.9. Результаты теста "Quake III" (больше - лучше)

 

Конечно, и в этом тесте на результат влияет очень много элементов компьютера, в результате чего это все же показатель производительности не процессора, а конкретного компьютера с испытываемым процессором. Тем не менее, поскольку в приведенном тесте нами применялась одна и та же видеокарта с одинаковыми настройками, то результаты показывают, что в большинстве режимов Athlon 64 3200+ оказывается быстрее чем "младший брат", Athlon XP 3200+. Но надо обратить внимание на то, что в режиме High Quality ситуация изменяется на противоположную. Это связано с тем, что в этом режиме значительно возрастает доля чисто математических вычислений, и при одинаковых арифметических блоках, безусловно, побеждает тот процессор, у которого больше тактовая частота ядра.

Данные результаты мы привели не столько с целью характеризовать производительность рассматриваемых процессоров, сколько с целью еще раз подчеркнуть два момента, связанных с оценкой производительности по результатам тестирования:

  • Результаты оценки производительности могут характеризовать производительность процессора только "в среднем", на большой группе задач. Всегда найдутся задачи, в которых соотношение производительности близких процессоров может измениться, иногда на противоположное.
  • Чем ближе к реальным задачам пользователя применяемый тест, тем точнее получается оценка. Самую лучшую оценку можно получить, измеряя время выполнения операций на реальных приложениях. При этом мы получаем самую точную оценку производительности, но только не процессора, а конкретного компьютера и только на очень узком круге задач.

И все же реальные приложения лучше характеризуют процессор, чем любые искусственные тесты. Поэтому особое внимание мы уделили оценке производительности при выполнении реальных приложений.

Из распространенных задач наиболее ресурсоемкими до сих пор остаются задачи обработки видео и графических изображений. Поэтому основное внимание в тестировании мы уделили производительности при наложении различных фильтров на тестовое изображение объемом 60 Мб в Adobe Photoshop 7.0 и на тестовый ролик продолжительностью 1 минута в программе Adobe Premiere 6.5. Эти приложения удобны для оценки реальной производительности не только потому, что требуют значительных вычислительных ресурсов, но и потому, что эти фильтры требуют повышенной производительности различных элементов компьютера и самого процессора. Некоторые фильтры по своей природе - это чисто вычислительная задача (соответственно, время наложения такого фильтра практически полностью зависит от характеристик процессора с плавающей точкой и от тактовой частоты ядра процессора). Зато другие фильтры оперируют с большим объемом данных, поэтому для них более важным являются скорость обмена данными процессора с кэш и оперативной памятью. Поэтому задачи обработки видео и графических изображений позволяют наиболее полно оценить реальную производительность процессора при выполнении широкого круга задач.

Именно поэтому в качестве тестовых платформ мы выбрали разработанные в ЕПОС системы обработки графики и видео и ниже приводим результаты измерения времени выполнения отдельных операций в среде Adobe Photoshop и Adobe Premiere.

Результаты измерения времени наложения различных фильтров в Adobe Photoshop приведены на рис. 10.

 


Рис.10. Время наложения различных фильтров в Adobe Photoshop (меньше - лучше)

 

Результаты показывают, что при обработке изображений в среде Photoshop 7.0 процессор Athlon 64 более предпочтителен, чем Athlon XP. За очень редкими исключениями его результаты лучше. По всей видимости, это связано с тем, что Adobe Photoshop очень сильно оптимизирован для Pentium 4 и активно использует команды SSE2.

Несколько другая картина получается в среде Adobe Premiere (рис.11):

 


Рис.11. Время наложения различных фильтров в Adobe Premiere 6.5 (меньше - лучше)

 

В большинстве случаев результаты совпадают с точностью до десятых долей.

Это именно тот результат, который мы ожидали. Благодаря введению Model Number при выборе процессоров AMD нет смысла глубоко вдаваться в технические особенности конкретного процессора или узнавать значение тактовой частоты. В большинстве случаев 3200+ будет одинаково быстро работать, будь то Athlon XP или Athlon 64.

Opteron

Пользуясь случаем, хотим привести также результаты тестирования и для процессоров Opteron. Для этих процессоров не вводится уже ставший привычным Model Number, который многие, не вникая в суть дела, называют "Пентиум-рейтингом". Обозначение моделей процессоров Opteron вообще не связано с тактовой частотой его ядра. Поэтому весьма целесообразно иметь представление о соотношении его производительности с производительностью других процессоров. Тактовая частота ядра тестируемого нами процессора Opteron 242 составляет 1600 МГц. Это, по идее, должно соответствовать процессору Athlon XP 1900+. Результаты измерения времени наложения различных фильтров в Adobe Premiere 6.5 для процессоров Opteron 242 (в однопроцессорной конфигурации), Athlon XP 2200+, Athlon XP 2600+ и Athlon XP 2800+, приведенные на рис. 12, не подтверждают этот вывод:

 


Рис.12. Сравнение производительности процессоров при наложении фильтров в Adobe Premiere 6.5 (меньше - лучше)

 

Мы уже привыкли, что сравнение процессоров различной архитектуры (например, процессоров AMD и Intel) это не простая задача. Производительность различных процессоров можно сравнивать только "в среднем". Процессоры считаются равными по производительности в том случае, когда на одних задачах один процессор показывает несколько лучшие результаты, на других другой. Мы уже привыкли, что, как правило, разброс результатов получается не очень-то и большим. Сравнивая же приведенные на рис.5 результаты мы видим весьма значительный разброс значений на различных операциях. Трудно однозначно определить, какому же процессору Athlon XP соответствует производительность процессора Opteron 242. В некоторых случаях (например, при наложении фильтра "Spherize") процессор Opteron 242 намного опережает процессор Athlon XP 2800+, приближаясь по производительности к процессору Athlon XP 3000+. Зато в других случаях (например, при наложении фильтра "mirror") производительность процессора Opteron 242 оказывается хуже, чем процессора Athlon XP 2200+ (фактически, оказывается равной производительности процессора Athlon XP 1900+).

В целом же, анализируя приведенные выше данные, можно утверждать, что производительность процессора Opteron 242 в задачах нелинейного монтажа примерно соответствует производительности процессора Athlon XP 2600+.

Сравнение с процессорами Intel

Конечно, определить место процессора Opteron в ряду других моделей процессоров, выпускаемых AMD, интересно, но все же большинство, по нашем наблюдениям, интересует сравнение производительности процессоров от AMD с производительностью процессоров от конкурентов. С процессорами семейства Athlon XP все понятно. Независимо от объема кэш, частоты FSB и тактовой частоты ядра процессор Athlon XP 2800+, к примеру, это всегда 2800. Не больше, но и не меньше. Для процессоров Intel кроме тактовой частоты ядра обязательно необходимо знать объем кэш и тактовую частоту FSB, чтобы правильно представлять производительность процессора. В целом получается такая картина: процессоры Pentium 4 с тактовой частотой ядра ниже 2 ГГц даже не с чем сравнить. Это просто медленные процессоры в большинстве случаев. Если предстоит выбор между процессором Pentium 4 с тактовой частотой ядра 2...3 ГГц и процессором Athlon XP с номером модели от 2000+ до 3000+, то для задач обработки графики и нелинейного монтажа мы всегда рекомендуем процессоры Athlon XP. Последние же процессоры Pentium 4 с частотой FSB 800 ГГц и технологией HyperTrading это действительно мощные процессоры. И мы не видим принципиальной разницы для задач нелинейного монтажа между процессорами Pentium 4 3,2 ГГц и Athlon XP 3200+. Сравнивать же Athlon 64 3200+, первый процессор архитектуры AMD 64, с "топовыми" моделями процессоров Intel как-то не очень корректно. Athlon 64 на большем количестве тестов и реальных приложениях побеждает. Нужно дождаться ответного хода Intel. Но вот сравнить процессоры Opteron с процессорами Intel по-видимому необходимо, опять же с целью правильного позиционирования этих процессоров.

По результатам тестирования, проведенного в лаборатории ЕПОС, наиболее близким по производительности аналогом двухпроцессорной системы на базе процессоров Opteron 242 (тактовая частота ядра 1600 МГц), является двухпроцессорная система на базе процессоров Intel Xeon 2,4 ГГц. Пропуская промежуточные результаты, приведем данные именно для этих платформ. На рис. 13 и 14 приведены результаты измерения времени наложения различных фильтров в среде Adobe Premiere 6.5 и Adobe Photoshop 7.0.

 


Рис.13. Сравнение производительности процессоров при наложении фильтров в Adobe Premiere 6.5 (меньше - лучше)

 

 


Рис.14. Сравнение производительности процессоров при наложении фильтров в Adobe Photoshop 7.0 (меньше - лучше)

 

Сравнивая результаты, приведенные на рис. 13 и рис. 14 можно заметить, что двухпроцессорная система на базе процессоров Opteron 242 с тактовой частотой ядра 1600 МГц в задачах обработки видео и графических изображений в 32 разрядном режиме в среднем действительно равна по производительности двухпроцессорной системе на базе процессоров Xeon 2.4 ГГц. Хотя при желании можно привести не все значения или подобрать соответствующую группу тестов и элементарно показать преимущество любого из этих процессоров.

Что впереди

За рамками данной статьи осталось много интересных моментов, связанных с принципами построения систем на базе 64 разрядных процессоров от AMD. В частности, не рассмотрены особенности технологии HyperTransport. Внедрение данной технологии в системах на базе процессоров Opteron позволило значительно повысить скорость обмена данными периферийных устройств с процессором и памятью. Но и это не все. Продвижению процессоров AMD на рынок серверов мешало только отсутствие чипсетов, ориентированных для применения в серверах. Единственный чипсет 760 МР/760МРХ поддерживал только двухпроцессорные конфигурации.

Благодаря применению HyperTransport в высокопроизводительных системах на базе процессоров AMD появились две раздельные 64 битные шины: 100 МГц PCI-X и 66 МГц шина PCI. Для серверов это, как правило, важнее, чем производительность процессора. Более того, Hyper Transport позволяет очень легко создавать 4-х и 8-ми процессорные структуры, обладающие уникальной производительностью.

Двухпроцессорная система на базе процессоров Opteron это одна из немногих платформ, на которой без сбоев работает самая производительная плата нелинейного монтажа от Pinnacle System - Targa 3000.

Что же касается 64 битных процессоров, предназначенных для применения в рабочих станциях, то их выпуск это очень хороший признак. Пока мы еще только пытаемся понять, нужно ли нам в рабочей станции 64 бита, многие производители компьютеров уже объявили о новых моделях рабочих станций и даже ноутбуков с 64 разрядными процессорами от AMD. По всей видимости, 64 разрядные процессоры постепенно вытеснят процессоры Athlon XP, создавая этим предпосылки для более быстрого перехода к 64 разрядным приложениям.

Если же говорить о повышении производительности, то дальнейший рост сдерживается технологией производства процессоров. Все заметили, что рост тактовых частот процессоров Athlon XP практически прекратился на отметке чуть выше 2200 МГц. Но ведь и Intel стал испытывать серьезные трудности после 3000 МГц. При разработке процессоров Athlon и Pentium 4 приняты разные идеологии. AMD взяла курс на повышение эффективности вычислений, а Intel - на возможность значительного повышения тактовой частоты. И тот, и другой путь имеет право на существование. В конечном счете, нам все равно, выполнит ли процессор операцию за 2 такта или за 4, если каждый из четырех тактов выполняется в два раза быстрее. Но оказывается, что технология ставит абсолютный предел на увеличение производительности. Нельзя тактовую частоту повышать до бесконечности. Поэтому обе линейки процессоров достигли примерного равенства по производительности и одновременно потолка своего развития в рамках данной технологии. И внедрение 64 битных процессоров радикально не изменит ситуацию. Так что для дальнейшего повышения производительности мы должны дождаться появления процессоров, выполненных по более совершенной технологии. Оба конкурента обещают нам этот переход очень скоро, чуть ли не в конце этого года, или в начале следующего. Так что прогресс не остановился, а мы с огромным интересом будем ждать, кто же сделает этот шаг быстрее и не только на бумаге.


Поделиться информацией