ГлавнаяКонтактыКарта сайта
ЕПОС
О компанииКомпьютерная криминалистикаВосстановление информацииЗащита информацииПроизводство и ITСервисНаши разработки

Расследование инцидентов, компьютерная криминалистика, информационная безопасность

Книжная серия Взгляд на жесткий диск изнутри




Архив статей


26.03.2002
Закон Мура в интерпретации AMD

Богдан ПЕНЮК, начальник исследовательской лаборатории компании «ЕПОС»
Вячеслав ОВСЯННИКОВ, к. т. н., ведущий специалист компании «ЕПОС»

От авторов

С 19 по 23 февраля в Киеве проходила очередная ежегодная выставка EnterEX 2002. В рамках этой выставки компания «Евроиндекс» и издательский дом «Мой компьютер» провели конференцию «Производство персональных компьютеров 2002». В качестве докладчиков были приглашены представители ведущих мировых фирм (AMD, VIA, Maxtor), специалисты украинских фирм. Три семинара провели специалисты «ЕПОС», в том числе два доклада сделали авторы.

Многие слушатели выразили пожелание разместить наши презентации в интернете. К сожалению, подготовленные авторами для доклада презентации ориентированы только на доклад, а не на самостоятельное ознакомление. Поэтому авторы изложили суть своих докладов в статье, которую мы и предлагаем вашему вниманию.

 

Прошло чуть больше года с момента, когда процессоры AMD перешагнули рубеж 1 ГГц. На выставке EnterEX 2002 компания «ЕПОС» представила станцию нелинейного монтажа с процессором Athlon XP 2000+, мощную графическую станцию на двух процессорах Athlon MPX 1900+, домашние и офисные компьютеры с процессорами Duron 1200 и 1300. Казалось бы, что закон Мура (производительность процессора за год удваивается) выполняется. Но всё же остаётся какой-то осадок. Не совсем понятно: 2000+ на сегодня – это много или мало?

На прошлой выставке EnterEX подчёркивалось, что процессоры Athlon «взяли планку» в 1 ГГц, причём раньше, чем это сделали процессоры Intel. На выставке в этом году Athlon XP 2000+ – это чуть ли не рядовое явление. Зато очень много шума по поводу процессоров Pentium 4 с тактовой частотой ядра 2,2 ГГц. Более того, в обозначении процессоров Athlon XP указывается цифра большая, чем тактовая частота ядра этого процессора. Многие заподозрили в этом страшный подвох. В панике некоторые отечественные фирмы даже поспешили заявить, что теперь они выпускают компьютеры только на процессорах Intel. Так в самом деле, это много или мало, 2000+?

PR или Model Number?

У процессоров Athlon XP 2000+ цифра в обозначении – это, согласно официальным заявлениям AMD, так называемый «Model Number» – просто порядковый номер конкретного процессора в линейке процессоров AMD. По замыслу цифра должна обозначать тактовую частоту гипотетического процессора с ядром Thunderbird, обладающего такой же производительностью, как и конкретный процессор Athlon XP. И никакого даже намёка на какое-либо сравнение с процессорами Intel. Тем не менее в прессе и интернете очень многие упорно считают, что эта цифра означает печально известный ранее «PR» – то ли «Pentium Rating», то ли «Performance Rating». Одним словом, она указывает, какой модели процессора Pentium примерно соответствует процессор, промаркированный с помощью этого «PR». Естественно, на практике процессоры с PR = 200, к примеру, значительно уступали процессору Pentium 200MMX.

Но это было в прошлом веке. Сейчас же ситуация радикально изменилась. Процессоры AMD получили очень мощный блок вычислений с плавающей точкой. Значительно мощнее (при одинаковой тактовой частоте, разумеется), чем аналогичный блок процессоров Pentium III и тем более процессоров Pentium 4. Этот тезис сейчас, наверное, уже никто не подвергает сомнению. Но что делать с тем фактом, что тактовая частота «топовых» моделей Pentium 4 выше, чем у «топовых» моделей Athlon? И с тем, что тактовая частота ядра процессоров Athlon XP действительно меньше, чем цифра в его обозначении:

Model NumberТактовая частота ядра, ГГц
Athlon XP 2100+1,73
Athlon XP 2000+1,67
Athlon XP 1900+1,6
Athlon XP 1800+1,53
Athlon XP 1700+1,47
Athlon XP 1600+1,4
Athlon XP 1500+1,33

Да ничего с этими фактами не надо делать. К ним нужно относиться как к объективной реальности. И уж тем более не надо придавать им более глубокий смысл, чем есть на самом деле. Маркировка была изменена только в связи с тем, что к моменту выпуска первого процессора Athlon XP (1500+, тактовая частота ядра 1333 МГц) на рынке уже существовал процессор Athlon 1400 прежней модификации (с ядром Thunderbird). Этот процессор, с одной стороны, более старый, но с другой, имел тактовую частоту ядра 1,4 ГГц. Как покупателю объяснить, что Athlon XP с тактовой частотой ядра 1,33 ГГц лучше, чем процессор Athlon 1400? А может, он и не лучше? Чтобы выяснить правду, в исследовательском отделе компании «ЕПОС» сразу после выхода в свет процессора Athlon XP 1500+ было проведено сравнение производительности нескольких типов процессоров с примерно равными тактовыми частотами. Частично эти результаты уже освещались на нашем сайте («Athlon XP: не числом, а уменьем!»). Сегодня мы поговорим об этом вопросе более серьёзно. Нет, наверное, смысла приводить все выполненные нами тесты. Поверьте, в подавляющем большинстве тесты показали превосходство процессора Athlon XP над своим более старым собратом. На разных задачах превосходство получается различным. Например, в Photoshop различные фильтры требуют различного времени для их наложения (рис. 1).

Photoshop: время выполнения операций

Рис. 1. Photoshop: время выполнения операций

Приведённые результаты – это время реальной обработки файла большого размера. Видим, что действительно, «ХР» с тактовой частотой 1333 МГц «круче» своего предшественника с частотой 1400 МГц. Другой вопрос – насколько «круче». Мы не знаем, как сама AMD смогла точно вычислить степень «крутизны» нового процессора. Поэтому вынуждены поверить на слово, что если это быстрее, чем 1400, то, наверное, это 1500. Но в целом применение в обозначении цифры 1500 всё же оправдано. Процессор Athlon XP 1500+ (с ядром Palomino) быстрее процессора Athlon 1400 (с ядром Thunderbird).

Повышение производительности достигнуто за счет существенной переделки ядра. Теперь в ядре реализованы как инструкции 3D Now!, так и инструкции, аналогичные инструкциям SSE-процессоров Pentium.

Для применения новых инструкций обычно необходимы новые версии программного обеспечения, оптимизированные под это расширение системы команд. Однако в данном случае этого не потребовалось. Ведь новые инструкции – это инструкции, которые давно применяются в процессорах Pentium и во многих уже существующих программах. Более того, эти инструкции реализованы в процессорах Athlon XP явно лучше, чем в процессорах Pentium. Поэтому программы, оптимизированные для процессоров Pentium, будут эффективнее выполняться на процессорах Athlon (если, конечно, это ХР). Но это, наверное, даже не главное. В процессорах Athlon XP существенно улучшены механизмы трансляции адресов команд и данных в физические адреса памяти и опережающей загрузки данных из памяти в кэш. Причем предсказание адресов данных, которые будут затребованы, и опережающая загрузка этих данных в кэш процессора не требует от программистов какой-либо оптимизации. Предсказание адресов осуществляется в процессоре на основании анализа потока данных, затребованных программой ранее. Но вот блоки вычисления операций – и с плавающей точкой, и с фиксированной – остались прежними. Поэтому сами операции выполняются с такой же скоростью, как и в процессоре с ядром Thunderbird. Просто процессор меньше простаивает в ожидании новых данных.

Таким образом, ничего особо страшного от введения понятия Model Number не ожидается. И действительно, это понятие не имеет никакого отношения к процессорам Intel. Но в этом нет и ничего хорошего. Ведь нас всё же больше интересует соотношение производительности процессоров Athlon XP и Pentium 4, чем процессоров Athlon и Athlon. К сожалению, в этом вопросе не так-то просто выяснить правду. Дело в том, что Athlon и Pentium 4 – это уже совершенно разные по своей архитектуре процессоры. Поэтому на различных приложениях они ведут себя по-разному. Сколько бы мы ни проводили тестов, мы не можем гарантировать, что охватили все возможные задачи. Так что более правильно будет обсуждать вопрос соотношения производительности только на определенном круге задач. Чтобы совсем не запутать читателя, позвольте привести только данные по времени рендеринга одного кадра в среде 3D Max. Это одно из самых требовательных к вычислительной мощности процессора приложение. Время рендеринга приведено на рис. 2.

3D Max: время рендеринга одного кадра реального рекламного ролика

Рис. 2. 3D Max: время рендеринга одного кадра реального рекламного ролика с разрешением 1024 х 768

Должны огорчить поклонников Intel, но на сложных задачах даже процессор Duron с частотой 1000 МГц показывает лучшую производительность, чем процессор Pentium 4 с тактовой частотой ядра 1400 МГц. Эти результаты могут показаться неожиданными. Но на самом деле ничего сверхъестественного в этом нет. Ведь в сравнении участвовали самые последние модели Duron, выполненные на ядре Morgan. Это фактически то же ядро, что и ядро Palomino процессора Athlon XP, только объём кэш меньше. Кстати, у Duron цифра в обозначении – это действительное значение тактовой частоты ядра.

Что же касается производительности на других приложениях и определения каких-либо обобщенных эмпирических оценок соотношения производительности, то это требует большого объёма тестирования и кропотливого анализа полученных результатов. Чаще всего после того, как такие оценки выполнены, они немедленно устаревают, так как на рынке появляются новые модели. Но тенденции, в общем, понятны. Если внимательно рассмотреть данные, приведённые, например, на сайтах Anandtech или Tom's Hardware, можно заметить, что в тестах примерно равные результаты показывают процессоры Athlon XP 1500+ и Pentium 4 1,7 ГГц. Примерно равные результаты у процессоров Athlon XP 1800+ и Pentium 4 2,0 ГГц. Таким образом, Model Number – это никак не PR. Более того, чтобы быстро сравнить два конкурирующих процессора, к значению Model Number нужно мысленно прибавить примерно 200 МГц, чтобы получить значение тактовой частоты процессора Pentium 4 с примерно сопоставимой производительностью. Обращает на себя внимание также то, что Pentium 4 работает лучше только на задачах, требующих несложных преобразований большого потока данных. Это, как правило, задачи визуализации (вывода на экран). Классический пример – игра Quake 3. Создаётся даже ощущение, что Pentium 4 специально создавался для игры в Quake.

В задачах же, требующих интенсивных вычислений (в том числе и сложной обработки больших массивов данных), предпочтительнее Athlon XP. Это, в первую очередь, задачи трёхмерного моделирования, обработки объёмных графических файлов, нелинейного монтажа фильмов. Конечно, любая такая задача требует не только собственно просчёта (рендеринга), но и выполнения других операций, таких как, например, обращение к дисковой системе, вывод результатов на экран. Для этих операций соотношение производительности для различных процессоров будет различным. Так, в частности, процесс визуализации (вывода изображений на экран) эффективнее обрабатывается на процессорах Pentium 4, чем на процессорах Athlon, даже если он и XP. Однако в реальных задачах процессор большую часть времени занимается именно рендерингом. Так, в частности, Adobe Premiere во время рендеринга показывает статистику распределения времени на выполнение различных действий (рис. 3).

Adobe Premiere: статистика распределения времени

Рис. 3. Adobe Premiere: статистика распределения времени

Жёлтым цветом показано, сколько времени процессор занят рендерингом, а другими цветами – сколько он занят остальными задачами. Как видим, при выборе процессора для профессиональной станции из совокупности всех тестов необходимо выбирать в первую очередь те, которые характеризуют его вычислительные возможности. А по этому показателю процессоры Athlon XP в настоящее время вне конкуренции.

Кстати, о Quake

Вопрос скорости в Quake нельзя, конечно, обойти, рассматривая вопрос производительности процессора. Бытует мнение, что для Quake 3 главное – это видеоадаптер. Но современные видеоадаптеры уже достигли такой мощности, что опять актуальным стал вопрос производительности процессора. Поскольку Quake 3 – это всё же игровое приложение, наибольшее применение это приложение находит в молодёжной среде. Редко кто из этой среды в состоянии купить самый производительный на сегодняшний день процессор. Поэтому позвольте привести данные для «молодёжного» процессора – Duron (рис. 4).

Желанные фреймы для процессоров Duron

Рис. 4. Желанные фреймы для процессоров Duron

Видим, что и для игры в Quake ой как нужен производительный процессор. В тесте, результаты которого приведены на рис. 4, применён видеоадаптер Radeon 8500. Может, сегодня это и не самый мощный адаптер, но и слабеньким его не назовешь. И если уж не хватает заветных фреймов, то увеличить их можно не только заменой видеоадаптера, но и установкой более мощного процессора, даже из категории «молодёжных». Для этого не придётся даже менять материнскую плату.

Самый старший Athlon

Какой бы уникальной производительностью ни обладал процессор, всегда найдутся задачи, для которых его производительности будет мало. Чаще всего это задачи трёхмерного моделирования (например, 3D Max). Как правило, хоть немного улучшить свою жизнь в этой ситуации можно только установкой хотя бы двух процессоров в одну машину. Поэтому процессор, который невозможно установить в многопроцессорной конфигурации, не может позиционироваться как процессор для мощных рабочих станций, не говоря уж о серверах. В последнее время AMD решила и эту проблему. Выпускается новый процессор, специально предназначенный для работы в многопроцессорной конфигурации. Это Athlon MP и его последняя модификация – Athlon MPX. С выпуском этих процессоров AMD начинает серьёзно претендовать на часть рынка самых производительных рабочих станций и серверов.

Сегодня мы не будем приводить результаты тестов, показывающие, во сколько раз увеличивается производительность. Понятно, что во многом увеличение производительности зависит от приложения, выполняющегося на двухпроцессорной машине. Отметим только, что улучшение производительности наблюдается даже для задач, которые «не понимают» второго процессора. Конечно, скорость выполнения самой задачи в этом случае, может быть, и не изменяется. Однако в операционной системе Windows всегда параллельно выполняется несколько служебных задач. В двухпроцессорной конфигурации просто процессор, занятый каким-либо приложением, меньше «отвлекается» на решение служебных задач операционной системы.

Более интересен вопрос, чем различаются процессоры Athlon MPX и Athlon XP. Позиция AMD понятна: Athlon MPX – это процессор для двухпроцессорных систем, а Athlon XP – для однопроцессорных систем. Но ведь Athlon XP тоже работает в двухпроцессорной конфигурации. Нет ли здесь какого обмана?

Конечно, совсем без обмана не обойтись ни в каком деле. Но в данном случае чаще мы сами себя вводим в заблуждение. Почему мы решили, что способность работать в двухпроцессорной конфигурации определяется процессором? Спецификация многопроцессорных систем предъявляет очень много требований к аппаратному обеспечению. Но большинство из них фактически определяют даже не параметры «железа», а скорее условия и способ его использования. Это, например, требования к памяти (упорядочение записей в памяти, способы блокировки, выделение служебных областей для специфических таблиц, необходимых для работы двух процессоров). Самое серьёзное требование к аппаратному обеспечению – это требования к способу управления прерываниями. Прерывания должны поступать только тому процессору, которому они адресованы, или тому, который в настоящее время способен обработать прерывание. Это приводит к тому, что в многопроцессорной системе управление прерываниями становится распределённым и требует специальных программируемых контроллеров прерываний APIC (Advanced Programmable Interrupt Controller). Наличие таких контроллеров – это и есть основное отличие многопроцессорной платы от однопроцессорной. Как видим, никакого отношения к процессору эти контроллеры не имеют. Что же касается процессоров, то они только должны предоставить чипсету возможность синхронизации содержимого их кэш. Такая возможность заложена в процессорах Athlon изначально. Более того, применён более мощный, чем у процессоров Intel, протокол синхронизации. В процессорах Pentium кэш может находиться в одном из четырёх состояний (данные в кэш такие же, как и в памяти; данные в строке кэш модифицированы; данные в кэш обоих процессоров и в памяти одинаковы; данные в кэш неправильные). В процессорах Athlon кэш может иметь ещё одно состояние, указывающее, какой процессор является «владельцем» данных и, соответственно, на какой процессор возложена обязанность по обновлению содержимого памяти. Это связано с тем, что архитектура «точка – точка» и наличие дополнительных информационных сигналов у шины EV6 позволяют чипсету синхронизировать кэш процессоров Athlon путём непосредственной пересылки данных из кэш одного процессора в кэш другого, минуя память. Но эти замечательные возможности заложены в ядре процессора. Поэтому в двухпроцессорной плате будет успешно работать любой процессор, без оглядки на то, как AMD его позиционирует. Так что нет никаких препятствий к тому, чтобы в двухпроцессорной конфигурации работал любой современный процессор AMD, даже Duron.

Данный тезис мы также экспериментально проверили. Больше месяца мы гоняли два процессора Athlon XP 1900+ и два процессора Athlon MPX 1900+. В первую очередь проверялось подозрение, не отключила ли AMD искусственно возможность синхронизации кэш. Если бы такая возможность была отключена, то это рано или поздно приводило бы к краху системы. Все эксперименты проводились на плате TYAN Tiger MP. Сейчас доступны двухпроцессорные платы для Athlon нескольких производителей. Наша плата выполнена на чипсете AMD 760 MP, хотя доступны платы и на новейшей модификации AMD 760 MPX (в том числе и от TYAN). Но Tiger MP – это наша любовь. Свою первую двухпроцессорную рабочую станцию с процессорами Athlon мы представили на суд общественности ещё в сентябре 2001 года именно на этой плате. Но до сих пор удивляемся стабильности работы систем, собранных на таких платах.

Мы убедились, что двухпроцессорная система полностью работоспособна как с процессорами Athlon MPX, так и с процессорами Athlon XP. Это относится даже к самым сложным приложениям (3D Max). Более того, различия в скорости выполнения всех тестов для этих процессоров отличаются на величину меньшую, чем погрешность измерения.

Однако из этого не следует, что AMD нас водит за нос и берёт дополнительные деньги только за одну букву в названии. Процессор Athlon MPX наряду с данными передаёт (и принимает) код коррекции ошибок. Чипсет может обнаруживать и исправлять ошибки не только во время обмена данными с памятью, но и во время обмена данными с процессорами, в том числе (что самое главное) и во время передачи данных из кэш одного процессора в кэш другого. Поэтому для двухпроцессорного сервера недопустимо использование процессоров Athlon XP. Не очень существенная для сервера экономия денег рано или поздно приведёт к неприятностям. В то же время можно найти достаточно много областей, в которых отсутствие коррекции ошибок не является принципиальным. Однако и в этом случае процессоры Athlon XP в двухпроцессорной конфигурации можно применять только «на свой страх и риск». Не позиционируя Athlon XP для двухпроцессорных конфигураций, AMD не тестирует его в таком качестве и не гарантирует нормальной работы.

Таким образом оказывается, что процессоры AMD всё же подчиняются закону Мура. Но AMD достигает этого не путём увеличения тактовой частоты, а путём совершенствования внутренней структуры процессоров. И несмотря на то, что действительное значение тактовой частоты за прошедший год не удвоилось, процессоры AMD всё же остались лучшим выбором как для профессиональной рабочей станции, так и для домашнего компьютера.

Вместо P.S.

Стенд ЕПОС в павильоне для корпоративных клиентов

Для тех, кто не смог в этом году побывать на EnterEX 2002, позвольте буквально два слова о самой выставке.

Выставка в этом году уже традиционно проходила в двух павильонах. В одном были представлены решения для корпоративных клиентов, в другом – решения для малого офиса и для дома.

В разных павильонах была, вообще говоря, представлена различная по уровню сложности техника. У компании «ЕПОС», кроме этого, в разных павильонах и стенды были оформлены по-разному. В павильоне для корпоративных клиентов стенд был оформлен довольно строго (рис. 5).

На стенде были представлены мощные профессиональные станции: двухпроцессорная рабочая станция для обработки графики и трёхмерного моделирования, профессиональный комплекс для нелинейного монтажа фильмов, рабочие станции в специальном исполнении (защищённые от утечки информации по каналам побочного электромагнитного излучения), сервер начального уровня на процессорах Athlon и многое другое. Наверное, после прочтения статьи никого не удивляет, что все представленные нами профессиональные решения выполнены на базе процессоров Athlon.

Так мы представляли технику для малого офиса и для дома

Во втором павильоне мы представляли не только технику для малого офиса и дома на базе процессоров Duron и Athlon XP, но и образцы современных мощных рабочих станций, опять же на базе процессоров Athlon XP.

Но главная изюминка, может быть, была даже не в представленных экспонатах, а том, как мы их представляли. По опыту прошлых лет мы заметили, что молодёжь – это самый интересующийся новинками посетитель и к тому же на выставку этот посетитель идёт как на праздник. Поэтому при оборудовании стенда мы попытались обеспечить максимально свободный доступ к экспонатам (рис. 6).

А чтобы выставка оставила самые приятные воспоминания, на стенде была сооружена небольшая эстрада, на которой ежедневно выступали известные украинские певцы и эстрадные группы. Ежедневно проводились различные конкурсы, и многие посетители ушли от стенда «ЕПОС» с подарками и призами от фирм AMD, LG и ЕПОС (рис. 7).

Вручение призов

Рис. 7. Вручение призов

Неотъемлемой частью выставки были, конечно, и семинары. В частности, авторы в своих докладах рассматривали вопросы построения профессиональных и офисных рабочих станций на базе процессоров фирмы AMD (рис. 8).

Пенюк Богдан Артемович (слева) и Овсянников Вячеслав Владимирович (справа)

Рис. 8. Богдан Артемович Пенюк (слева) и Вячеслав Владимирович Овсянников (справа) во время выступления

Последний день выставки – 23 февраля – совпал с днём рождения компании «ЕПОС» – 9 лет на украинском рынке. Нелишне напомнить, что «ЕПОС» основана офицерами запаса, и для них 23 февраля – двойной праздник. Поэтому мы во время выставки принимали поздравления (рис. 9).

Поздравления от Министерства Обороны Украины

Рис. 9. Поздравления от Министерства обороны Украины

Посетители выставки в этот день практически не отходили от нашего стенда. На эстраде в этот день не только принимались поздравления, но и вообще творилось что-то невообразимое. Где, кроме стенда «ЕПОС», вы видели, как Валерий Малышев поет дуэтом с Богданом Бенюком? А вы видели, как Богдан Бенюк на скорость надувает воздушный шарик? Посмотрите (рис. 10 и 11).

Рис. 10. No comments

Рис. 11. No comments

Несмотря на то, что мы как могли старались устроить посетителям настоящий праздник, большинство посетителей не забыли о цели своего визита на выставку. Поэтому доклад Сергея Романовича Коженевского, посвященный актуальным вопросам сохранения, восстановления и уничтожения данных на жёстких дисках, собрал очень много слушателей, несмотря на то что проводился он перед самым закрытием выставки. Докладчика не отпускали, пока выставка не завершила свою работу (рис. 12).

Доклад Коженевского Сергея Романовича, и что было после доклада

Рис. 12. Доклад Сергея Романовича Коженевского и что было после доклада

Приглашаем вас на следующие выставки с участием компании «ЕПОС». Вы не только сможете пообщаться с нашими специалистами, но и получите массу удовольствия.


Поделиться информацией