Content on this page requires a newer version of Adobe Flash Player.

Get Adobe Flash player

www.BenchMark.kz - Казахстанское сообщество оверклокеров

17.04.2009 Тест Core i7: разгон и производительность / Обзоры

Введение

В ноябре 2008 года корпорация Intel анонсировала новую архитектуру - Nehalem, которая является преемником микроархитектуры Core.

Архитектура Nehalem является модульной. Инженеры Intel создали набор базовых блоков, благодаря чему, можно создавать различные модификации процессоров, заменяя те или иные блоки.

Модульность архитектуры Nehalem

FSB больше нет, есть QPI

QPI, Intel QuickPath Interconnect, "QuickPath" (ранее Common System Interface, CSI) — новый высокопроизводительный стандарт на процессорную шину типа точка-точка для связи процессоров с периферией и другими CPU в многопроцессорной конфигурации, разработанный фирмой Intel.

Nehalem напоминает архитектуру AMD Barcelona, и это доказывает, что технологические решения AMD  были не такие плохие, но страдали плохой технической реализацией.

Производительность QPI измеряется в количестве пересылок в секунду (Гигатранзакций в секунду, ГТ/с).  Для моделей Core i7-920 и Core i7-940 пропускная способность равна 4.8 ГТ/с, а для Core i7-965 Extreme Edition 6.4 ГТ/с за каждое соединение.

Simultaneous Multi-Threading: возрождение Hyper-Threading

Технология Hyper-Threading впервые появилась в Pentium 4 "Northwood". Данная была улучшена и применена на процессорах поколения Nehalem.
Процессорные ядра Core-i7 имеют монолитную компоновку, и, поскольку физических ядер на кристалле четыре, процессоры могут выполнять до восьми вычислительных потоков одновременно. А при использовании двух кристаллов на одной подложке, количество потоков возрастет до 16-ти.

Hyper-Threading, во времена Pentium 4 "Northwood", в некоторых случаях негативно сказывался на производительности однопоточных приложений. В технологии  Simultaneous Multi-Threading проблема распараллеливания процессов была сведена к минимуму.

Интегрированный контроллер памяти

В архитектуре Nehalem, в отличие от архитектур предыдущих поколений, контроллер памяти был перенесен в процессор.

Расположение контроллера памяти на старой и новой архитектуре

Если раньше, процессор взаимодействовал с памятью через внешний контроллер (северный мост) по шине FSB, то процессоры Core i7 имеют прямой доступ к памяти, что существенно сказывается на производительности связки «процессор-память» в лучшую сторону.

Встроенный контроллер памяти Core i7-920/940 поддерживает три канала памяти DDR3 1066 МГц по 64 бита на каждый, благодаря чему пропускная способность памяти достигает 25,6 ГБ/с. Контроллер памяти Core i7-965 Extreme Edition поддерживает память 1333MHz.

Следует отметить, что ожидаемые осенью процессоры Core i5, а еще позднее Core i3 будут иметь поддержку только двойного канала.

Технология Intel Turbo Boost

Данная технология направлена на повышение производительности приложений, неоптимизированных под многопоточность.

Если приложение использует только одно или два ядра, а остальные ядра простаивают, то процессор автоматически снижает тактовую частоту бездействующих ядер и повышает частоту используемых. Уровень TDP процессоров Core i7 равен 130W, и технология Turbo Boost повышает тактовую частоту ядер так, чтобы значение TDP не было превышено.

Три уровня кэша

В процессорах микроархитектуры Core использовалось два уровня кэша: L1 и L2. В процессорах Core i7 используется три.

Инженеры Intel решили оснастить каждое ядро процессора собственным кэшем L2 относительно небольшого размера – 256Кб. Такое решение было принято в связи с тем, что при использовании неразделяемого L2 кэша в процессорах Core процессорные ядра иногда могли «перетирать» данные, необходимые другому ядру.

Процессор Core i7 имеет кэш третьего уровня

Кэш третьего уровня имеет объем в 8 мегабайт. В отличие от AMD, работа кэша Intel инклюзивная. Это означает, что если ядро попытается получить доступ к данным, которые отсутствуют в кэше L3, то необходимости искать данные в собственных кэшах других ядер отпадает, так как этих данных там просто нет. Если же данные обнаружены, то процессор получает информацию о том, где могут быть потенциально расположены нужные данные в кэше нижнего уровня любого из ядер.

Тестирование

Целью нашего тестирования является выявление эффективности всех нововведений, примененных в процессорах Core i7. Для сравнения были взяты процессоры Core 2 Quad Q9550 и Core i7-920.

Данный экземпляр процессора Core i7-920 основан на степпинге C0. На текущий момент Intel обновила ревизию процессоров Core i7, новый степпинг имеет маркировку D0, и, по мнению многих оверклокеров, Core i7 на степпинге D0 обладают улучшенным разгонным потенциалом.

Core i7-920 CPU-Z Screen

Так как Core i7-920 обладает контроллером памяти с поддержкой памяти DDR3-1066, Core 2 Quad Q9550 был разогнан по шине до 400MHz, и его тактовая частота стала составлять 3.4GHz. На данной частоте FSB процессор сможет раскрыть весь потенциал памяти DDR2 частотой только в 800MHz, после чего попробуем сопоставить производительность процессора Core i7 без разгона с Core 2 Quad Q9550 в разгоне.

Для выявления разницы производительности между архитектурами, Core i7 так же был разогнан до частоты 3.4GHz (BCLK 170MHz x 20) для сравнения быстродействия процессоров на равных частотах.

Так же, Core i7 был протестирован с отключенным SMT (Hyper-Threading).

Стендовые конфигурации:

Cтенд 1:

Процессор: IntelCorei7-920
Охлаждение:
IntelBox
Материнская плата: Gigabyte X58-UD3R
Оперативная память: 3х2
Gb 1333MHzDDR 3 Transcend
Видеокарта:
HISHD 4870 1GbGDDR5
Жесткий диск:
SeagateBarracuda 7200.12 500GB (16mb)
Операционная система: Windows Vista x64 SP1
БП:
Huntkey 500W (6500HG)

Стенд 2:

Процессор: IntelCore 2 QuadQ9550
Охлаждение:
PC Cooler 92CU
Материнская плата:
GigabyteP45-DS4
Оперативная память: 2х2
Gb 800MHzDDR2 Transcend
Видеокарта:
HIS HD 4870 1GbGDDR5
Жесткий диск:
SeagateBarracuda 7200.12 500GB (16mb)
Операционная система:
WindowsVistax64 SP1
БП:
Huntkey 500W (6500HG)

Результаты тестирования Core i7

SuperPi Mod 1.5

По результатам Super Pi (меньше -> лучше), Core i7 на частоте 3.4GHz и с включенным HT существенно превосходит Core 2 Quad Q9550, который работает на такой же частоте.

Наличие SMT (Hyper-Threading) так же незначительно сказывается на результатах однопоточного Super Pi, что действительно говорит об архитектурном улучшении технологии Hyper-Threading. Еще раз повторюсь, что ранее использование Hyper-Threading в однопоточных задачах приводило к снижению производительности.

CineBench 10 x64

В однопоточном тесте CineBench вновь побеждает разогнанный Core i7 920, который превосходит [email protected] практически на 20 процентов. В остальных режимах Q9550 в разгоне незначительно уходит вперед от Core i7 на штатных частотах.

В многопоточном режиме CineBench 10, процессор Core-7 920 без разгона и с отключенным SMT уступает разогнанному Q9550. Включение SMT возвращает победу Core i7.

Winrar 3.71

В многопоточном и однопоточном тесте Winrar 3.71, Core i7 вновь лидирует. Наличие активного SMT не сказывается на результатах в однопоточном тесте, а в режиме многопоточности дает существенное преимущество, и Core i7-920 не оставляет шансов Q9550.

3DMarkVantage

В тесте 3D Mark Vantage, Core i7-920 без HT (SMT) и разгона немного уступает [email protected], но включение SMT возвращает все на свои места.

Результаты тестирования Core i7 в программе Everest

* В бенчмарках Everest присутствуют результаты тестирования Core i7 с памятью в двойном канале (Core [email protected], 2-ой канал). Результаты в тестах процессора в этом режиме переписаны с результатов, полученных при использовании тройного канала.

CPU Photoworx

В данном тесте, разгон Q9550 не помогает процессору сравниться с Core i7. Процессор поколения Nehalem существенно превосходит своего предшественника во всех режимах.

CPUQueen

В данном тесте картина полностью повторяет предыдущую. Q9550 @3.4GHz уступает Core i7-920 даже с отключенным SMT. Core i7-920 на этой же частоте получает практически 40% превосходство над Q9550.

CPU Z-Lib

Вновь аналогичная картина.

Задержка памяти

Данный тест позволяет определить время доступа к памяти, т.е. чем меньше значение, тем лучше. Удивительно, но работа с памятью Core i7 в двойном канале оказалась быстрее работы  тройного. Core i7  побеждает Core 2 Quad во всех режимах – преимущество переноса контроллера памяти в процессор очевидно.

Чтение и копирование в памяти.

Данные тесты очередной раз подтверждают преимущество работы с памятью Core i7.

Итоги

Процессоры Core i7 выводят на  новый уровень производительности. Разница в цене между Core 2 Quad Q9550 и Core i7 920 не способна компенсироваться разгоном первого. На равных частотах Core i7-920 не оставляет шансов Q9550.

Удивительный результат был получен в тесте задержки памяти в двойном канале. Возможно, это связано с отсутствием оптимизации теста под тройной канал. В любом случае, благодаря перенесенному контроллеру памяти в процессор, скорость работы связки «процессор-память» оказывается быстрее, чем таковая на Q9550.

Не осталась в стороне и технология Turbo Boost. В нагрузке однопоточным приложением, частота процессора со стандартных 2.66GHz поднималась до 2.793 GHz – множитель автоматически увеличивался на 1. Аналогичная картина наблюдалась и в разгоне процессора.

Технология SMT (Hyper Threading) действительно оказывает минимальное влияние на задачи, неоптимизированные под многопоточность, а при использовании многопоточных задач, эффективность SMT очевидна. Проведенные тесты демонстрируют эффективность работы всех нововведений.

Хочется также отметить, что ради спортивного интереса, данный экземпляр Core i7-920 на боксовом кулере удалось разогнать до частоты 3.7 GHz (185х20)  без повышения напряжения, но разогнать процессор еще выше оказалось не так просто. Тем более на боксовом куллере :-). Рост тактовых частот ведет к пропорциональному росту температур, да и проводить тестирование на такой частоте не имело бы смысла. Впрочем, как и его использование :-P.

В общем и целом, процессоры получились достаточно быстрыми, порою, существенно превосходящими по производительности предыдущее поколение.

Благодарим компанию "Белый Ветер" за предоставленные стенды для проведения тестирования. Так же хочется выразить признательность Владимиру Новику за корректировку и устранение недочетов данного материала.

Запись разместил: admin

Количество уникальных просмотров: 6023

Последние сообщения с форума:

Реклама:

ITbuben – IT блоги, IT сообщества P2P.KZ Казахстанский Торрент-трекер
Игры для Мегалайнеров
Информационный портал Hi-Tech

Программисты.kz - всё о программировании. Статьи, уроки, форум

Страница сгенерирована за 0.0846 секунд

Сайты Казахстана, казахстанские сайты, казахские сайты, сайты в Казахстане