Перейти к основному содержанию

Статьи
FirstDedic


Чего ждать от новых Xeon E. Сравниваем с E3 и делаем выводы

10 апреля 2019

Продолжаю тестировать процессоры. В этот раз моё внимание целиком и полностью переключилось с десктопных Core на серверные Xeon. Что, надо признаться, не случайно. Во-первых, меня об этом горячо просили в комментариях к прошлой статье, а во-вторых, наш парк пополнился свежими Xeon E — мы решили обновить линейку однопроцессорных выделенных серверов и прикупили E-2134 и E-2136 как альтернативу E3-12XX. 
 
Изначально у меня были наполеоновские планы. Так как наша «коллекция» Xeon E3-12xyVz, где «z» принимает значение от 2 до 6, охватывает процессоры от Ivy Bridge до Kaby Lake, мне стало интересно сравнить их между собой и с новым семейством Xeon E. 
 
Но оценив объём предстоящей работы, я решил понизить градус амбициозности и оставить из представителей Xeon E3 лишь два предыдущих семейства: Xeon E3-12xxV5 и Xeon E3-12xxV6. Вместе с новыми Xeon E все три семейства фактически построены на одной архитектуре, одном технологическом процессе и, спасибо Интелу, одном процессорном сокете FCLGA1151. 
 
Более того! В наличии оказались процессоры из двух предыдущих семейств, пересекающиеся по базовой частоте и частоте в «бусте», что, на мой взгляд, большая удача :-) В комментариях к предыдущей статье прозвучала просьба от читателей — сравнить разные семейства на одной частоте, чтобы увидеть чистый прирост микроархитектурных изменений. Идея показалась мне интересной и, возможно, когда-нибудь я вернусь к Core, чтобы воплотить её в жизнь. А пока решил адаптировать к тому, что есть под рукой, и посмотреть, как поведут себя Xeon с одинаковыми частотами. 
 
Тестирование
 
В тестировании участвуют восемь процессоров из трёх семейств: 
Skylake — Intel E3-1230v5, E3-1240v5, E3-1270v5, 
Kaby Lake — E3-1230v6, E3-1240v6, E3-1270v6, 
Coffee Lake — E-2134 и E-2136.
 
 
 
Тактико-технические характеристики платформ
 
Серверы с процессорами Intel E3-1230v5, E3-1240v5, E3-1270v5, E3-1230v6, E3-1240v6 и E3-1270v6 имеют одинаковую базовую конфигурацию:
  • Материнская плата: Supermicro X11SSE-F (2.2 BIOS).
  • Оперативная память: 16 Гб Micron Technology (DDR4-2666) ECC — 2 штуки.
  • SSD-накопитель: Intel DC S4500 480 Гб — 2 штуки в RAID1.
 
Серверы с процессорами Intel E-2134 и E-2136 также работают на одинаковой платформе:
  • Материнская плата: Supermicro X11SCE-F (BIOS 1.0a).
  • Оперативная память: 16 Гб Micron Technology (DDR4-2666) ECC — 2 штуки.
  • SSD-накопитель: Intel DC S4500 480 Гб — 2 штуки в RAID1.
Программная часть: ОС CentOS Linux 7 x86_64 (7.6.1810)
Ядро: 3.10.0-957.5.1.el7.x86_64
Внесённые оптимизации относительно штатной установки: добавлены опции запуска ядра elevator=noop selinux=0.
Тестирование производится со всеми патчами от уязвимостей Spectre, Meltdown и Foreshadow, бэкпортироваными в данное ядро.
 
Тесты, которые использовал для исследования:
  1. Sysbench
  2. Geekbench
  3. Phoronix Test Suite
 
Более подробное описание тестов можно найти в предыдущей статье. Взял тот же набор плюс Timed GCC Compilation, который добавил по просьбам читателей. А пока кратко о том, что и чем замерял. 
 
Тест Sysbench
Тест многопоточный, во все ядра. Замерял один показатель — CPU speed events per second, который означает количество выполненных процессором операций за секунду — чем выше значение, тем производительнее система.
 
Тест Geekbench
Измерял два основных показателя, построенных на результатах нескольких тестов: Single-Core Score и Multi-Core Score, - одно- и многопоточные тесты. Единицы измерения — абстрактные «попугаи». Чем больше «попугаев», тем лучше. 
 
Тест Phoronix Test Suite
Из большого набора взял только 10 — те же, что и в прошлый раз — и к ним, как я уже говорил выше, добавил Timed GCC Compilation. В итоге получилось 8 многопоточных тестов и 2 однопоточных (Himeno и LAME MP3 Encoding).
 
В этих тестах чем показатель больше, тем лучше
 
  1. Тест John the Ripper для подбора паролей. Возьмём криптоалгоритм Blowfish. 
  2. Тест Himeno — линейный решатель давления Пуассона, использующий точечный метод Якоби. 
  3. 7-Zip Compression — тест 7-Zip с использованием p7zip с интегрированной функцией тестирования производительности. 
  4. OpenSSL — это набор инструментов, реализующих протоколы SSL (Secure Sockets Layer) и TLS (Transport Layer Security). Измеряет производительность RSA 4096-бит OpenSSL. 
  5. Apache Benchmark — измеряет, сколько запросов в секунду может выдержать данная система при выполнении 1 000 000 запросов, при этом 100 запросов выполняются одновременно. Единицы измерения — запросы в секунду. 
 
А в этих если меньше, то лучше — во всех тестах измеряется время его прохождения. 
 
  1. C-Ray тестирует производительность CPU на вычислениях с числами с плавающей запятой. Это многопоточный тест (16 потоков на ядро). 
  2. Parallel BZIP2 Compression — измеряет время сжатия файла (пакет .tar исходного кода ядра Linux) с использованием сжатия BZIP2. 
  3. Тест LAME MP3 Encoding выполняется в один поток. 
  4. Тест ffmpeg x264 — многопоточный. 
  5. Timed GCC Compilation. В первой моей статье в комментариях читатели просили добавить тест, связанный с компиляцией из исходников. Этот тест именно для вас :-) Он показывает, сколько времени занимает сборка компилятора GNU GCC (версия 8.2.0). Единицы измерения — секунды. 
 
Итак, я собрал на одном тестовом стенде представителей трёх семейств — Skylake, Kaby Lake и Coffee Lake. У всех процессоров, кроме нового E-2136, по четыре ядра и восемь потоков в HT, а также одинаковый суммарный объём кэш-памяти. Все процессоры имеют двухканальную память с поддержкой ECC и близкие базовые частоты. Как и в предыдущей статье, обращаю внимание, что процессоры трёх разных семейств построены на одной архитектуре. Соответветственно, «балом должны править частоты, ядра и потоки».
 
Но в этот раз будет ещё интереснее: у всех этих семейств разные поддерживаемые частоты при работе с оперативной памятью — 2133, 2400 и 2666 соответственно, а также разный теплопакет. Любопытно посмотреть, как это повлияет на результаты тестов и повлияет ли вообще. Конечно, предполагаю, что чем выше частота работы с ОЗУ, тем лучше процессор будет проходить тесты.
 
Особый интерес вызывают E3-1240v5 и E3-1230v6 с одинаковыми частотами: базовой 3,50 ГГц и 3,90 ГГц в Турбобусте. Предполагаю, что они должны показать идентичные или близкие результаты, так как отличаются только теплопакетом и частотой памяти.
 
Что же касается моих прогнозов относительно Xeon E, думаю, что результаты однопоточных тестов E-2134 и E-2136, также должны быть одинаковыми или очень близкими по показателям — хоть базовая частота и отличается, но частоты в «бусте» у них совпадают. Ну и конечно результаты обоих Xeon E, я уверен, будут лучше их предшественников: 4.5 ГГц на максималках и 6 ядер у E-2136 однозначно себя покажут. А теперь «будем посмотреть», насколько я окажусь прав. 
 
 
Результаты тестов
 
В тесте Sysbench E3-1240v5 и E3-1270v5 идут вровень. С E3-1230v6 начинается рост, который заканчивается резким взлётом Е-2136. E-2136 на 36% лучше в данном тесте, чем E3-1270v6, и на 43%, чем E3-1230v5. E-2134 всего на 4% обгоняет E3-1270v6 и на 14% E3-1230v5. Разница у E3-1240v5 и E3-1230v6 на 2,4% в пользу E3-1230v6.
 
 
В однопоточном тесте Geekbench наблюдается рост в пределах каждого семейства, за исключением семейства Xeon E: E-2134 обгоняет E-2136 на 4,5%. 
В многопоточном тесте тенденция роста сохраняется во всех трёх семействах: E-2136 на 14,6% обгоняет E-2134. В однопоточном тесте E3-1240v5, E3-1270v5 и E3-1230v6 идут вровень, а в многопоточном E3-1230v6 обгоняет E3-1240v5 на 2,5%
 
Ссылки на результаты тестов Geekbench:
 
 
 
Результаты многопоточного John The Ripper очень похожи на результаты теста Sysbench: E3-1240v5, E3-1270v5 и E3-1230v6 выдают почти одинаковые показатели и E-2136 на 33% быстрее, чем E-2134. Хорошо виден стабильный прирост в показателях E3-1240v6, E3-1270v6 и переход на следующее поколение — E-2134.
 
 
В тесте C-ray самый высокий результат у E-2136, самый низкий — у E3-1230v5, что вполне логично хронологически. Второе место у новинки E-2134. А вот E3-1240v5, E3-1270v5 и E3-1230v6 опять идут вровень.
 
 
Однопоточный тест Himeno почти в точности повторяет результаты однопоточного теста Geekbench: наблюдается рост в пределах каждого семейства, за исключением Xeon E: E-2134 обгоняет E-2136 на 2,4%. Разница между E3-1240v5, E3-1270v5 и E3-1230v6 на уровне погрешности.
 
 
В тесте 7zip наблюдаем красивую «лестницу» и рост во всех семействах. Разница между E3-1240v5, E3-1270v5 на уровне погрешности. E3-1230v6 почти на 4% лучше проходит этот тест, чем E3-1240v5. E-2134 на 21% опережает E3-1230v5, на 16% — E3-1270v5 и на 6,6% — E3-1270v6. А E-2136 — лучше всех :-) 
 
 
Аналогичная тенденция наблюдается в тесте pbzip2, выбивается лишь E3-1230v6.
 
 
Хотелось бы сказать, что тест mp3 показывает равномерную «лестницу вниз», но разница даже между крайними в графике E3-1230v5 и E-2136 всего 9,5%, так что называть это «лестницей» не очень-то правильно. Тем более, что E3-1230v6 вносит свои коррективы, а E3-1240v5 и E3-1270v5 только добавляют графику пологости.
 
 
В многопоточном тесте ffmpeg «лестница вниз» уже без всплесков и с почти ровной площадкой в районе E3-1240v5, E3-1270v5 и E3-1230v6. E-2136 в этом тесте лучше E-2134 на 19%, E3-1230v5 на 32%, E3-1270v5 на 29% и E3-1270v6 на 22%.
 
 
Тест OpenSSL показывает «лестницу вверх» с площадкой на E3-1240v5, E3-1270v5, E3-1230v6 и заметным отрывом на E-2136. E-2134 на 14% лучше E3-1230v5.
E-2136 на 43% опережает E3-1230v5, на 36% — E3-1270v6 и на 33% — E-2134.
 
 
В тесте Apache разница между процессорами семейства V5 минимальна. В семействе V6 «лестница вверх»: E3-1270v6 на 8,8% лучше, чем E3-1230v6. Семейство Xeon E продолжает тенденцию роста и добавляет «ступеней»: E-2136 на 3% обгоняет E-2134, на 8% опережает E3-1270v6 и на 22% — E3-1270v5. Разница между первым представителем V5 и новым E-2136 составляет 24%. E3-1240v5 и E3-1270v5 на уровне погрешности. Заметный скачок на переходе от семейства V5 к V6: разница между E3-1230v6 и E3-1240v5 в 7%. 
 
 
В тесте на время компиляции GCC последнее место у E3-1230v5, предпоследнее место делят между собой E3-1240v5 и E3-1270v5. Победа остаётся за шестиядерным E-2136.
 
 
 
Красный —1 место, лучшие показатели
Синий — 2 место
 
Если в предыдущей статье, где тестировал Core, я писал, что не удивлён результатами — они были предсказуемы, то и в этот раз не удивлён :-)
 
Но сначала немного предыстории. 
Надо сказать, что все тесты для E3-1230v6 мне пришлось переделать. И все из-за того, что в первый раз я допустил ошибку — представитель из семейства V6 прошёл тестовый полигон с ОЗУ в одноканальном режиме. В итоге вложенный индекс в тесте Geekbench — Memory Score, получился ниже, чем у E3-1240v5, что сильно повлияло на общий результат всего теста. E3-1240v5 по показателям значительно обгонял E3-1230v6.
Аналогичная картина нарисовалась во всех однопоточных тестах. Долго морщил мозг, чтобы дать хоть сколько-нибудь внятное объяснение сложившейся ситуации (и даже нашёл его!), пока не протёр глаза и не переделал все тесты, но уже с двухканальной памятью. А теперь к выводам.
 
Ожидания vs реальность
 
Первое, что я ожидал увидеть, так это одинаковые показатели у E3-1240v5 и E3-1230v6. И увидел. Во всех тестах, кроме mp3 и pbzip2, E3-1230v6 лучше или равен E3-1240v5. Лично я не считаю, что это чистый прирост микроархитектуры. Скорее всего, такой результат получается за счёт большей тактовой частоты оперативной памяти. Одно могу сказать точно: память в одном канале существенно влияет на результаты в тестах, так что будьте внимательны :-)
 
Вторая моя гипотеза касалась двух представителей семейства V5 — E3-1240v5 и E3-1270v5. Честно говоря, надеялся обнаружить между ними хотя бы небольшую разницу, но по итогам тестирования она оказалась никакая от слова совсем. Влияние  дополнительных 100 MHz приходится искать под микроскопом в подавляющем большинстве тестов. 
При этом те же 100 MHz вполне видны невооружённым глазом при сравнении E3-1270v5 и E3-1240v6. Полагаю, опять же, сказываются частоты памяти.
 
Переходим к свежим Xeon E. Я был совершенно не готов к тому, что в однопоточных тестах E-2136 будет уступать E-2134. Хоть базовая частота у старшей модели и ниже на 200 MHz, но частота в «бусте» у них одинаковая. Я повторил каждый тест по несколько раз с каждым процессором, чтобы получить ожидаемый мной результат, но достичь его так и не смог :-)  Очень не люблю делать выводы и заключения, поэтому с удовольствием узнал бы мнения уважаемых читателей: с чем могут быть связаны такие необычные результаты?
 
Вот где ожидания совпали с реальностью, так это при сравнении нового семейства Xeon E с предшественниками — тут прогнозы, что новые Е обойдут старых добрых Е3 просто подтвердились тестами. И если четырёхъядерный E-2134 делает это за счёт более высокой частоты в «бусте», то E-2136 ещё сильнее отрывается за счёт своих честных шести ядер.
 
В целом, картина получилась следующая. Новые Xeon E действительно можно рассматривать как хорошую альтернативу семейству Е3. Тем более, что стоят они почти столько же, сколько V6 — производительность выше за те же деньги. Если же ищете более бюджетный вариант, то можно смело выбирать из тройки E3-1240v5, E3-1270v5 и E3-1230v6. По результатам тестов, они оказались вполне взаимозаменяемыми. 
 
В тестировании использовались серверы на базе процессоров Intel Xeon E3-1230v5, E3-1240v5, E3-1270v5, E3-1230v6, E3-1240v6, E3-1270v6, E-2134 и E-2136
 
Для вас писал Григорий Прадедов, системный администратор FirstDEDIC.

Смотреть все статьи

Сообщить об ошибке

Выделенная ошибка:

Опишите найденную ошибку