Зачем ARM на серверах?

Небольшой оптимизированный набор команд используемый в чипах ARM идеален для мобильных устройств. Благодаря меньшему энергопотреблению он сегодня очень популярен для использования в смартфонах и планшетах. Но в последнее время серьезно заговорили о приходе чипов ARM в ту сферу в которой безраздельно господствует Intel — на сервера.

Текущее положение на рынке серверных ЦП

Сегодня обработка данных чаще всего производится на стороне сервера, клиентские устройства (планшеты, ПК, ноутбуки. смартфоны), количество которых растет в геометрической прогрессии только получают результат. Поэтому рынок серверов постоянно растет, а сами сервера становятся все быстрее. Это ставит стразу несколько проблем. С одной стороны количество мест для установки уменьшается, растет энергопотребление и необходимость в отводе тепла. Частично проблема решается за счет увеличения плотности серверов в стойке и более эффективной системы управления энергопотреблением (как правило CPU). Однако любой современный сервер состоят из большого числа жестких дисков, сетевых устройств и прочих интерфейсов. Все они в масштабах датацентра тратят впустую сотни мВт. С другой стороны, разные приложения требуют свою нагрузку, для одних ее рассчитать очень проблемно и железо берут на вырост, для других она определена более точно. В последнее время проблему запаса мощности решали при помощи виртуализации, навешивая на один сервер, десятки VM. Но это опять же добавляет стоимости и увеличивает сложность в администрировании. Идеала как видим нет. Нужны небольшие, экономичные системы, которые можно включать по мере необходимости.
Именно поэтому в 2013 стала все больше интересной новая концепция микросерверов, которые представляют собой экономичные по питанию модули созданные по технологии System-on-a-Chip (SoC), то есть готовое одночиповое решение, с низкой латентностью многих операций, к которому необходимо лишь добавить ОЗУ, HDD и подключить сеть. Как правило SoC уже содержит несколько гигабитных Ethernet портов и PCIe.
Микросервер
Такие сервера очень востребованы для легких нишевых задач, там где нет нужды в больших вычислительных мощностях или характеристики заранее известны (веб-приложения, хостинг начального уровня, Memcached, управление сетью, хранение данных и т.п.). Например, провайдер, вместо того чтобы «нарезать» VDS, может просто добавить в слот новый сервер, нужной мощности. То есть микросервер это тонкий инструмент, разрабатываемый под конкретные нагрузки, что его отличает от традиционного пропагандируемого Intel сегодня. Миниатюрность и меньшее энергопотребление позволяет уменьшить количество блоков-питания, вентиляторов охлаждения и проводов. Например, 1600 микросерверов Calxeda EnergyCore занимают половину стандартной серверной стойки и стоит на 63% дешевле, чем обычная стойка с серверами такой же мощности. В случае необходимости большей мощности, такие миниатюрные сервера можно объединять в кластеры распараллеливая вычисления. Именно так сегодня представляют датаценты будущего. Хотя следует отметить что в категории микросерверов не существует универсального системного дизайна. Поэтому здесь можно встретить разные конфигурации, различной мощности и возможностей.
Прогнозы специалистов расходятся. В исследованиях компании IC Insights подсчитали, что продажи микросерверов в период 2014 до 2017 г. будут расти ежегодно в среднем на 70% (в 2014 на 139%). Аналитики Intel (которая кстати продает 92% серверных процессоров) считают что микросерверы, будут занимать незначительную часть рынка до 6% рынка, Gartner дает цифру до 15%.

ЦП для микросерверов

Новая идея требует иного оборудования. Стандартные серверные процессоры AMD Opteron и Intel Xeon для микросерверов не подходят. Компании выпустили специальные продукты. Так Intel представила(ark.intel.com/ru/products/series/71265) однокристальные системы линейки Intel Atom S1200 (ранее известные как Centerton), предназначенные для использования в микросерверах, системах хранения данных и сетевом оборудовании. Новое семейство процессоров изготавливается по техпроцессу 32нм и будет включать три модели процессоров с тактовой частотой от 1,6 ГГц до 2,0 ГГц. Среди ключевых особенностей новых SoC Intel называет поддержку 64-битных приложений и наличие соответствующего набора микрокоманд, поддержку ECC и VT-x. Однокристальная система имеет два физических ядра и поддерживает четыре вычислительных потока, благодаря технологии Intel Hyper-Threading. Она также имеет контроллер памяти с поддержкой до 8 ГБ памяти DDR3 (на каждый CPU) и восемь каналов PCI Express 2.0. Это пока не совсем SoC, например мы видим что нет Ethernet и USB, они появится на чипе только в следующем поколении 22 нм чипов Atom Avoton (платформа Edisonville), которые планируется представить в следующем году. При этом Avoton будет содержать от 2 до 8 ядер, кэш-память второго уровня 1 МБ будет распределена между каждой парой ядер. Максимальная частота CPU ожидается в 2,4 ГГц, который при помощи специальной технологии Turbo Boost можно увеличить до 2,7 ГГц. Уровень энергопотребления новинок будет лежать в пределах 5-20 Вт.
Ожидается что его энергопотребление будет составлять 5-20 Вт.
Но самое главное — низкое энергопотребление: значения TDP колеблются от 6,1 до 8,5 Вт в зависимости от модели. Самым доступной однокристальной системой новой линейки является Atom S1220, ее оптовая цена объявлена равной $54, самая дорогая платформа, Atom S1260, оценена в $64. Для примера TDP Intel Xeon E5 на основе дизайна «Sandy Bridge-EP» составляет от 60 до 150 Вт. и стоит от $202 до $2614.
По данным Intel серия Atom S1200 используются в микросерверах и сетевом оборудовании таких компаний, как Accusys, CETC, Dell, HP, Huawei, Inspur, Microsan, Qsan, Quanta, Supermicro и Wiwynn.
Не секрет что Atom многие считали не очень удачным для встроенных устройств, в первую очередь из-за софта, но вот для серверов такой проблемы нет, поэтому у Intel есть все основания полагать что линейка S1200 будет весьма популярна. Но и конкуренты не спят.
AMD представила процессоры AMD Opteron серии X Kyoto(amd.com/en-us/products/server) x86 архитектуры, которые стали обеспечивают очень высокую плотность и энергоэффективность. Поставляются в двух вариантах. Например AMD Opteron X2150 является серверным однокристальным гибридным процессором, в котором сочетаются CPU и GPU (на базе AMD Radeon HD 8000, до 128), версия X1150 не содержит GPU. Ориентируются X2150 для обработки мультимедиа, X1150 для распределенных нагрузок и SoC серверов. Используется X86 ядро известное как «Jaguar», содержащее 4 ядра, работающих с частотой 2 Ггц, кэш L2 2 МБ, имеющий встроенный порт SATA (у S1200 его нет) и поддерживающее до 32 ГБ DRAM на CPU. По CPU тестам производительность Opteron X в два раза выше Atom S. При этом TDP составляет 22 Вт. Доступны по цене 99 и 64 $.
Но новый тренд привел к тому что стали возрождаться MIPS и RISC процессоры. Например, AMD еще полтора года назад объявила о разработке Opteron A-серии (Seattle), с весьма интересными характеристиками: 4- и 8 x64 ядер, тактовая частота выше 2 Ггц, поддержка 128 Гб DRAM. В начале 2014 года обществу был представлен AMD Opteron A1100 в котором используются первые реализации 64 битного чипа ARM Cortex-A57, выполненные по техпроцессу 28 нм и работающие на частоте выше 2 ГГц. Старшая модель будет содержать 8 ядер, 8 МБ кэш-памяти третьего уровня и поддерживать до 128 ГБ ОЗУ с ECC. Причем для Opteron А1100 AMD специально разработала новый контроллер памяти способный поддерживать как DDR3 или DDR4. Каждая пара ядер разделяет кэш 1 Мб L2, в общей сложности до 4 Мб кэш-памяти L2 для чипа. В них также будет встроена поддержка двух портов Ethernet 10 Гбит/с и 8 портов SATA 6 Гбит/с (SoC способен обеспечить полную полосу пропускания для всех 8 SATA). Как видим графических ядер в составе этих решений нет и в ближайшее время не планируется. Данная разработка предназначается для высокоинтегрированных SoC и оптимизирована для плотных, энергетических эффективных серверов. Изготавливается Opteron A по техпроцессу 28 нм, поэтому у него отличное соотношение производительности к потребляемой мощности — TDP равно 25 Вт. Стоимость ожидают в районе $100. По данным производителя, восемь ядер Opteron A1100 обеспечивает производительность в 2-4 раза выше, чем у четырехядерного процессора Opteron X2150, при равной стоимости и TDP.

Сравнение AMD Opteron X2150 и A1100

Серверы на базе нового чипа, как ожидается, будут объявлены в 4-м квартале 2014 года. Паралельно AMD передает проекту Open Compute Project спецификацию нового микросервера — AMD Open CS 1.0 Common Slot и сотрудничает с лидерами отрасли в создании экосистемы 64-разрядного ПО для систем на архитектуре ARM: компиляторы, эмуляторы, гипервизоры, ОС и прикладные программы, для всех возможных задач решаемые серверами в вычислительных центрах. Такой шаг вполне способствует его дальнейшему продвижению другими разработчиками. Так что процессоры AMD с ядром ARM в ближайшее время вряд ли встретим в планшетах, но зато они вполне смогут обеспечить работу облачного сервиса.
Кстати пару лет назад AMD планировала покупку MIPS Technologies, которой принадлежат лицензии на MIPS архитектуру, но в 2013 году большая часть патентов были переданы Bridge Crossing (ARM один из членов).

Три волшебные буквы ARM

Первые чипы ARM появились в апреле 1985 года стараниям британской компании Acorn Computers (сейчас ARM Limited), но долгое время по популярности уступали универсальным х86, хотя отличались энергоэффективностью и в некоторых задачах большей производительностью. Например, Citrix считает, что Xen работает на ARM лучше чем на Intel. Также чипы ARM популярны во встраиваемых системах, сетевом оборудовании, платежных терминалах и разного рода измерительных приборах. Но все изменилось с массовым появлением мобильных гаджетов, в 90% которых сегодня используются именно разработки ARM. За основу ARM взята 32-x битная RISC архитектура (отсюда и сокращение Advanced или Acorn RISC Machine), которая была и упрощена и усложнена одновременно, но по сути также использовала набор простых команд обрабатываемые с минимальными затратами. В отличие от традиционных CPU, ARM это не процессор, это чип или SoC, который может содержать все необходимое — контроллер RAM, графический ускоритель, видео и аудио декодер, сетевые модули и USB. Здесь кстати нужно понимать что сам набор инструкций ARM не сильно влияет на энергопотребление, главная суть низкого TDP именно использование архитектуры SoC.
Сегодня ARM Limited занимается в основном разработкой и лицензированием процессорных архитектур, отдав создание конкретных моделей чипов или отдельных компонентов сторонним компаниям(arm.com/products/processors/licensees.php). Например, компании Qualcomm и Apple создали собственные модификации на основе ARMv7, которые получили название Scorpion, Krait и Swift. Самая современная разработка чип Cortex-А57 на сегодня лицензирован в AMD, Broadcom, HiSilicon, STMicroelectronics, Samsung, MediaTek и Huawei.

Лицензирование Cortex-А57

Начиная с ARM7 определены три профиля, поддерживающих свой набор инструкций, позволяющие легко определить назначение чипа:

Со времени первого серийного ARM2, в оригинальное изготовление ARM было исполнено без микрокода, как и более простой 8, за почти 30 лет было разработано несколько поколений ARM, и расширения набора команд. Кроме стандартных 32 битных инструкций, появился например, режим Thumb (T32) позволяет выполнять 16-битный набор инструкций. В 2003 году, он было расширен Thumb-2 с дополнительными 32-битными командами позволяя достичь обычной производительности ARM при выполнении 16 битных инструкций. Технология Jazelle (чипы с индексом «J») позволяет байткоду Java исполняться непосредственно в архитектуре ARM. Кроме этого набор команд может быть расширен при помощи сопроцессоров. Вот некоторые из них:

Позже появились 2-х и более ядерные процессоры. В Cortex A9 (2 ядра) и A15 (4 ядра). В итоге чипам Cortex-A15 уже удалось сравниться по быстродействию с Intel Atom.
Не смотря на то что в x86 уже давно перешли на 64 битную архитектуру, ARM не спешила с таким шагом. Сама по себе разрядность мало сказывается на производительности, а необходимости в адресации памяти более 4 Гб, не было. Хотя в 2010 году в ARMv7 (Cortex-A15 и Cortex-A7) было представлено расширение LPAE (Large Physical Address Extension) предназначенное для более эффективного управления гипервизорами и разделения данных, которое позволяло адресовать память большую 4 Гб. Но приложения нуждающиеся в такой адресации фактически отсутствовали. Сегодня ситуация изменилась, все больше и больше ОС и приложений стали доступными только в 64 сборке. Поэтому в октябре 2011 представлена архитектура ARMv8-A содержащая определение AArch64, позволяющее выполнять 64 битные команды. Допускается исполнение 32-битных приложений в 64-битной ОС, и запуск виртуализованной 32-битной ОС при помощи 64-битного гипервизора. Кроме этого в ARMv8-A добавлены криптографические инструкции для работы с AES, SHA-1 и SHA-256.

Поколения чипов ARM

В настоящее время ARMv8-A реализована в высокопроизводительных чипах серии Cortex-A50 представленной двумя наработками: Cortex-A53 и Cortex-A57. Первый энергоэффективный, а второй высокопроизводительное, но оба способны работать с большими объемами оперативной памяти.
Процессоры с ядрами ARM Cortex-A57 соответствуют стандартам [Open Compute Project](opencompute.org) и Common Slot Architecture продвигаемые Facebook. Это позволяет использовать их вместе с традиционными процессорами семейства x86 на существующих ОС уже сейчас, пока не появилось оптимизированное ПО. Также в январе 2014 ARM выпустило спецификацию Server Base System Architecture (SBSA), разработанную совместно с производителями ОС и ПО (Canonical, Citrix, Linaro, Microsoft, Red Hat и SUSE), и оборудования (Dell, HP, Broadcom). В [SBSA](goo.gl/lNdrRR) определяются минимальные стандарты для лучшей совместимости, переносимости и интеграции в действующие датацентры.

Чип Cortex-A57

Как обычно, по началу большой проблемой развития является низкая готовность софтверной части. В этом направлении работа ведется, драйвера пишут уже сейчас, происходит адаптация адаптируют SDK и портирование программ. Понятно, что на это уйдут месяцы. Но в случае ARM сильно выручают кросс-платформенные решения, которые могут выполняться на любой аппаратной платформе.
Архитектура ARM поддерживается множеством операционных систем. Например, ARMv8 поддерживается в ядре Linux начиная с версии 3.7. Все недавние релизы Ubuntu 14.04 LTS и RedHat, поддерживают 64-битную ARM. Кроме этого ARM будет работать в BSD (FreeBSD, NetBSD, OpenBSD), QNX, Android и других.

Ubuntu Server 14.04 LTS поддерживает 64-битный ARM

***

В 2013 году было продано около 13 млн серверных процессоров x86 и более 8 млрд процессоров ARM и по мнению AMD, через пять лет 25% всех серверов в мире будут работать на платформе ARM. Хотя ни кто из специалистов не решается спрогнозировать что будет с рынком вообще. Пока ARM при продвижении на рынок сталкивается по сути с теми же проблемами, которые испытала и Intel при попытке ворваться на рынок мобильных процессоров. Здесь придется действовать против сильного конкурента, который хорошо закрепился и имеет глубокие связи с клиентами. Но участие AMD имеющее свою базу клиентов вполне может сыграть положительную роль в увеличении спроса. Поэтому вполне вероятно, что 64-битный производительный и энергоэкономный чип найдет своего покупателя. Во всяком случае ARM рассчитывает в течение пяти лет, получить 40% долю рынка чипов для масштабируемых веб-серверов (около 10 млрд.$).

Теги: ,

Понравилась статья? Оставьте комментарий или подпишитесь на RSS рассылку.

Комментарии

Комментариев пока что нет

Оставить комментарий

(required)

(required)