Вернуться на главную страницу Algo.ru  
 

Многопроцессорное совершенство от Compaq.

 

 

     

Почти совершенство...

30 октября 2001
–> вернуться на System Integration (reviews)

Одна за другой такие известные аналитические компании, как GIGA, IDC, Gartner Group, опубликовали свои аналитические отчеты о решениях крупнейших игроков на рынке Unix-систем высокой готовности. Некоторое время назад завершилось очередное комплексное исследование различных решений в области кластеров и единых систем высокой доступности по таким показателям, как надежность, доступность и простота обслуживания.

Данное исследование, проведенное американской компанией D.H.Brown Associates, состояло из двух частей: в первой оценивались возможности и функции систем, во второй — возможности кластеризации и восстановления работоспособности системы в случае аварии. Тестировались соответствующие предложения Compaq, IBM, Hewlett-Packard, Sun, Data General (DG) и Sequent. В итоге решение Compaq набрало 79,8%. На втором месте оказалась компания IBM, получившая 76,2%, на третьем — Sun с 73,6%. Система Compaq, принимавшая участие в тестировании, состояла из сервера AlphaServer GS320 (под управлением операционной системы Tru64 Unix с установленным программным обеспечением TruCluster Server) и системы хранения данных Compaq StorageWorks EMA 12000.

Исторически сложилось так, что Compaq вместе с покупкой Digital приобрела самые передовые технологии в области построения RISC-систем. Digital была пионером в построении кластерных систем, и когда в 90-х годах она анонсировала новый 64-разрядный RISC-процессор Alpha, то стала первой компанией, предложившей в то время коммерческую версию 64-разрядной ОС. Ни один из ее конкурентов тогда не видел необходимости предоставлять заказчикам 64-разрядный вариант операционной системы, т. к. текущие потребности большинства приложений не выходили за пределы возможностей 32-разрядных ОС. Но когда в конце 90-х годов возникла необходимость использования ресурсов 64-разрядных операционных систем, заказчики, выбравшие платформу Digital, были избавлены от необходимости перекомпиляции кода и переписывания приложений с 32- на 64-разрядную платформу. Перед этой проблемой столкнулись все другие производители RISC-систем: Sun, Hewlett-Packard и IBM. А также их заказчики.

Благодаря уникальным инженерным разработкам процессор Alpha стал самым быстрым в мире — он всегда имел наивысшую тактовую частоту и наибольший показатель по производительности в различных тестах.

Compaq продолжила дело, начатое Digital. Это касается как поколения процессоров Alpha, так и поколения многопроцессорных корпоративных серверов. Сейчас линейка решений на RISC-процессорах Alpha представляет полный спектр продуктов — в ней имеются системы от однопроцессорного сервера начального уровня до 32-процессорных серверов. Причем 32 процессора не являются пределом, поскольку при построении систем с большим количеством процессоров главную роль начинают играть возможности операционной системы, такие как параллельные кластеры и системы с единым образом (Single System Image). Эта функциональность позволяет объединить большое количество таких суперкомпьютеров и получить практически неограниченные процессорные ресурсы.

Самым старшим представителем среди серверов на процессорах Alpha является AlphaServer серии GS — модульный сервер, содержащий от 4 до 32 процессоров, которые в любой комбинации могут быть объединены в независимые динамические разделы (Partition). Обладая модульным дизайном, этот сервер представляет собой NUMA-систему, в которой модули объединяются внешней мультиплексированной системной шиной. Ее применение позволяет обойти ограничения существующих SMP-систем (до 8 процессоров) и обеспечить требуемый уровень пропускной способности системной шины, который необходим при объединении большого количества процессоров и организации работы с оперативной памятью. Таких модулей (building-blocks) в GS320 может быть до восьми, в каждый из них устанавливается до 4 процессоров и 32 Гбайт памяти. Таким образом, можно построить сервер с максимальным количеством процессоров, подключенных к одной системной шине, — 32 — и максимальным размером оперативной памяти — 256 Гбайт. Конечно, количество процессоров и размер оперативной памяти являются самыми важными показателями, но не самыми главными из тех, по которым оцениваются данные системы. Такие системы предназначены в основном для централизованных корпоративных систем. Поэтому, помимо максимального количества процессоров и размера оперативной памяти, данные серверы обладают максимальной наращиваемостью подсистемы ввода-вывода — к каждой подобной системе можно подключить до 224 PCI-устройств.

Поскольку эти серверы являются модульными, возможна организация виртуальных машин (динамических разделов) внутри одного корпуса сервера. При общих периферийных конструктивных компонентах, таких как блоки питания, вентиляторы охлаждения и шины PCI, можно создавать большое количество виртуальных машин, в каждой из которых будет запускаться своя копия операционной системы. Это дает гибкость и одновременно надежность при эксплуатации нескольких приложений в организации, что приводит к существенной экономии ресурсов.

Архитектура серверов серии GS создана по принципу резервирования внутренних компонентов. Таким образом, помимо максимальной наращиваемости вычислительной мощности, данное оборудование представляет собой отказоустойчивое решение. Кроме того, при организации на виртуальных машинах кластеров обеспечивается функция отказоустойчивости в случаях, если происходит сбой на уровне одной из виртуальных машин внутри сервера. В результате обеспечивается резервирование на уровне приложений и виртуальной машины.

Однако все равно сервер как таковой является единым целым, и если по какой-то причине этот сервер выходит из строя (например, при отключении питания), то для этого нужен резерв — аналогичный сервер либо сервер меньшей конфигурации, который берет на себя функции главного сервера в случае выхода из строя основного. Как правило, для серверов такого уровня причинами выхода из строя являются, скорее всего, только форс-мажорные обстоятельства.

Одним из способов исключения времени простоя и уменьшения влияния подобных ситуаций на работу пользователей, используется возможность объединения серверов такого класса в параллельные кластеры и системы с единым образом (Single System Image).

Параллельный кластер представляет собой не только отказоустойчивое программно-аппаратное решение. Это еще и система, обеспечивающая параллельную обработку данных на уровне ОС и приложения. Одним из таких приложений сейчас является Oracle 9i, российская премьера которого состоялась в середине октября текущего года. На базе этих продуктов строятся параллельные кластеры, объединяющие несколько машин серии GS. При этом для пользователей такая система представляется единой машиной с количеством процессоров, равным сумме таковых в каждом из серверов.

По результатам первой части исследования D.H.Brown Associates, опубликованного несколько месяцев назад, решение Compaq оказалось лучшим среди систем конкурентов. В тот раз специалисты D.H.Brown отметили превосходные возможности кластеризации, обеспечиваемые операционной системой Tru64 Unix и программным обеспечением TruCluster Server.

В первой части исследования изучалась функциональность кластерных Unix-систем. Решение Compaq превзошло по всем критериям системы конкурентов в разделах «Представление кластера как единой системы», «Одновременный доступ к базам данных» и «Управление отказоустойчивостью кластеров» и стало вторым в разделе «Резервное копирование и восстановление кластеров». Вклад этих показателей в общую оценку составил 65%.

Во второй части исследования (35% от общей оценки) изучалась отказоустойчивость единых систем. Решение Compaq показало наивысший результат в разделе «Аппаратное и программное обеспечение RAID-хранилищ» (RAID — избыточные массивы независимых дисков). При этом продукт Compaq StorageWorks поддерживал все функции, оценивавшиеся в разделе «Аппаратные RAID-массивы».

За счет функций распараллеливания доступа к данным, которые обеспечиваются Tru64 Unix и лицензированы компанией Oracle для своего продукта Oracle Parallel Server, достигается множественность путей доступа к данным, содержащимся в единой централизованной системе хранения.

В качестве такой системы хранения в оценивавшейся системе выступала EMA 12000, которая также имеет модульный дизайн. Стоит отметить, что все решения Compaq отличает их модульность. При помощи «строительных блоков» (building-blocks) можно проектировать и создавать системы, как удовлетворяющие текущим потребностям, так и практически не ограниченные по своим возможностям. А задачи масштабирования, отказоустойчивости и производительности системы в этом случае решаются путем добавления новых модулей.

Большим преимуществом EMA 12000 является также то, что при ее построении используются серийные продукты, которые могут покупаться отдельно. Никаких специализированных жестких дисков или дисковых полок в EMA 12000 не требуется.

За счет дублирования компонентов в EMA 12000 и применения стандарта Fiber Channel можно организовывать массивы с практически неограниченной емкостью и производительностью. Инфраструктура Fiber Channel изолирует уровень организации хранения информации от уровня обработки этой информации. За счет применения мультиплексированной шины Fiber Channel (Fiber Channel Switched Fabric) имеется возможность подключать неограниченное количество дисковых массивов и решать проблемы масштабирования, производительности и отказоустойчивости.

ПО Oracle Parallel Server, сертифицированное для использования с серверами серии GS, специально адаптировано для NUMA-архитектуры, на базе которой построены, в частности, серверы GS320. При этом последние версии СУБД Oracle содержат дополнительные настройки, позволяющие максимально эффективно использовать NUMA-архитектуру, заложенную в GS, и таким образом максимально распараллелить обработку по блокам (quad-building-blocks), максимально загрузить процессоры и максимально использовать пропускную способность системной шины и каналов ввода-вывода. На тестах производительности TPC-C сервер GS320 с ПО Oracle версии 8.1.7 показал наивысший результат в сравнении с системами других производителей именно за счет использования особенностей NUMA-архитектуры.

Операционная система Tru64 Unix изначально является 64-разрядной ОС. Но самая, пожалуй, главная особенность этой ОС — это возможность построения на ее основе кластеров с единым образом системы (Single System Image). При объединении нескольких машин в кластер на каждой из них запускается одна копия операционной системы, у которой есть один общий дисковый массив с единой файловой системой. Таким образом, кластер из нескольких серверов GS представляется как единая машина с объединенными вычислительными ресурсами, что опять же позволяет легко решить задачи масштабирования и отказоустойчивости. В случае выхода из строя одного из суперсерверов все задачи автоматически продолжают работать на другом узле кластера, и ни один из запросов пользователей в этом случае не будет потерян.

Дополнительно к Tru64 Unix компания Compaq продолжает развивать операционную систему уровня мейнфреймов — Open VMS, обеспечивающую более продвинутую на данный момент функциональность в сравнении с Tru64 Unix. При этом заказчики, которые исторически работали и продолжают работать с этой ОС, без серьезной нагрузки на свои IT-службы могут переносить без доработок работающие приложения на современные аппаратные решения на базе серверов на процессорах Alpha.

Благодарим ведущего специалиста отдела вычислительных систем компании КРОК Алексея Толманова за помощь при подготовке данного обзора.


–> вернуться на канал System Integration (reviews)