Вернуться на главную страницу Algo.ru  
 

Чтоб «сердце» биться не устало

 

 

     

Про обеспечение бесперебойной работы корпоративных систем...

18 апреля 2001
–> вернуться на System Integration (reviews)

Работу современной компании сегодня уже невозможно представить без использования электронных данных. И чем крупнее фирма, тем сильнее ее функционирование зависит от компьютерной техники и используемых информационных технологий. Документы и бухгалтерия, счета клиентов и партнеров, рекламная информация и электронная почта, корпоративные базы данных, — все это части современной корпоративной информационной системы (ИС).

Цена потерь

В настоящее время практически все компании сталкиваются с проблемой критического нарастания объемов и, конечно же, ценности информации. Рост количества и «качества» электронных данных ставит перед IT-подразделениями любой фирмы задачу построения современной системы обработки и хранения данных. По результатам исследования, проведенного американским агентством Meta Group, объем информации, аккумулируемой компаниями, удваивается каждые полтора года. Конечно, такие показатели пока что более актуальны для зарубежных компаний (структур), но и в российских фирмах идет процесс увеличения зависимости от накапливаемой полезной информации. Тем более что сейчас в России быстрыми темпами развиваются такие сферы деятельности, как электронная коммерция, планирование ресурсов предприятия (ERP-системы, Enterprise Resource Planning) и управление обслуживанием клиентов (CRM-системы, Customer Relationship Management).

При этом информация стоила и всегда будет стоить дороже средств ее обработки, передачи и хранения. Плата за поддержку доступности неизбежно увеличивающихся объемов данных составляет сегодня, по данным IDC, около 50% всех расходов на IT-решения. И все это делается для того, чтобы избежать еще более высоких трат, составляющих порой от 20 тыс. $ до 6 млн $ в час и связанных с потерями доступа к хранилищам коммерческой информации. В эту сумму входят, в частности, потери из-за снижения «продуктивности» (КПД) сотрудников в связи со сбоем в информационной системе, стоимость работ, которые не могут быть выполнены, пока работоспособность системы не будет восстановлена, а также стоимость ремонта вышедших из строя компонентов системы. Именно поэтому при автоматизации критически важных для предприятия или организации участков стоит учесть, что цена простоев по причине сбоев системы вполне оправдывает вложение немалых средств в применение отказоустойчивых архитектур.

Десять лет назад, когда сервер локальной сети на базе процессора Intel выходил из строя, неприятности компании ограничивались лишь возмущениями пользователей по поводу отсутствия доступа к электронной почте. Теперь же при выходе из строя корпоративной системы, появлении сбоев в приложениях, от функционирования которых напрямую зависит прибыль компании, или при частичной потере доступа к ценной информации фирма терпит огромные убытки.

По данным международной консалтинговой компании FIND/SVP, убытки американских компаний от сбоев в корпоративных информационных системах составляют до 4 млрд $ ежегодно. Как правило, остановка такой фирмы на срок до восьми дней ведет к снижению годового оборота компании на 3-4%, а от десятидневного простоя способны оправиться лишь немногие из них. Полная же потеря коммерческой корпоративной информации грозит компании разорением.

Планирование информационных систем

Как правило, при проектировании и создании либо последующей модернизации корпоративных информационных систем вне зависимости от типа организации, будь то банковская структура или промышленные предприятия, обеспечению высокой степени надежности системы уделяется первоочередное внимание. При этом информационная система должна строиться так, чтобы обеспечивался желаемый уровень ее готовности и производительности. Добиваться позитивных результатов в этих направлениях можно различными способами. Часто предпочтительнее оказывается использование стандартных отраслевых решений, которые позволяют успешно внедрять передовые технологии.

Очевидно, что требования различных организаций к уровню готовности данных во многом отличаются. Предлагаемые решения также сильно разнятся как по принципам построения, так и по цене. При реализации подобных проектов соответствующими IT-подразделениями, как правило, выделяются несколько направлений деятельности. Наиболее результативным из используемых на практике решений является аппаратное резервирование различных компонентов системы.

Работа бесперебойной не бывает

Бесперебойная работа — понятие, в принципе, относительное. Даже в самой отказоустойчивой системе, в том числе построенной по кластерной технологии, с уровнем готовности 99,999%, существует минимальное время простоя, составляющее несколько минут в год. В течение этого времени из-за отказавших компонентов и неисправного оборудования какие-то ресурсы системы недоступны, и «бесперебойное» функционирование поддерживается резервной аппаратурой.

Метод аппаратного резервирования, к сожалению, не очень распространенный, хотя и обеспечивает самый высокий уровень готовности данных. Аппаратное резервирование — понятие само по себе достаточно емкое. Под этим термином можно подразумевать различные решения — от дублирования внутрисерверных компонентов до создания кластеризованных систем с удаленной репликацией данных на десятки километров и резервных офисов.

Кластеризация дает большие преимущества по сравнению с другими системами:

  • значительное уменьшение времени простоя информационной системы в случае отказа ее элемента;
  • возможность проведения профилактических работ без прерывания работы пользователей;
  • снижение стоимости администрирования нескольких серверов.

В информационных системах различных организаций находят применение как кластеры с центральной точкой отказа, так и без таковой. Первые — кластеры с наличием центральной точки отказа — получили на сегодняшний день наибольшее распространение. Причем устранение единой точки отказа обычно является вторым этапом в рамках усовершенствования уже существующей ИС. Комплект оборудования для реализации этого перехода при использовании, например, кластеров Compaq на процессорах Intel и ПО Microsoft обходится, в среднем, в 10 тыс. $.

В последнее время, однако, все чаще стали привлекать к себе внимание проекты с возможностью организации удаленного зеркалирования дисковых подсистем, находящихся на расстоянии до 40 километров друг от друга, например, в разных зданиях города. Для этого случая существует катастрофоустойчивое решение без центральной точки отказа. При этом под вторым зданием иногда подразумевают резервный офис. Стоимость такого решения достаточно высока — порядка нескольких сотен тысяч долларов без учета стоимости кабельной системы и работ по ее прокладке.

Однако даже в этом случае одного аппаратного резервирования для организации действительно надежной информационной системы и предотвращения каких-либо сбоев недостаточно. Еще одним важным фактором является, в частности, правильно спланированная система резервного копирования.

Оригинал — хорошо, а копия — лучше

Неотъемлемая часть организации стабильной и надежной по функционированию информационной системы компании — система резервного копирования. Процесс резервного копирования данных, в той или иной степени применяющегося сейчас практически повсеместно, выполняется по определенному расписанию в зависимости от характера и структуры компании.

Существует несколько принципов построения и организации подобных систем. Естественно, по стоимости все эти решения существенно различаются, а их выбор зависит от преследуемых компанией целей, стоимости самих данных, размера предполагаемых денежных вложений, а также стоимости одной минуты простоя информационной системы.

Локальное копирование

В любом подразделении организации, где имеется один-два сервера с подключенными к ним ленточными накопителями, проводится регулярное резервное копирование — локальное копирование. Устройство резервного копирования в этом случае соединяется непосредственно с сервером. Производительность канала сервер – устройство копирования при этом максимальна. При поддержке такого способа можно рекомендовать чаще обращать внимание на появление новых моделей накопителей — более быстрых и емких, чтобы при необходимости с меньшими потерями и большей эффективностью проводить модернизацию системы. Стоимость подобного решения невысока — порядка 1,5 – 6 тыс. $.

Однако этот метод может быть достаточно дорогостоящим, если число серверов для резервного копирования велико. Также требуются и большие административные расходы для ручной смены носителей в локальных устройствах резервного копирования для каждого из серверов. Использование библиотек и массивов лент может снизить административные расходы, но по-прежнему будет требоваться отдельное внимание для каждого сервера.

Сетевое копирование

Если требуется хранить резервные копии информации с нескольких серверов в сети организации, применяется сетевое копирование. Как правило, для этого выделяется сервер, отвечающий за проведение такого копирования по сети. К нему непосредственно подключается устройство копирования. Этот метод также довольно хорошо известен, однако стоимость такого решения сильно зависит от типа используемого ленточного накопителя и составляет, ориентировочно, до 20 тыс. $.

Схема сетевого копирования может включать соединения с серверами для копирования через активное сетевое оборудование. Устройства резервного копирования могут быть представлены несколькими ленточными библиотеками. В последнее время популярно выделять для резервного копирования отдельный сегмент в сети организации.

Специализированные решения

Рассмотренные выше решения по организации резервного копирования часто ведут к большой загрузке сети и длительному времени копирования данных.

Использование автоматизированных ленточных библиотек большой емкости позволяет решить проблемы больших объемов копирования и исключить ручные операции при смене носителей для резервного копирования. Однако, несмотря на это, при использовании мощных ленточных библиотек пропускная способность сети может еще скорее стать самым узким местом системы.

Выходом в данной ситуации может послужить применение специализированных решений, таких, например, как Compaq Fibre Channel StorageWorks Enterprise Backup Solution (EBS), в которых данные для резервного копирования и вся остальная информация передаются по разным каналам.

Использование данной модели организации памяти имеет несколько основных преимуществ:

  • существенное увеличение производительности системы в целом, благодаря разделению резервного копирования и сетевых коммуникаций (LAN) на разные каналы при решении задач бизнеса;
  • обеспечение современными программными средствами высокой управляемости и эффективности процесса копирования.

    Критически важным для подобных решений является выбор программного обеспечения резервного копирования. Compaq для EBS использует продукты ARCserve от Computer Associates, BackupExec от Seagate Software и ряд других, к преимуществам которых можно отнести, в частности, работу с базами данных в режиме on-line, работу с RAID-массивами, восстановление после критических сбоев, поддержку образов клиентских дисков.

    В решении Compaq Enterprise Backup Solution выделяются отдельные каналы Fibre Channel, по которым копируемые данные, минуя пользовательскую ЛВС, попадают на устройство резервного копирования. Архитектура решения по резервному копированию с использованием ARCserve включает один первичный (primary) сервер и несколько распределенных (distributed) серверов, которые взаимодействуют друг с другом по локальной сети. Первичный сервер играет роль арбитра при разрешении конфликтующих запросов на копирование к разделяемым устройствам резервного копирования, а также отвечает за функционирование роботизированного механизма библиотеки и перемещение лент.

    Один в поле не воин

    Однако какие бы информационные системы не проектировались, будь то простейшая система, построенная на сервере начального уровня, или крупный проект по реализации катастрофоустойчивого решения с удаленной репликацией данных на десятки километров, IT-службы компании всегда должны работать в тесном взаимодействии с системным интегратором, выполняющим проект, с тем чтобы получить наиболее оптимальное решение, наилучшим образом удовлетворяющее конкретным условиям эксплуатации. В случае наличия в системе критичных к простою элементов компания-интегратор всегда рассмотрит все возможные варианты аппаратного резервирования подобных компонент и, в частности, установку различных кластерных конфигураций. Применение же стандартных отраслевых решений от ведущих мировых фирм-производителей, таких как Compaq, Microsoft, Oracle, Computer Associates и других, позволяет существенно сократить время планирования, исполнения и внедрения подобной информационной системы.

    Еще одним из важных факторов, который нельзя не учитывать, является развитие правильной инфраструктуры вокруг корпоративной информационной системы, которая позволяла бы в оперативном порядке решать все возникающие у фирмы-заказчика проблемы. Наличие тесных контактов со стороны заказчика с сервисной службой, региональным сервисным партнером или центральным сервисным центром фирм-производителей оборудования позволяет до минимума сократить возможное время простоя и издержки на поддержание работоспособности ИС. В этом плане сотрудничество с компанией, одновременно являющейся интегратором и предоставляющей услуги сервисного центра в комплексе, в большинстве случаев является оптимальным вариантом.

    Например, компания КРОК уже не первый год премируется званием лучшего сервис-центра Compaq. Отдельным направлением ее деятельности как раз является развитие региональной сервисной сети. На текущий момент у КРОК насчитывается уже 14 сервисных центров в разных городах России.

    Правильная организация инфраструктуры вокруг информационной системы подразумевает, что на каждое оборудование, используемое в компании, и даже на каждого поставщика техники имеется свой «канал» с выходом на склады запчастей и резервного оборудования. Для организации подобных сервисов требуется закладывать определенные средства. Но, несмотря на это, уже сейчас очень многие, по крайней мере, крупные организации, которые понимают необходимость использования такого уровня сервисов круглосуточно семь дней в неделю, оплачивают услуги по содержанию «под них» складов запчастей и специалистов, которые могут в любой момент прийти на помощь и решить любые возникшие проблемы в самый короткий срок.

    Однако не стоит забывать о том, что опасность часто исходит не только от «рокового стечения обстоятельств» или природных бедствий, но и может подстерегать «изнутри». Проще даже сказать, что опасность таится повсюду, и что-то незапланированное может произойти в любой момент времени.

    За безопасность!

    Чтобы не доводить дело до трагического финала, необходимо также правильно организовать контроль и управление ресурсами и пользователями информационной системы или, другими словами, разработать политику безопасности, которая включала бы в себя правила работы в системе и методику ее восстановления в случае отказа. Так, чтобы даже человеку, недостаточно сведущему в этой области, было понятно, что нужно сделать, с тем чтобы привести систему в рабочее состояние. Помимо этого, для уменьшения времени простоя и поддержания бесперебойной работы всей системы необходимо постоянное проведение профилактических работ.

    Конечно, от катастроф, стихийных бедствий, случайных отказов, скачков напряжения и даже полного отключения питания никто не застрахован. Именно поэтому очень многие руководители IT-подразделений стараются правильно вложить деньги в разработку и создание корпоративных информационных систем, по минимуму затратив свои средства и по максимуму себя обезопасив. И сейчас уже в большинстве случаев компании «по-новому» подходят к организации подобных систем — начинают с обучения собственных специалистов, вкладывая деньги не только в «железо», в материальные проекты, но и в поднятие общего интеллекта сотрудников, в приобретение ими определенного опыта и в выработку, быть может, каких-то основных стратегических принципов.

    К чему идем?

    Конечно же, методы достижения желаемого конечного результата напрямую зависят от цели, преследуемой компанией. В любом случае все серьезные решения принимаются на уровне топ-менеджеров. Однако в настоящее время существуют две реальные альтернативы: либо обучать своих собственных сотрудников (если есть на это время и это целесообразно), либо отдать решение данной задачи на аутсорсинг, т. е. просто купить себе сервис, который предполагает работу сторонней компании, следящей за поддержанием работоспособности внутренней корпоративной системы.

    Выбор одного из этих вариантов, опять же, зависит от политики компании. Существуют организации, нацеленные на оказание подобных услуг и имеющие обученный штат специалистов.

    Надежность решения зависит не только от бесперебойной работы аппаратного обеспечения, но и от стабильной совместной работы всего аппаратно-программного комплекса. Поэтому чрезвычайно важно, чтобы компания, создающая и осуществляющая поддержку этих решений, имела в своем составе профессионалов в области интеграции программных и аппаратных средств. По такому пути пошел, в частности, КРОК, имеющий в своем активе десять специалистов наивысшей квалификации ASE Compaq и двенадцать системных инженеров и разработчиков решений Microsoft. Именно поэтому КРОК уже много лет имеет звание «Лучший системный интегратор Compaq» и статус Сертифицированного партнера Microsoft и предлагает полный спектр решений по созданию отказоустойчивых решений для корпоративных информационных систем.


  • –> вернуться на канал System Integration (reviews)