Меню

План то серверного оборудования



Базовый чек-лист обслуживания серверов

Как часто, насколько тщательно и в каком режиме обслуживать сервера на colocation — зависит от количества, возраста и типа оборудования. Здесь как с техникой: регламент техобслуживания трехлетнего Hyundai Solaris один, а у годовалого YAMAHA FJR1300AE совсем другой. Но если усреднить, всю программу обслуживания серверов можно свести к простому списку рутинных операций.

Структура обслуживания

Сервер — это комплекс программного обеспечения, работающего на аппаратной части. Соответственно, в обслуживание сервера включается техническое обслуживание (ТО) «железа» и поддержка программной составляющей. Начнем с «железа»:

Очистка от пыли. У нас в машзалах настелены антистатические полы, на системе приточной вентиляции установлены фильтры, а уборка проводится ежедневно. Но пыль вездесуща и, рано или поздно, она забивается в зазоры и оседает на контактах. Тотальную чистку оборудования от пыли в среднем проводят 2 раза в год. В остальное время можно ограничиться визуальным контролем и ситуативными мерами.

Контроль индикаторов и замена комплектующих, требующих вскрытия корпуса. Чаще всего из строя выходят жесткие диски, но состояние выработавших ресурс RAM и процессора также может потребовать замены.

Проверка портов. Безопасности много не бывает, поэтому неиспользуемые открытые порты нужно время от времени просматривать на предмет посторонних подключений.

Внешний и внутренний осмотр, оценка температурных параметров.

Проверка аппаратной части

Проверка аппаратной части

В программной части работы не меньше:

Обновление системы. Наша многолетняя практика показывает, что автоматические обновления не всегда устанавливаются чисто. Принудительная установка позволяет сначала проверить их корректность на тестовом сервере.

Плановая перезагрузка. В процессе чистятся логи и завершают работу фоновые задачи, невыполненные из-за сбоя.

Проверка безопасности, включая сканирование системы и выявление скрытых заражений.

Контроль корректности резервного копирования. Сбои происходят везде, даже в системе резервного копирования. Чтобы точно знать, что в запасе есть рабочая копия, регулярно проверяйте, делаются ли копии, правильно ли сохраняются, в нужном ли объеме. В этом же блоке работ имеет смысл проводить тестовое восстановление резервных копий и баз.

Чистка диска от временных файлов. Эта регулярная операция поддерживает системный диск в чистоте и освобождает место под нужные данные.

Отслеживание ошибок по журналу логов. По записям можно узнать о проблемных местах сервера и предотвратить возникновение критических ошибок, вместо того, чтобы впоследствии устранять их.

Контроль систем мониторинга. Мониторинг снимает массу рутинной работы с администратора, но излишнее доверие системе может привести к излишнему потреблению ресурсов сервера. Дело в том, что система не всегда успевает вовремя отреагировать на изменение ситуации и здесь нужен только личный контроль: просмотр отчетов потребляемых ресурсов, поиск критических точек, анализ тенденций.

Большая часть этих работ проводится с периодичностью раз в месяц, но чем больше серверный парк и чем масштабнее проект, тем чаще оборудование требуется контролировать и обслуживать.

Обслуживание сервера по регламенту

Обслуживание сервера по регламенту

В идеале под обслуживание серверов составляется инструкция или регламент. Регламент может быть большим или сжатым, детально прописанным или общим — не важно. Важно, чтобы он стал опорным пунктом для любого, кто столкнется с администрированием вашего оборудования.

Источник

Как правильно обслуживать серверное оборудование?

Если представить активную IT-инфраструктуру предприятия в виде механизма, который находится в постоянном движении, то серверу подойдет роль мотора. Нужно ли обслуживать мотор? И механик, и IT-специалист будут единогласны: конечно, ведь от этого зависит работоспособность остальных компонентов системы. В случае с серверами привычное администрирование – лишь часть комплекса работ, в которых нуждается оборудование. Разбираемся, какие сервисные мероприятия попадают в эту категорию и чего стоит ожидать от специалистов по обслуживанию серверного оборудования.

Гарантийная и послегарантийная поддержка серверов

Поставка серверного оборудования – это всегда большая ответственность. Владельцы бизнеса рискуют деньгами, а производители серверов – репутацией на рынке. Поэтому гарантийное обслуживание является обязательным условием заключения договора между первыми и вторыми. Оборудование, которое находится на поддержке у производителя, легко восстановить в случае выхода из строя одной или нескольких деталей. В большинстве случаев для этого даже не потребуется остановка сервера в разгар рабочего дня – IT-специалисты выберут оптимальное время и завершат работу максимально быстро. Они же и обнаружат неисправность: заказчик может не вникать в эти вопросы, и монтаж серверного оборудования или комплектующих завершится без его участия.

Сервисный инженер заменяет оборудование в стойке

Замена оборудования в стойке

Немного подробнее о том, как это реализовано на практике. Для серверного оборудования разрабатывается и утверждается порядок проведения регламентных работ. Непрерывный мониторинг – самая популярная превентивная мера: с ее помощью легко обнаружить неполадку на начальном этапе и в будущем избежать аварийной остановки оборудования. Мониторинг позволяет отслеживать состояние серверов, остального железа, температурного режима и других параметров. Если один (не критичный) компонент выйдет из строя, система продолжит работать, но просигнализирует о неполадке – например, так случится после выхода из строя модуля памяти или сбоя охлаждения видеокарты.

Читайте также:  Сварочное оборудование а3 а14

В описанной ситуации IT-специалист выезжает на объект и уже там принимает решение о ремонтных мероприятиях на сервере. Он же создает обращение в службе поддержки производителя серверного оборудования, которая отправляет с сервисного склада необходимую деталь. Если вышедший из строя компонент не нарушает работу IT-инфраструктуры, заказчику не обязательно в этом участвовать. Если для его замены требуется остановка бизнес-процессов, потребуется предварительно согласовать время проведения ремонта и настройки оборудования.

Как профилактическая мера, в удаленном режиме обновляются прошивки, отслеживается состояние операционной системы и время отклика – важный критерий ее работы. Значимый для безопасности предприятия объем работ – мониторинг ведения политики паролей и организация доступа к данным или оборудованию.

У крупных вендоров оборудование для серверных помещений оснащено внутренними контроллерами. Они собирают информацию о состоянии аппаратной части, операционной системе, запущенных процессах. Эта информация анализируется и в случае возникновения внештатной ситуации производитель отправляет на объект готовые решения.

После завершения гарантийного срока специалисты согласовывают дальнейшее обслуживание с заказчиком. Наиболее востребованные мероприятия – администрирование серверной платформы, обслуживание файловых хранилищ, видеонаблюдения и других сопутствующих систем, которые образуют IT-инфраструктуру предприятия.

Услуга обслуживания серверов: кому это выгодно

Делегировать не только установку серверного оборудования, но и последующее его обслуживание выгодно, в первую очередь, заказчику. Он не занимается администрированием системы, не ищет поставщиков деталей, которые требуют замены, и не решает организационные вопросы, если оборудование или его компоненты выходят из строя. Вместо него за эти задачи отвечают специалисты компании ITELON: напрямую общаются с саппортом производителя серверного оборудования, в удаленном режиме или непосредственно на объекте выполняют регламентные и ремонтные работы.

Выбор правильного решения по обслуживанию серверного оборудования

IT-специалист примет верное решение по серверному оборудованию

Еще одна выгода заказчика в том, что ему не приходится содержать в штате нескольких узкоспециализированных техников: по аппаратной части серверов, по программному обеспечению, по системам хранения данных и т. п. Благодаря этому предприятие получает реальную экономию на оплате труда, налогообложении и организации рабочего места сотрудника. Также заказчик защищает предприятие от упущенной выгоды: критичная ситуация на сервере может привести к остановке бизнес-процессов.

В IT-сфере требования к серверному оборудованию выдвигает только заказчик. А задача производителя (а после завершения гарантии – поставщика услуг) заключается в том, чтобы поддерживать это оборудование независимо от условий его эксплуатации. Соответственно, и IT-специалисты выполняют сервисные работы при любых обстоятельствах. Например, и в маленьких, и в крупных компаниях часто не поддерживается оптимальный режим температуры и влажности. В одних случаях для размещения серверного оборудования выбирается обычный офис или неприспособленное подсобное помещение. В других – заказчик часто экономит на площади помещения, хотя обеспечивает и кондиционирование, и резервное электроснабжение.

В компании Itelon выполнят сервисное обслуживание серверов в течение гарантийного и послегарантийного периода, предложат оптимальный перечень регламентных и профилактических работ, которые помогут защитить серверное оборудование и ваш бизнес.

Источник

Регламентные операции при обслуживании серверов

Любой сервер, как и автомобиль, требует регулярного технического обслуживания, чтобы работать без сбоев и не подвести владельца в нужный момент. Для этого мы регулярно возим наших «железных коней» на станцию техобслуживания, где с ними выполняют определенные операции, позволяющие им и дальше не подводить своих хозяев. Аналогичные регулярные операции надо выполнять и на серверах, чтобы они не остановили работу компании.

Наши специалисты, основываясь на богатом опыте ИТ-обслуживания, сформировали список регламентных операций, оптимальных для Windows-серверов. Обычно в бизнесе применяют именно Windows , поэтому на таких серверах и делался акцент в этой статье. Исходя из соотношения трудозатрат и эффективности мы пришли к периоду регламентных операций — раз в 1 месяц. При таком периоде процедура не сильно напрягает клиента и позволяет достигнуть требуемых значений надежности работы серверов.

Еще одним важным преимуществом проведения регламентных операций – является сопутствующее выполнение функции мониторинга «здоровья» серверов. Очень часто во время проведения этих работ удается диагностировать скрытую проблему на сервере. Например, после плановой перезагрузки, он не загружается, или загружается с ошибками служб. Если такая неудачная перезагрузка произошла бы в рабочее время, то простой в работе был бы болезненным для компании клиента. Поэтому, когда такие проблемы всплывают во время регламентных операций, проводимых в рамках абонентского обслуживания серверов – это не критично для бизнеса, ведь процедуры проводятся в нерабочее время клиента и есть возможность своевременного устранения неисправности. (см. Таблица 1)

Название операции

Периодичность

Принудительная установка обновлений через WindowsUpdate

Автоматическая установка обновлений на серверах очень нежелательна, потому что после обновления нужна перезагрузка сервера, а после чего — распаковка скачанных обновлений. Это занимает значительное время, которое недопустимо терять в рабочий день.

Читайте также:  Бытовое газовое оборудование магазины саратов

Кроме того, иногда обновления бывают «проблемными» и приводят к неработоспособности различных служб. Приходится откатывать такие обновления, а это тоже занимает время и получается простой сервера.

Операционная система Windows очень любит перезагрузки. Во время перезагрузок от «утечек» очищается оперативная память, чистятся логи и завершаются зависшие фоновые задания. Если не делать плановые перезагрузки Windows , то система может зависнуть и при этом в самый ответственный момент.

Запланированный полный антивирусный осмотр

Установленного на сервер фонового антивируса недостаточно, так как он проверяет только транзитные файлы и данные, проходящие через оперативную память и кэши. Необходимо регулярно проводить полную проверку всей файловой системы, чтобы выявлять «просочившиеся» вирусы.

Проверка системы на вирусы с помощью Dr.Web CureIt

Ни один антивирус не может обеспечить 100% защиты от вирусов. Для более эффективной защиты применяют несколько антивирусных ядер в целях проверки, это повышает вероятность обнаружения вируса.

Дефрагментация дисков утилитой MyDefrag

Это операция упорядочивания данных на диске. Её выполнение приводит к увеличению производительности дисковой подсистемы, особенно в показателях чтения данных.

Проверка создания backup`ов

Даже операции резервного копирования могут давать сбои. Поэтому важно вручную проверять что резервные копии делаются, их размер не нулевой и дата актуальная.

Проверка корректного восстановления резервных копий файлов и SQL-баз.

К сожалению, наличие резервной копии не гарантирует успешное восстановление данных. Поэтому необходимо обязательно проводить тестовое восстановление данных из резервной копии, чтобы быть на 100% уверенным в работоспособности этих данных.

Для баз MSSQL нами разработаны скрипты, которые позволяют одним нажатием кнопки мыши проводить разворачивание резервной копии в тестовую базу с последующей проверкой целостности данных. Это очень облегчает процесс проверки и резко повышает фактическую исполняемость этого пункта перечня регламентных операций.

Удаление temp -файлов и старых log -файлов — папки С:\ Windows \ system 32\ Logfiles, C:\Documents and settings\%user%

Регулярная чистка места от временных файлов позволяет не захламлять системный диск, чтобы в дальнейшем не столкнуться с ошибкой исчерпания свободного места на системном диске.

Контроль записей в системном журнале на предмет наличия ошибок.

Анализ данных мониторинга.

В системном журнале можно найти информацию о проблемных местах сервера, отследить динамику улучшения или ухудшения его «здоровья» и проактивно реагировать на потенциальные проблемы.

Контроль мониторинга – корректная работа службы, корректная отправка и доставка уведомлений.

Все серверы наших клиентов подключены к единой системе мониторинга. В данном пункте проверяется что агент этой системы работает корректно.

Проверка открытых портов

Данная проверка позволяет контролировать безопасность сети клиента на предмет открытых ненужных портов.

Таблица 1 — Описание регламентных операции

Во время проведения регламентных операций происходит подтормаживание сервера, а так же плановые перезагрузки, поэтому эти операции в рабочие время клиента выполнять нельзя. Мы выполняем их в нерабочее время клиента, обычно в пятницу вечером.

Пожалуй, самая большая проблема в проведении регламентных операций – это регулярность их выполнения сотрудниками. Пресловутый «человеческий» фактор может дать о себе знать. Для решения этой проблемы мы придумали следующее: задачи на проведение регламентных операций ставятся сотрудникам системой ERP . На основании этой задачи сотрудник заполняет чек-лист, сгенерированный системой конкретно по объекту проверки. Если эта задача проигнорирована сотрудником, то у него происходит блокировка ERP до выполнения задачи. Также об этом сразу уведомляется руководитель, что позволяет контролировать своевременность исполнения регламентных операций.

Для контроля качества выполнения регламентных операций мы разработали три автоматизированных алгоритма проверки («роботов») которые в фоновом режиме постоянно проверяют на всех серверах ряд параметров: наличие открытых портов, наличие актуальных ненулевых резервных копий и наличие установленных обновлений системы за последний месяц. Эти параметры позволяют сказать проводились ли регламентные операции по факту.

Эффект от внедрения регламентных операций

В результате внедрения культуры проведения регламентных операций при абонентском ИТ-обслуживании, нам удалось достигнуть весьма впечатляющих показателей повышения надежности работы серверов наших клиентов:

Поражение операционной системы вредоносным ПО снизилось — на 75%

Снижение факта отсутствия актуальной целостной резервной копии — на 95%

Снижение сбоев операционной системы после неудачной установки обновлений — на 80%

Снижение сбоев, проявляющихся после перезагрузки сервера — на 70%

Оставшиеся случаи происходят по причине обстоятельств, которые невозможно предусмотреть заранее и выявить с помощью профилактики — например, появление нового вируса, неадекватное поведение приложений и служб, действия пользователя и так далее.

На основании нашего опыта проведения технического обслуживания серверов организаций, включающего регламентные операции, можно сделать вывод, что польза от этих процедур значительно превосходит затраты времени и ресурсов на их выполнение. Это говорит о том, что проблему лучше предотвратить вовремя, чем бороться с ее последствиями в дальнейшем.

Читайте также:  Диагностическое оборудование для труб

—>

EFSOL Системная интеграция. Консалтинг

Источник

Регламент обслуживания серверов

  • Акции
  • Новости
  • Статьи
  • Вопрос ответ

Проектирование, монтаж и наладка систем видеонаблюдения (СВН, СОТ), систем контроля доступа (СКУД), слаботочных систем, СКС, ЛВС, систем «Умный дом», переговорных и конференц-залов, охрано-пожарных систем (ОПС), домофонии и телефонии (IP АТС и телефония).

Комплексные поставки оборудования для монтажных организаций.

aladox_logo.png

Перейти на сайт www.aladox.ru — интернет магазин формата B2B и B2C систем безопасности, связи и автоматизации.

vcatalog.png

Регламент обслуживания серверов

1. Техническое обслуживание сервера

  1. Электропитание. Необходимо убедиться в наличии источника бесперебойного питания для сервера (ИБП) и достаточном уровне заряда его аккумулятора. Желательно, чтобы ИБП мог отправить сигнал на выключение сервера, если заряда осталось очень мало.
  2. Пыль. Время от времени, необходимо чистить сервер от скопившейся пыли. Для этого рекомендуется использовать баллончики со сжатым воздухом. Особое внимание стоит уделить кулерам.
  3. Индикация. Визуально осмотреть сервер — если какой-либо из аппаратных компонентов работает со сбоем, можно увидеть горящую красную лампочку. Чаще всего выходят из строя жесткие диски. Необходимо вовремя заметить проблему, чтобы успеть выполнить замену комплектующих и избежать потери данных.
  4. Серверное помещение. В помещении, где находится серверное оборудование, должна быть невысокая температура воздуха — следите за работой системы кондиционирования. В помещении должно быть чисто.

2. Обслуживание программного обеспечения

  1. Установка обновлений. Они содержат исправления критических ошибок, а также новые возможности. Правильно, сначала устанавливать обновления на тестовом сервере, чтобы проверить их корректность. В противном случае, можно навредить системе.
  2. Проверка безопасности. Включает поиск обновлений безопасности системы и их установку. А также поддержание актуальности антивирусных баз и запуск сканирования на вирусы (желательно одноразовым антивирусом, например CureIt).
  3. Чтение системных журналов (логов). Самый лучший способ устранить проблему — не допустить ее. С помощью журналов можно отследить все ошибки и предупреждения, которые происходят в системе и предотвратить серьезные последствия. Необходимо обратить особое внимание на системные логи и сообщения критически важных приложений.
  4. Выполнение оптимизации. Во время обслуживания сервера, необходимо просматривать счетчики производительности для поиска процессов, которые перегружают систему. Также необходимо чистить систему от временных файлов, выполнять дефрагментацию диска и его логическую проверку.
  5. Проверка состояния жестких дисков. Дисковые накопители, по двум причинам, являются одним из важнейших объектов проверки — во-первых, на них самое ценное — данные, во-вторых, они часто выходят из строя. Необходимо проверять состояние поверхности диска с помощью специализированных утилит, например HD Tune.

Windows и Linux — в чем разница поддержки

Как правило, принципиальных различий в обслуживании серверов на базе Windows и Linux нет. Отличаются только команды, инструменты и их внешний вид. В Windows больше работаем мышкой, в Linux — клавиатурой.

Вот небольшой список различий, на которые стоит обратить внимание:

  • Linux нужно реже перезагружать после установки обновлений. Это важно учитывать для Windows и обновлять систему в нерабочее время.
  • Системы на базе Linux меньше подвержены вирусным атакам и взломам. Однако не стоит расслабляться — вирусы все-таки есть и предусмотреть это стоит. Таким образом, не стоит исключать из регламента антивирусную проверку — просто в системах Windows это нужно делать почаще.

3. Как принять в обслуживание сервер

В независимости, передал ли сервер другой специалист или Вы его видите впервые, действия должны быть следующие:

  1. Для доступа к системе получаем логин и пароль и меняем последний. Также не лишним будет сменить пароли всем учетным записям с привилегиями администратора. Если данных для авторизации нет, необходимо выполнить сброс пароля.
  2. Выполняем аудит ранее установленного программного обеспечения. Если обнаружено ПО для удаленного управления, удаляем или меняем данные для аутентификации.
  3. Проверяем планировщик заданий (в Windows) и cron (в системах на базе UNIX). Изучаем, что именно запускается и отключаем все лишнее и противоречащее безопасности.
  4. Выполняем действия по обслуживанию аппаратной и программной частей, описанные в данной инструкции выше (1-й, 2-й пункты).

4. Мониторинг и резервное копирование

Две неотъемлемые составляющие профессионального подхода к обслуживанию серверов.

Мониторинг

Рекомендуется использовать выделенную систему мониторинга, при использовании 10 серверов и более.

В первую очередь, необходимо мониторить сетевую доступность оборудования. Если мониторинг позволяет, также стоит проверять статусы служб, коды ответов на запросы, наличие свободного дискового пространства.

Резервное копирование

В рамках периодического обслуживания сервера, важно проверять своевременное создание резервных копий, но что важнее — возможность восстановить из них данные.

5. Составление регламента

Для профессионального обслуживания серверного оборудования, Эксплуатирующая компания заранее составляет порядок проведения работ, другими словами — составляет регламент. Он должен включать перечень выполняемых операций и частоту их выполнения.

Источник