Меню

Горячая замена оборудования это



Горячая замена — Hot swapping

Горячая замена — это замена или добавление компонентов компьютерной системы без остановки, выключения или перезагрузки системы; горячее подключение описывает только добавление компонентов. Компоненты, обладающие такой функциональностью, считаются поддерживающими « горячую» замену или « горячую» замену ; аналогично компоненты, которые не поддерживают « холодную» замену или « холодную замену» .

Большинство аппаратных средств настольных компьютеров , таких как процессоры и память, допускают только холодную замену. Однако обычно серверы среднего и высокого уровня и мэйнфреймы имеют возможность горячей замены аппаратных компонентов, таких как ЦП , память , диски PCIe , SATA и SAS .

Хорошо известным примером функции горячей замены является соединение по универсальной последовательной шине (USB), которое позволяет пользователям добавлять или удалять периферийные устройства, такие как мышь, клавиатура, принтер или портативный жесткий диск. Такие устройства могут быть заменены или заменены в горячем режиме в зависимости от поставщика.

Большинство смартфонов и планшетов с загрузочными лотками могут заменять SIM-карты без отключения питания системы.

СОДЕРЖАНИЕ

  • 1 Обоснование
  • 2 Системные соображения
    • 2.1 Механическая конструкция
    • 2.2 Варианты
  • 3 разъема
  • 4 Силовая электроника
  • 5 Радиопередатчики
  • 6 Сигнальная электроника
  • 7 Игры
  • 8 Программное обеспечение
  • 9 Товарные знаки
  • 10 См. Также
  • 11 Источники

Обоснование

Горячая замена используется всякий раз, когда желательно изменить конфигурацию или восстановить работающую систему без прерывания ее работы. Это может быть просто для удобства, чтобы избежать задержки и неудобств, связанных с выключением, а затем перезапуском сложного оборудования, или потому, что для оборудования, такого как сервер , важно , чтобы оно было постоянно активным.

Горячая замена может использоваться для добавления или удаления периферийных устройств или компонентов, чтобы устройство могло синхронизировать данные с компьютером, а также для замены неисправных модулей без прерывания работы оборудования. Машина может иметь два источника питания , каждый из которых может питать машину; неисправный может быть заменен в горячем режиме. Важные карты, такие как контроллер диска или хост-адаптер, могут быть спроектированы с избыточными путями, поэтому их можно обновить или заменить, если они выйдут из строя, без необходимости вывода компьютерной системы из эксплуатации.

Системные соображения

Машины, поддерживающие горячую замену, должны иметь возможность изменять свою работу для измененной конфигурации либо автоматически при обнаружении изменения, либо при вмешательстве пользователя. Все электрические и механические соединения, связанные с горячей заменой, должны быть спроектированы таким образом, чтобы ни оборудование, ни пользователь не могли пострадать во время горячей замены. Другие компоненты в системе должны быть спроектированы таким образом, чтобы удаление компонента с возможностью горячей замены не прерывало работу.

Механический дизайн

Защитные накладки, экраны или лицевые панели могут использоваться как на съемных компонентах, так и на самом главном устройстве, чтобы предотвратить контакт оператора с цепями, находящимися под напряжением, для обеспечения антистатической защиты добавляемых или удаляемых компонентов или для предотвращения случайного прикосновения съемных компонентов и закорачивание включенных компонентов в рабочем устройстве.

Дополнительные направляющие прорези, штифты, выемки или отверстия могут использоваться для помощи в правильной установке компонента между другими токоведущими компонентами, в то время как механические защелки, ручки или рычаги могут использоваться для помощи в правильной установке и удалении устройств, которые требуют большое количество силы для подключения или отключения, или для помощи в правильном соединении и удержании вместе силовых и коммуникационных разъемов.

Вариации

Термин « горячая замена» имеет два слегка различающихся значения . Это может относиться только к возможности добавлять или удалять оборудование без выключения системы, в то время как системное программное обеспечение может быть уведомлено пользователем о событии, чтобы справиться с ним. Примеры включают RS-232 и устройства SCSI начального уровня. Иногда это называют холодным закупориванием . Однако, если система может обнаружить и отреагировать на добавление или удаление оборудования, это называется настоящим «горячим» подключением . Примеры включают USB, FireWire и устройства SCSI более высокого уровня .

Некоторые реализации требуют процедуры отключения компонента перед удалением. Это упрощает конструкцию, но такие устройства не являются надежными в случае отказа компонентов. Если компонент удаляется во время его использования, операции с этим устройством завершаются ошибкой, и пользователь несет ответственность за повторную попытку, если это необходимо, хотя обычно это не считается проблемой.

Более сложные реализации могут рекомендовать, но не требуют, чтобы компонент был выключен, с достаточной избыточностью в системе, чтобы позволить продолжить работу, если компонент удален без выключения. В этих системах горячая замена обычно используется для регулярного обслуживания компьютера или для замены вышедшего из строя компонента.

Разъемы

В большинстве современных методов «горячей» замены используется специальный разъем с расположенными в шахматном порядке контактами, так что одни контакты обязательно будут подключены раньше других. В большинстве конструкций с шахматным расположением выводов контакты заземления длиннее, чем у других, что гарантирует отсутствие подключения чувствительных цепей до появления надежного заземления системы. Все остальные выводы могут быть одинаковой длины, но в некоторых случаях используются три длины вывода, так что входящее устройство сначала заземляется, затем подключаются линии передачи данных, а на третьем подается питание, причем быстро по мере того, как устройство вставляется. Штыри одинаковой номинальной длины не обязательно контактируют в одно и то же время из-за механических допусков и наклона соединителя при вставке.

Когда-то считалось, что смещенные контакты были дорогим решением, но теперь многие современные семейства разъемов поставляются со смещенными контактами в стандартной комплектации; например, они используются на всех современных последовательных SCSI-дисках. В настоящее время коммерчески доступны специализированные контакты разъема питания с возможностью горячей замены с повторяемыми номиналами прерывания постоянного тока до 16 А. Печатные платы имеют ступенчатые выступы на концах для прямого подключения к разъему объединительной платы в горячем режиме.

Хотя скорость закупоривания невозможно точно контролировать, практические соображения предоставят пределы, которые можно использовать для определения наихудших условий. Для типичной шахматной конструкции штырей, где разница в длине составляет 0,5 мм, время между длинным и коротким контактом штифта составляет от 25 мс до 250 мс. Вполне практично разработать схемы с горячей заменой, которые могут работать с такой скоростью.

Пока оперативно заменяемый разъем достаточно жесткий, один из четырех угловых штифтов всегда входит в зацепление первым. Для типичного двухрядного соединителя это обеспечивает четыре угловых штыря, которые нужно сделать первыми, которые обычно используются для заземления. Другие контакты рядом с углами могут использоваться для функций, которые также выиграют от этого эффекта, например, для определения того, когда разъем полностью вставлен. Эта диаграмма иллюстрирует правильную практику, когда заземление находится в углах, а контакты питания — ближе к центру. Два сенсорных штифта расположены в противоположных углах, так что обнаружение полной посадки подтверждается только тогда, когда оба они соприкасаются с прорезью. Остальные контакты используются для всех других сигналов данных.

Силовая электроника

Источники питания постоянного тока для компонента с горячей заменой обычно предварительно заряжаются с помощью специальных длинных контактов, которые входят в контакт до основных контактов питания. Эти контакты предварительной зарядки защищены схемой, которая ограничивает пусковой ток до приемлемого значения, которое не может повредить контакты или нарушить подачу напряжения на соседние разъемы. Схема предварительной зарядки может быть простым последовательным резистором , резистором с отрицательным температурным коэффициентом (NTC) или схемой ограничителя тока. Дополнительная защита может быть обеспечена схемой «плавного пуска», которая обеспечивает управляемое повышение внутренних напряжений питания постоянного тока внутри компонента.

Читайте также:  Производители сетевого оборудования доклад

Типичная последовательность подключения оперативно заменяемого компонента к слоту может быть следующей:

  1. Длинные штыри заземления контактируют; становится доступной базовая электробезопасность и защита от электростатического разряда.
  2. Длинные (или средние) контакты предварительного заряда контактируют; развязывающие конденсаторы начинают заряжаться.
  3. Задержка в реальном времени в десятки миллисекунд.
  4. Короткие контакты питания / сигнала замыкаются.
  5. Разъем становится полностью вставленным; сигнал сброса при включении питания заявлен в компоненте
  6. Схема плавного пуска начинает подавать питание на компонент.
  7. Задержка в реальном времени в десятки миллисекунд.
  8. Схема плавного пуска завершает последовательность; цепь сброса по включению отключена
  9. Компонент начинает нормальную работу.

Силовые схемы с горячей заменой теперь можно приобрести на коммерческой основе в специально разработанных ASIC, называемых диспетчерами питания с горячей заменой (HSPM).

Радиопередатчики

Современные радиопередатчики (а также некоторые телевизионные передатчики ) используют мощные радиочастотные транзисторные силовые модули вместо электронных ламп . Замена силовых модулей в горячем режиме не является новой технологией, так как многие радиопередатчики, изготовленные в 1930-х годах, могли заменять силовые лампы во время работы передатчика, но эта функция не получила всеобщего применения из-за внедрения более надежных мощных устройств. трубки.

В середине 1990-х годов несколько производителей радиопередатчиков в США начали предлагать сменные высокомощные транзисторные модули RF.

  • В то время не существовало отраслевого стандарта для конструкции сменных силовых модулей.
  • Ранние конструкции модулей имели лишь ограниченную патентную защиту.
  • К началу 2000-х годов было доступно множество моделей передатчиков, в которых использовались различные типы силовых модулей.

Повторное внедрение силовых модулей пошло на пользу индустрии радиопередатчиков, поскольку способствовало развитию инноваций. Модульные передатчики оказались более надежными, чем трубчатые передатчики, если передатчик правильно выбран для условий на передающей площадке.

  • Модульный передатчик с наименьшей мощностью: обычно 1,0 кВт при использовании модулей мощностью 600 Вт.
  • Модульный передатчик наивысшей мощности: 1,0 МВт (для ДВ , МВт ).
  • Модульный передатчик максимальной мощности: 45 кВт (FM, TV).

Сигнальная электроника

Схема, прикрепленная к сигнальным контактам в компоненте с горячей заменой, должна включать некоторую защиту от электростатического разряда (ESD). Обычно это делается в виде ограничивающих диодов на землю и на напряжение источника постоянного тока. Эффекты электростатического разряда можно уменьшить за счет тщательного проектирования механического корпуса вокруг заменяемого в горячем режиме компонента, возможно, путем покрытия его тонкой пленкой из проводящего материала.

Особое внимание следует уделять проектированию систем с шинными сигналами, которые подключены к более чем одному компоненту с возможностью горячей замены. Когда вставляется оперативно заменяемый компонент, его входные и выходные сигнальные контакты будут представлять собой временное короткое замыкание на землю. Это может вызвать нежелательные импульсы на уровне земли в сигналах, которые могут нарушить работу других оперативно заменяемых компонентов системы. Это было проблемой для ранних параллельных SCSI -дисководов. Одним из распространенных конструктивных решений является защита подключенных к шине сигнальных контактов последовательными диодами или резисторами. Буферные устройства CMOS теперь доступны со специализированными входами и выходами, которые сводят к минимуму искажения передаваемых сигналов во время операции горячей замены. Если ничего не помогает , другое решение — приостановить работу всех компонентов во время операции горячей замены.

Хотя большинство современных систем видеоигр могут обмениваться играми и мультимедиа (например, Blu-ray ) без отключения питания системы, старые поколения систем различались по поддержке возможностей горячей замены. Например, в то время как Sony PlayStation и PlayStation 2 могут извлечь игровой диск при включенной системе, Nintendo Game Boy Advance и Nintendo 64 зависнут и потенциально могут выйти из строя, если игровой картридж будет извлечен при включенном питании. Производители специально предостерегают от подобных действий в руководстве пользователя или на игровом картридже. Предположительно по этой причине Stop ‘N’ Swop был исключен из серии Banjo-Kazooie . В системе Sega Genesis / Mega Drive иногда можно было применить читы (например, игрок, имеющий бесконечные жизни) и другие временные изменения программного обеспечения в играх путем горячей замены картриджей, даже если картриджи не были предназначены для горячей замены.

Программное обеспечение

Горячая замена может также относиться к возможности изменять выполняющийся код программы без необходимости прерывать ее выполнение. Интерактивное программирование — это парадигма программирования, в которой широко используется горячая замена, поэтому процесс программирования становится частью самого потока программы.

Только несколько языков программирования поддерживают горячую замену изначально, включая Pike , Lisp , Erlang , Smalltalk , Visual Basic 6 (не VB.net), Java и совсем недавно — Elm и Elixir . Microsoft Visual Studio поддерживает своего рода горячую замену под названием «Изменить и продолжить», которая поддерживается C # , VB.NET и C / C ++ при работе в отладчике.

Горячая замена — это центральный метод живого кодирования , где программирование является неотъемлемой частью процесса выполнения. В общем, все языки программирования , используемые в прямом эфире кодирования, такие как SuperCollider , TidalCycles или экспромтом поддержка горячей замены.

Некоторые веб-фреймворки, такие как Django , поддерживают обнаружение изменений модуля и их перезагрузку на лету. Однако, хотя это то же самое, что и горячая замена для большинства намерений и целей, технически это просто очистка кеша , запускаемая новым файлом. Это не относится к языкам разметки и программирования, таким как HTML и PHP соответственно, в общем случае, так как эти файлы обычно повторно интерпретируются при каждом использовании по умолчанию. Однако есть несколько CMS и других фреймворков на основе PHP (таких как Drupal ), которые используют кеширование. В этих случаях применяются аналогичные возможности и исключения.

Горячая замена также облегчает разработку систем, в которых обрабатываются большие объемы данных, например, целые геномы в алгоритмах биоинформатики.

Товарные знаки

Термин «HOT PLUG» был зарегистрирован в качестве товарного знака в США в ноябре 1992 г. на компанию Core International, Inc. и аннулирован в мае 1999 г.

Источник

Выгорание HDMI интерфейса из-за подключения на горячую

Частенько приходится объяснять клиентам, что устройства с HDMI интерфейсом не следует подключать на «горячую». Кому-то удается объяснить это при продаже или установке такого оборудования, а тем, кому повезло меньше, только после его поломки.

Сегодня хочу вам рассказать о тонкостях подключения HDMI оборудования.

Терминология

Термин «Горячее подключение» (англ. HotPlug) — означает коммутацию ( отключение или подключение) электронного оборудования во время его работы без отключения электропитания .

Применительно к компьютерам существует схожий термин «Горячая замена» , означающий отключение/подключение/замену компонентов системы, опять-таки, без предварительного обесточивания.

Подключать оборудование и компоненты «на горячую» крайне не рекомендуется, а говоря о HDMI оборудовании и вовсе строго воспрещается!

Интерфейсы устройств, поврежденные при «горячем подключении», называют сожженными или сгоревшими , а их внутренние компоненты – пробитыми или горелыми .

Обратный термин — « Холодное подключение» (Холодная замена) , то есть все (пере) подключения производятся после отключения питания устройств и снятия напряжения (остаточного потенциала).

Несмотря на то, что многие пользователи не утруждают себя отключением устройств из розетки при коммутации, тем не менее, общепринятая практика и предписания правил безопасности рекомендуют осуществлять любую коммутацию именно «на холодную»! Возможно, кто-то захочет возразить и укажет на спецификации ряда интерфейсов или инструкции к некоторым устройствам, где черным по белому говорится о возможности «горячего подключения». Однако, применительно к HDMI оборудованию это может очень плохо закончиться…

Читайте также:  Ленточное оборудование для резки металла

Причины выгорания HDMI интерфейсов

К сожалению, HDMI интерфейс крайне чувствителен к всевозможным электрическим разрядам и при «горячем подключении», с высокой долей вероятности, можно сжечь HDMI порт или чип телевизора, монитора, видеокарты или любого другого HDMI устройства.

Из-за чего же может сгореть устройство с HDMI интерфейсом при подключении «на горячую»?

Дело в том, что электрические разряды постоянно накапливаются на одежде и человеческом теле (статическое электричество). Эти разряды при подключении одного устройства к другому попадают в разъёмы, и являются причиной повреждения оборудования. Второй причиной повреждения HDMI при подключении «на горячую» является наличие на корпусах устройств достаточно высоких потенциалов (порядка 100 вольт). В момент соединения устройств происходит выравнивание потенциалов (разряд) в следствии чего и происходит повреждение оборудования.

К несчастью, данная проблема известна с самого начала появления HDMI интерфейса и является следствием оптимизированной схемотехники и общей дешевизны комплектующих. И, что не мало огорчает, все эти недостатки будут свойственны и новым версиям интерфейса.

Абсолютно все устройства с HDMI интерфейсом абсолютно всех производителей подвержены этой проблеме. К сожалению, ни громкое имя бренда, ни высокая стоимость устройства не гарантируют 100% безопасности в этом вопросе. Поэтому, если не хотите распрощаться с девайсом или кругленькой суммой денег, соблюдать правила подключения следует беспрекословно!

Примеры поврежденных HDMI устройств

При попадании разряда в устройство может быть поврежден как сам HDMI порт, так и другие элементы: чипы, конденсаторы, микросхемы.

Пытаясь самостоятельно разобраться в причинах поломки и вскрыв «погибшее» устройство, визуально вы можете и не заменить повреждения «железа». Но порой, с диагнозом не поспоришь…

Причем, зачастую выгорает главный управляющий чип или сразу несколько, что делает ремонт оборудования нецелесообразным (в виду его дороговизны) или даже невозможным.

Надеюсь, что вы не столкнетесь с подобными неприятностями.

А что же защита, спросите вы?! Естественно, разработчики ставят защиту HDMI интерфейсов, но, к сожалению, спасает она лишь от легкой «статики». От более серьезных разрядов, которые присутствуют повсеместно, к сожалению, защиты не делают. Повторюсь, даже техника топовых брендов страдает от «горячего подключения» по HDMI.

Правила подключения HDMI оборудования

Как следует напугав читателя мы подошли к главной части нашей статьи: Как же обезопасить оборудование с HDMI интерфейсами?

Существуют общие правила правильного подключения электронных устройств:

  • Обесточить все подключаемое оборудование. Причем, не просто отключить кнопкой на пульте или тумблером на задней панели, а именно выключить из розетки!
  • Скоммутировать оборудование при помощи кабелей. Это касается как HDMI кабелей, так и других, например, аудио-, Ethernet- и прочих кабелей.
  • После этого включить все устройства системы в розетку.
  • Только после это можно пользоваться оборудованием.

Имейте ввиду, что при необходимости переподключить какой-то из элементов системы или добавить в нее новое оборудование, всю последовательность действий следует повторить.

Казалось бы, ничего сложного. Вся процедура лишь на пару-тройку минут продлит процесс подключения, но если бы вы знали, как часто пресловутая человеческая лень и надежда на «авось» заставляют людей пренебрегать этими простыми правилами, и тратить кучу нервов, времени и денег.

Защита HDMI интерфейсов

Но бывают случаи, когда коммутировать оборудование «на холодную» нет совсем никакой возможности. Например, когда речь идет об HDMI удлинителях и между устройствами на расстояние в несколько десятков или даже сотен метров; когда в крупном магазине подключено сразу несколько десятков телевизоров, работающих во всем торговом зале, а менеджеру нужно срочно продемонстрировать покупателю работоспособность какого-то товара; когда в спорт баре идет прямой эфир; когда HDMI оборудование используется для видео-трансляции и прочих, чаще всего не бытовых случаях. В этом случае рекомендуется использовать специальные устройства защиты HDMI интерфейсов.

Эти пассивные элементы (предохранители) используются для защиты устройств с HDMI интерфейсами от электростатических разрядов, разности потенциалов при подключении оборудования «на горячую», а также грозовых наводок. Они активны на всех каналах TMDS и будут выступать в качестве конечной защиты ESD. В момент когда разряд пойдет по кабелю этот «малыш» возьмет весь удар на себя.

В принципе, если вас не пугают лишние расходы, такие предохранители можно использовать и в быту. Ставить их нужно на каждое HDMI соединение с одной стороны.

Источник

Правила оказания услуги «Горячая замена»

Дилеры компании NETLAB могут воспользоваться услугой платного гарантийного сервиса и получить возможность заменить неисправное оборудование непосредственно в день обращения в сервисный центр. Во всех остальных вопросах, не оговоренных в настоящих Правилах, действуют общие Правила гарантийного обслуживания и условия предоставления гарантии

    Общие положения.

Данная услуга распространяется на оборудование, приобретенное в компании NETLAB:

  • гарантийное обслуживание которых производится в сервисном центре Компании, а не в специализированных сервисных центрах производителей.
  • ценой не более 1000 у.е.
  • не распространяется на оборудования 3 Сом, Cisco, Компьютеры NL и NORBEL

Гарантийное обслуживание осуществляется в течение всего гарантийного срока, указанного в накладной. Изменение Компанией гарантийных сроков не распространяется на ранее приобретенное оборудование. Документами, подтверждающими гарантийный статус оборудования, служат стикер, гарантийный талон или накладная в зависимости от того, каким образом оформляется гарантия при отпуске со склада.

Порядок приема.

Прием оборудования осуществляется согласно действующим общим Правилам гарантийного обслуживания Компании. При наличии оснований для снятия оборудования с гарантии или наличия неисправностей, не являющихся гарантийными, Дилеру может быть в общем порядке отказано приемке и замене неисправного оборудования.

Сроки и порядок обмена.

При наличии полной комплектности принимаемого неисправного оборудования замена производится незамедлительно (в этот же рабочий день). При неполной комплектации оборудования, принимаемого только в комплекте, замена производится в день представления полного комплекта.

В отдельных случаях, если при приемке оборудования невозможно оперативно подтвердить заявленный дефект или имеются сомнения в том, что неисправность является гарантийной (изделие имеет следы механического воздействия, пайки, воздействия жидкостей), либо оборудование не может быть однозначно идентифицировано как товар, приобретенный в Компании, оно принимается сервисным центром условно, для проведения дополнительной проверки. Срок принятия решения в этом случае не может превышать 20 рабочих дней.

Обмен изделия осуществляется одним из следующих способов (на выбор сервисного центра):

  • Из обменного фонда сервисного центра Компании
  • Новым оборудованием

Возврат денежных средств на баланс клиента осуществляется только в случае отсутствия оборудования на замену на складах компании. Денежные средства зачисляются на баланс покупателя в размере стоимости оборудования по Price-листу Компании на момент обращения, однако сумма возврата не может превышать сумму, фактически уплаченную покупателем.

Стоимость и порядок оплаты услуги.

Услуга предоставляется на календарный квартал дилерам категорий B,C,D,E,F при условии извещения Компании о подписке на эту услугу в письменном виде Cкачать бланк (формат .xls). Заявка может быть оформлена в любой день квартала, на который подписывается дилер. Если до 10 числа последнего месяца квартала, на который была оформлена подписка на услугу, Дилер в письменном виде не отказался от услуги платного гарантийного обслуживания, она автоматически пролонгируется на следующий квартал. При невыполнении Дилером по итогам квартала требований категории в следующем квартале услуга ему не предоставляется.

Читайте также:  Нормы площади под оборудование

Услуга распространяется на все указанное в п.1 настоящих Правил оборудование, приобретенное дилером в течение квартала, на который он оформил заявку. Плата за оказание услуги взимается за полный квартал независимо от времени поступления заявки и количества фактических обращений дилера в сервисный центр. Стоимость услуг рассчитывается в зависимости от дилерской категории и списывается с баланса дилера 1 числа первого месяца квартала (или на следующий день после поступления заявки).

Категория B C D E F
Сумма в месяц (USD) 7 25 65 150 220

Вышлите его по e-mail ведущему менеджеру или по факсу +7 (495) 784-64-90 (доб.245)

Источник

Надёжность и долговечность серверного оборудования

Решил написать эту статью после знакомства с публикацией «HP, Dell и IBM: компоненты, отвечающие за надёжность сервера», поскольку имею другое мнение насчёт некоторых моментов. Эта статья не претендует на инновационные подходы, а просто описывает полученный опыт и, надеюсь, предотвратит банальные ошибки.

Итак, начнём с того, что попробуем выяснить, зачем бесперебойность и беспрерывность серверам? Собственно, серверам бесперебойность не обязательна, но она нужна сервисам, которые предоставляют эти сервера. Наилучшая беспрерывность обеспечивается только распределёнными системами, которые могут функционировать независимо друг от друга с автоматическим переключением между ними (для скорости) и разнесённые географически (катастрофоустойчивость). Но это выдвигает особые (не всегда реализуемые) требования к программному обеспечению. Недостатками таких решений являются повышеная стоимость, проблемы с репликацией данных, передача состояния для бесшовного переключения на резервную систему. Дополнительными плюсами является то, что при правильной реализации системы, возможно повышение быстродействия — клиенты делятся между двумя или более локациями, а при сбое перераспределяются.

Но есть задачи, настолько критичные и специфические, что требуют особой бесперебойности серверов, для них делают особые сервера, например менфреймы, с возможностью горячей замены всех компонентов, включая процессоры, память и даже материнские платы. Но такие решения стоят гораздо дороже обычных серверов и те кто их покупает — понимаю зачем это надо.

Вернёмся к серверам начального и среднего уровней. Существенно повышает беспрерывность работы серверов возможность горячей замены компонентов.

Горячая замена блоков питания

В моей практике, сгоревших БП (блоков питания) было немного, но наличие в сервере hot-swap БП, подключённых по схеме N+N во многих случаях существенно увеличивает бесперебойность работы сервера. Если в сервере больше двух БП, то зачастую реализована схема N+1, что не позволяет питать сервер от двух независимых источников или линий питания. Электропитание с подачей в стойку двух независимых линий повышает бесперебойность в самых различных ситуациях, например при обслуживании или аварии систем энергообеспечения в датацентре. Был случай, в сервере вышел из строя БП и создал короткое замыкание, что привело к срабатыванию защиты PDU и его отключению, соседние сервера с БП по схеме 1+1, подключённые также к другому PDU продолжили работу. Резервирование БП позволяет изменять подключение сервера к сети энергообеспечения, не прерывая его работу, например, оптимизировать укладку кабелей (конечно, правильно укладывать кабеля надо при установке сервера, но мы живём в не идеальном мире).

Вопреки заблуждению сертификация 80 Plus указывает на энергоеффективность блока питания, и не обязывает производителя к обеспечению какого либо уровня надёжности.

Также резервирование БП предотвращает большинство проблем связанных с кабелями питания. Плохой контакт некачественных кабелей, случайное их выдергивание персоналом при работах. Если у вас сервер с одним блоком питания, использование для него качественного и неизношенного кабеля, который плотно устанавливается в гнездо, и при нагрузке не издаёт посторонних звуков (потрескивание) более важно — невозможна замена без остановки сервера. В случае сервера с резервированными БП, плохой контакт кабеля может привести к выходу блока питания из строя.

Горячая замена дисков

Горячую замену дисков можно производить практически со всеми вариантами интерфейсов. Конечно, есть и некоторые ограничения.

IDE устройства редко переносят отключение/подключение второго устройства на шлейф — велик риск пропадания работающего устройства из системы. Главная проблема интерфейса IDE в правильной обработке операционной системой этого события. Так как интерфейс IDE не предусматривает горячей замены, в большинстве случаев необходимо вручную запустить сканирование устройств для определения нового оборудования. Важный момент — интерфейс подключается/отключается к обесточенному диску (подключение: сначала интерфейс, потом питание, отключение: сначала питание, потом интерфейс).

ОТКАЗ ОТ ОБЯЗАТЕЛЬСТВ: выполняя отключение/подключение устройств IDE Вы делаете это на свой страх и риск — никто не гарантирует сохранение работоспособности оборудования, и стабильность работы ОС.

Интерфейсы FC, SAS, SATA (AHCI) — поддерживают горячую замену дисков в полном объеме, проблемы могут быть в операционной системе. Если дисковый контроллер SATA находится в режиме совместимости IDE — то, возможно, понадобится вручную запустить сканирование шины. В режиме AHCI в большинстве случаев диск определится автоматически. Рекомендую использовать AHCI, если ваша ОС это позволяет, т.к. этот режим также повышает производительнось диска; TRIM поддерживается только в этом режиме работы контроллера.

При отключении дисков для продления срока их службы рекомендую предварительно отключать их программным методом и извлекать после остановки шпинделя, т.е. через примерно 30 секунд после выключения для дисков 7200RPM. Если диск невозможно отключить программно и он установлен в hot-swap корзинке, рекомендую вытащить диск на минимальное расстояние, при котором диск будет отключен, подождать остановки шпинделя и извлечь окончательно. В большинстве систем — это расстояние полностью отведённой ручки корзинки. Конечно, эти действия не несут практического смысла, если диск вышел из строя, но, возможно, он просто «завис» и вам не поменяют его по гарантии и придется использовать в некритичном оборудовании.

Так же важно понимать, что диск находится в составе RAID или как отдельное блочное устройство. При использовании отдельного диска необходимо предварительно его отмонтировать для избежания сбоев в работе ОС и программного обеспечения. Даже если диск не используется в текущий момент, после извлечения примонтированого диска зачастую наблюдаются лаги всей ОС. Конечно же, диск, на котором установлена ОС, извлечь без «зависания» не получится.

Большинство серверов позволяет подсветить индикатором диск по команде с сервера, по возможности пользуйтесь этой функцией, для минимизации ошибочных извлечений дисков. Например на серверах SuperMicro номер корзинки указан на самой корзинке, и может не совпадать с номером слота на бэкплейне. Такая-же проблема есть у многих производителей.
Так же перед отключением желательно получить информацию о диске (модель, объем, серийный номер) для сопоставления сразу после извлечения диска. Во многих случаях при ошибочном извлечении другого диска это позволит устранить ошибку сразу, а иногда даже предотвратить сбой в работе или потерю данных.

В случае использования RAID-массивов, рекомендую отключать диски программно (помечать как сбойные), перед извлечением это устранит снижение производительности дисковой системы сразу после отключения диска.

Проблем с SSD дисками при частом горячем подключении/извлечении не заметил, хотя использовал несколько именно в таком режиме.

На этом первая часть заканчивается, в следующей частях про RAID массивы, память для серверов, системы удалённого управления и про важность мониторинга.

Источник