2010/08/23 11:22:14
ЦОД Как снизить риск человеческого фактора в работе центра обработки данных
По данным еженедельника ComputerWorld, одной из главных причин сбоев, возникающих в работе центров обработки данных, является человеческий фактор. Согласно результатам специального исследования, проведенного этим еженедельником, 70 % проблем современных дата центров обусловлены как раз человеческим фактором.
Каталог TAdviser Дата-центров России и технологий для дата центров.
Можно ли снизить вероятность простоев в работе оборудования, возникающих по вине сотрудников? Специалисты по работе с персоналом пришли к выводу, что это можно сделать, если придерживаться следующих, разработанных ими правил.
- Защита кнопок аварийного отключения питания. В датацентрах кнопка аварийного отключения питания обычно находится возле входа в помещение. Чаще всего эти кнопки открыты и не имеют точной маркировки, зачастую их можно нажать по ошибке и тем самым отключить весь дата-центр от электроснабжения. Маркировка и ограничение доступа к этим кнопкам может предотвратить их случайное нажатие.
- Письменные инструкции. Подробные письменные инструкции снижают или устраняют риски, связанные с выполнением технического обслуживания. Желательно организовать процесс техобслуживания так, чтобы сотрудники могли заменять друг друга в случае не выхода на работу кого-то из них. Хорошо проработанные инструкции помогут также при приеме новых сотрудников.
- Правильная маркировка компонентов. Для правильной и безопасной эксплуатации энергетической системы все коммутирующие устройства должны иметь соответствующую маркировку. Наличие инструкций и правильной маркировки обеспечивает двойной контроль работы центра обработки данных.
- Последовательный технологический режим. Иногда администраторы data центров теряют бдительность и при выполнении определенных процедур действуют не в соответствии с инструкцией. Например, они забывают или пропускают отдельные шаги, или же выполняют всю процедуру по памяти и случайно отключают не то оборудование. Поэтому при выполнении какой-либо процедуры, весь персонал должен строго соблюдать разработанный технологический режим. Для этого можно распечатать и повесить на стену инструкции или описание отдельных действий.
- Текущее обучение персонала. Обеспечивайте всех лиц, имеющих доступ в дата-центр, в том числе ИТ-специалистов, сотрудников службы безопасности и обслуживающий персонал, основными сведениями об оборудовании в целях предотвращения его ошибочного отключения.
- Правила безопасного доступа. Правила доступа, предусматривающие сопровождение всех посетителей, например, поставщиков, позволяют администраторам дата-центров быть в курсе всех посещений.
- Введение правил употребления пищевых продуктов и напитков. Жидкости представляют наибольшую опасность, так как их попадание на компьютерное оборудование может спровоцировать его поломку и даже короткое замыкание. Наилучшим способом оповещения о требованиях к пищевым продуктам и напиткам является размещение объявления возле дверей дата-центра с указанием сути и строгости этих требований.
- Предотвращение попадания загрязняющих веществ. Попадание пыли внутрь серверов и другого компьютерного оборудования крайне нежелательно, так как тоже может нарушить их работу. В основном эту проблему можно решить, требуя от сотрудников носить антистатическую обувь или положив специальный коврик перед входом в Центр обработки данных ЦОД. Упаковку и распаковку оборудования также необходимо производить за пределами центра обработки данных. Попадание волокон упаковочного материала также может вызвать нежелательные сбои в работе центра.
Следование этим простым правилам значительно снижает возможность остановки работы дата центра по вине работающих в нем сотрудников.