Сдам Сам

ПОЛЕЗНОЕ


КАТЕГОРИИ







Общие подходы к повышению надежности систем





 

Существует два подхода к повышению надежности: уменьшение количества сбоев или, что еще лучше, ускоренная реанимация системы.

Для операторов спутниковых приемных станций пятикратное уменьшение времени перезагрузки оказалось более предпочтительным, нежели увеличение во столько же раз времени между сбоями, хотя и то и другое определяло одинаковый уровень надежности.

На сегодня наиболее распространенный способ исправления сбоев - перезагрузка всей системы, требующая от 10 с (если перезагружается только одно приложение) до 1 мин. (если перезагружается весь комплекс). По результатам исследований, микроперезагрузка только необходимых компонентов занимает меньше секунды. Пользователь не видит сообщение об ошибке, а замечает лишь несколько секундную задержку.

Обеспечение надежности.

Требования к надежности определяются назначением вычислительной системы и задаются, как правило, минимальным, допустимым: коэффициентом готовности, характеризующим долю времени, втечение которого система сохраняет работоспособность. В общем случае коэффициент готовности,где T – средняя наработка на отказ и Тв – среднее время восстановления. Для систем повышенной надежности, которые должны функционировать непрерывно, требование к надёжности может характеризоваться предельным допустимым числом часов простоя системы в заданный период времени, например 2 часа за 10лет работы. В тех случаях, когда некоторые группы отказов приводят к прекращению обслуживания отдельных пользователей при сохранении работоспособности остальных, требования к надежности задаются раздельно для подсистем вычислительной системы, обслуживающих часть рабочей нагрузки, и для ядра системы.

Надежность можно увеличить за счет использования высоконадежных элементов, облегчения режима работы элементов и совершенствования технологии изготовления и сборки системы.

Другой подход к повышению надежности – обеспечение отказоустойчивости системы за счет резервирования. Резервировать можно технические средства на уровне логических элементов, устройств и ЭВМ или программные средства путем повторной реализации функций на основе одного и того же или разных алгоритмов и создания дополнительных программ для выявления и исправления ошибок. При резервировании технических средств в систему вводится аппаратурный резерв, при резервировании программных средств – временной резерв. Резервирование технических средств может выполняться различными способами – статическим, динамическим и гибридным. При статическом резервировании отказы блокируются автоматически, без изменения структуры и режима функционирования системы. Наиболее распространено тройное статическое резервирование – с использованием схемы голосования (мажоритарной латки), которая формирует результат, соответствующий совпадающим результатам двух из трех модулей, вследствие чего отказ одного модуля не нарушает работоспособность системы. При динамическом резервировании модули оснащаются средствами, контролирующими их работоспособность, и при обнаружении отказа производится реконфигурация системы для подключения резервного модуля или перераспределения функций между исправными модулями системы. Гибридное резервирование основано на совместном использовании принципов статического и динамического резервирования.

Значительные трудности возникают при разделении требований к надежности между частями системы – ее подсистемами и устройствами. Чтобы обеспечить заданную надежность при минимальных затратах, необходимо установить соотношение между надежностью и затратами на ее обеспечение, для каждого типа устройств и подсистем.

 

Для вычислительных систем характерны сбои в работе, вызванные электромагнитными помехами, пульсацией питания и другими причинами. Действие этих факторов обычно кратковременно. Для обеспечения работоспособности в условиях сбоев в систему встраиваются средства, позволяющие обнаружить ошибки и запускать процедуру восстановления (например, повторение действий). Если процедура восстановления работоспособности выполнена успешно, то причиной ошибки считается сбой и система продолжает функционировать в естественном режиме. В противном случае отказ считается катастрофическим.

В программе обеспечения надежности системы важная роль отводится повышению ремонтопригодности, позволяющей снижать затраты времени и средств на восстановление работоспособности системы. Для повышения ремонтопригодности существует множество способов, реализуемых на всех стадиях проектирования, производства и эксплуатации системы: встраивание в систему эффективных средств контроля и диагностики, унификация конструкций и рациональная их компоновка и др.

Дополнение: БОРЬБА ЗА НАДЕЖНОСТЬ

Особое внимание уделяется снижению стоимости обслуживания и поддержки вычислительных комплексов. Сегодня специалисты Hewlett Packard и IBM расширяют функциональность своих изделий и внедряют в них элементы самоуправления. Разработка глобальных сетевых систем, способных самостоятельно распределять ресурсы, настраиваться, отслеживать и исправлять неисправности без вмешательства оператора. В рамках одного из проектов HP планируется создание корпоративных информационно-вычислительных центров, включающих в себя до 50 тыс. офисных компьютеров - в 10 раз больше, чем у современных аналогов.

Специалисты IBM черпают идеи из теории управления (введение обратной связи для стабилизации системы) и используют концепцию искусственного интеллекта (накопление опыта человека-эксперта и применение его для самостоятельного устранения серьезных проблем). Комплексы, построенные по этим принципам, будут отличаться гибкостью поведения в критических ситуациях и способностью адаптироваться к изменяющимся условиям.

Когда выяснилось, что ошибки операторов неизбежны, разработчики стали проектировать системы, функционирование которых требует минимума человеческого вмешательства. Однако гипертрофированная автоматизация, как правило, только ухудшает ситуацию. Дело в том, что полностью избавиться от участия человека невозможно, так как пока удается алгоритмизировать только относительно простые процедуры.

 

RAID массивы: основные уровни и сравнительные характеристики

RAID массивы

Обеспечение надежности.

Направления:

1. Совершенствование технологий.

2. Выполнение (соблюдение) технологических дисциплин.

3. Структурные методы построения систем.

3- надежность системы достигается путем введения избыточности

Нужно устройство, обеспечивающее переключение блоков, определения неисправного. В качестве этого блока может выступать человек. Система должна продолжать работу при выходе отдельных частей. В такой системе обычно вводится не 100% избыточность, а с минимальной долей.







Живите по правилу: МАЛО ЛИ ЧТО НА СВЕТЕ СУЩЕСТВУЕТ? Я неслучайно подчеркиваю, что место в голове ограничено, а информации вокруг много, и что ваше право...

Что способствует осуществлению желаний? Стопроцентная, непоколебимая уверенность в своем...

Что вызывает тренды на фондовых и товарных рынках Объяснение теории грузового поезда Первые 17 лет моих рыночных исследований сводились к попыткам вычис­лить, когда этот...

Что делать, если нет взаимности? А теперь спустимся с небес на землю. Приземлились? Продолжаем разговор...





Не нашли то, что искали? Воспользуйтесь поиском гугл на сайте:


©2015- 2024 zdamsam.ru Размещенные материалы защищены законодательством РФ.