Войти
Юридический сайт - Spravka01
  • Власти раскрыли расходы на первое за шесть лет повышение выплат военным
  • Десктопные CRM: дегустация бесплатного сыра Общие и личные отчеты
  • Бизнес-стратегия, примеры планирования, определение вариантов, как разработать стратегию бизнеса, как она вияет на лидерство и на конкурентов, как проводить ее аудит, как воплощать планы Стратегия развития компании пример
  • Как принять правильное решение?
  • Консультация как одна из форм работы с педагогами Как правильно вести консультации психолога
  • Как сдать экзамен в техникуме и колледже: рекомендации экспертов Как сдать физику если тупой
  • Повышение надежности за счет резервирования оборудования. Холодный резерв – rpo rto Холодный резерв горячий

    Повышение надежности за счет резервирования оборудования. Холодный резерв – rpo rto Холодный резерв горячий

    Резервирование является мощным средством повышения надежности информационных систем. Существуют различные способы включения резервной аппаратуры :

    постоянное резервирование;

    резервирование замещением.

    При резервирование замещением резервные единицы замещают основные только после их отказа. Различают три режима работы при резервирование замещением:

    1) нагруженный или горячий резерв ;

    2) облегченный или теплый резерв ;

    3) ненагруженный или холодный резерв .

    Холодный резерв имеет следующие преимущества:

    Сохранение постоянных электрических режимов схемы;

    Обеспечение максимального использования резервных единиц.

    Будем считать, что надежности переключающих устройств равны. Резервные элементы находятся в тех же внешних условиях, что и основной элемент, который является рабочим. Всего в состав группы входит S элементов: 1 рабочий и S-1 – резервные. Интенсивность отказов – λ. Тогда граф переходов системы будет иметь следующий вид

    Рис.2. Граф переходов для системы с холодным резервированием

    Уравнения Колмогорова для подобных систем в общем виде выглядят таким образом:

    Здесь учтено, что для состояний, не имеющих непосредственных переходов, можно считать

    Для системы, граф которой изображен на рисунке 1, получаем следующую систему дифференциальных уравнений:

    (5)

    1. Решим данную систему уравнений, используя преобразования Лапласа. При этом будем использовать следующие соотношения:

    Получаем систему алгебраических уравнений относительно комплексной переменной

    Последовательно перемножая эти уравнения, находим вероятность отказа системы

    Используя соотношение

    переходим в область оригиналов

    (7)

    Вероятность безотказной работы резервированной системы найдется как

    С учетом соотношения

    (9)

    получаем формулу для оценки вероятности безотказной работы резервированной системы

    (10)

    Как видно из выражения (10), вероятность исправной работы не подчиняется экспоненциальному закону, поэтому нельзя среднее время исправной работы определять из выражения . В этом случае среднее время безотказной работы можно найти как

    2. Систему дифференциальных уравнений (5) можно решить численными методами. В среде MathCAD имеется возможность решения обыкновенных дифференциальных уравнений (0ДУ) и систем ОДУ. Для этой цели можно использовать метод Рунге – Кутты с постоянным шагом (процедура rkfixed ). В данной процедуре задается количество шагов N (число узлов сетки), отрезок, на котором ищется решение , вектор (или скаляр) начальных условий y и вектор правых частей системы дифференциальных уравнений f(x,y) . Вектор f(x,y) задан системой уравнений Колмогорова (5), начальные условия определяются из условий задачи (обычно вероятность нахождения системы в начальном состоянии равна единице, т.к. система в начале работы исправна, а остальные вероятности равны нулю). Отрезок соответствует времени, при котором необходимо оценить работоспособность (вероятность исправной работы) системы. Количество шагов N выбирает исследователь, исходя из требований точности решения задачи и наглядности представления результатов.

    Таким образом, обращение к заданной процедуре может иметь следующий вид:

    Более подробно анализ надежности систем с помощью численного метода рассмотрен в примере, приведенном ниже.

    3. Анализ надежности системы с холодным резервированием методами имитационного моделирования .

    При холодном резервировании система состоит из одного основного элемента и нескольких резервных. Работу такой системы можно представить как последовательное прохождение транзакта через несколько последовательных каналов обслуживания. Транзакт в этом случае представляет собой указатель работающего в данный момент времени элемента. В начале работы транзакт помещается в первый канал и задерживается там на время исправной работы первого элемента. После выхода из строя основного элемента транзакт поступает в первый резервный элемент и т.д. При возникновении неисправности в последнем резервном элементе транзакт покидает модель системы через блок TERMINATE 1 с меткой BAD.

    Начинается работа моделирующей программы вводом в систему одного транзакта в момент времени t 0 , в который необходимо оценить работоспособность системы. Транзакт, войдя в систему, последовательно захватывает и освобождает все каналы системы, отправляя транзакт из одного из каналов (если он находится хотя бы в одном из них) на блок TERMINATE 1 с меткой GOOD.

    Повторяя эту процедуру достаточно большое число раз, можно рассчитать вероятность исправной работы системы в момент t 0 . Действительно, очередной транзакт, войдя в систему, отправляет предыдущий на метку GOOD, если тот находился в одном из каналов, т.е. система была в рабочем состоянии. Отношение числа транзактов, прошедших через метку GOOD, к общему числу транзактов дает вероятность исправной работы системы через время t 0 с момента ее запуска. При проходе первого транзакта возникает погрешность за счет того, что он всегда будет идентифицировать состояние системы как неисправное. Однако при большом числе запусков программы с помощью оператора START (например 10000), эта погрешность исчезающее мала.

    Захват системы (например системы с именем sys2 ) и ее освобождение реализуется парой операторов

    preempt sys2,go,re

    return sys2

    (операнд re означает, что данный транзакт больше не будет обрабатываться системой).

    Второй способ имитационного моделирования систем с холодным резервированием основывается на использовании трех сегментов GPSS – программы.

    Первый сегмент имитирует работу системы. Блок GENERATE вводит в начальный момент общее количество транзактов - элементов резервируемой системы (работающий и резервные). Следующий оператор - SPLIT - создает копию этих транзактов, чтобы через какое- то время, достаточное для того, чтобы все введенные оператором GENERATE транзакты заведомо покинули систему, повторить процесс. Первый транзакт, прошедший оператор SPLIT, занимает канал обслуживания, задерживается в нем на время исправной работы и покидает систему через оператор TERMINATE без операнда, т е. не уменьшая счетчик числа завершений. Т.о. первый сегмент программы может иметь следующий вид:

    Описание экспоненциальной функции c именем EXP

    GENERATE ,3 система содержит 1 рабочий и 2 резервных элемента

    L1 SPLIT 1,L2

    SEIZE COMP

    ADVANCE 20,FN$EXP среднее время работы – 20 единиц времени

    RELEASE COMP

    TERMINATE

    L2 ADVANCE 500 задержка на время, достаточное для ухода трех

    TRANSFER ,L1 транзактов из системы

    Во втором сегменте производится проверка работоспособности системы через время t 0 после запуска системы в работу. Проверка проводится оператором TEST, который может иметь такой вид:

    Test E F$comp,1,L4

    Транзакт проходит через блок TEST на следующий оператор, только в том случае, если прибор с именем comp занят. В противном случае транзакт отправляется на метку L4.

    Для подсчета числа успешных проверок можно пропустить транзакт, прошедший через оператор TEST, через фиктивный прибор, который используется в качестве счетчика.

    Второй сегмент программы может выглядеть таким образом

    GENERATE ,1

    L3 ADVANCE 60 проверка производится через 60 единиц

    TEST E F$comp,1,L4 системного времени после начала работы

    SEIZE NUMBER системы

    RELEASE NUMBER

    L4 ADVANCE 440 временная задержка для синхронизации

    TRANSFER , L3 транзактов первого и второго сегментов

    Третий транзакт управляет временем моделирования.

    Для подсчета доли успешного числа проверок можно поставить метку у оператора TEST. В этом случае вероятность исправной работы найдется из отношения транзактов, прошедших через прибор NUMBER к общему числу транзактов, прошедших через указанную метку.


    Похожая информация.


    До сих по мы рассматривали только случай, когда надежность каждого дублирующего элемента не зависит от того, когда включился в работу этот элемент. Этот случай, который мы условно назвали «горячим резервированием», самый простой из всех возможных. Гораздо сложнее случай, когда резервный элемент до своего включения в работу вообще не может отказывать («холодное» резервирование) или может отказывать, но с другой, меньшей плотностью вероятности, чем после включения («облегченное» резервирование).

    При рассмотрении задач, связанных с холодным или облегченным резервированием, нам недостаточно будет вводить надежности системы и элементов для одного, заранее фиксированного, значения времени т; необходимо будет проанализировать весь случайный процесс функционирования системы.

    Рассмотрим несколько задач, относящихся к холодному и облегченному резервированию.

    Задача 1. Общий случай расчета надежности резервированной системы («облегченный» или «холодный» резерв). Система (блок) состоит из «параллельно» включенных элементов (основного и резервного). Интенсивность потока отказов первого элемента при отказе первого элемента происходит автоматическое и безотказное переключение на резервный Интенсивность потока отказов резервного элемента до его включения в работу (элемент работает в «облегченном» режиме).

    После его включения в работу, в момент отказа первого элемента, интенсивность мгновенно подскакивает (рис. 7.30) и становится равной интенсивности которую естественно предполагать зависящей не только от текущего времени но и от того срока в течение которого элемент работал в облегченном режиме:

    Требуется найти надежность системы

    Рассмотрим совокупность двух случайных величин:

    Момент отказа основного элемента,

    Момент отказа резервного элемента.

    Событие А - безотказная работа системы до момента t - состоит в том, что хотя бы одна из величин примет значение, большее, чем t (хотя бы один элемент будет работать к моменту ). Вероятность противоположного события - отказа системы до момента t - будет

    Найдем совместную плотность распределения случайных величин обозначая ее Случайные величины зависимы, и

    где - безусловная плотность распределения величины - условная плотность распределения величины (при условии, что величина приняла значение ).

    Найдем обе плотности. По формуле (3.4) § 3

    где - надежность элемента в силу формулы (3.6) равная

    Найдем условную плотность Условная интенсивность отказов резервного элемента при условии, что будет:

    При этой интенсивности найдем условную плотность распределения времени безотказной работы резервного элемента:

    Таким образом, совместная плотность распределения системы случайных величин найдена:

    Зная эту совместную плотность, можно найти вероятность отказа системы до момента

    откуда искомая надежность системы:

    При вычислении по формулам (6.5) - (6.6) необходимо иметь в виду, что выражение функции неодинаково по одну и другую сторону от прямой - биссектрисы первого координатного угла (рис. 7.31). Области интегрирования на рис. 7.31 отмечены разной штриховкой. В области I функция выражается первой из формул (6.5), в области II - второй; следовательно,

    (6.7)

    При заданном конкретном виде функций интеграл (6.7) может быть вычислен, в простейших случаях аналитически, чаще - численно.

    Заметим, что найденное нами решение задачи оценки надежности для случая «облегченного» резерва относится и к случаю «холодного» резерва - при этом так что в формуле (6.7) остается только один интеграл - второй, да и тот тоже упростится.

    Мы видим, что в случае даже одного резервного элемента, работающего в облегченном (или холодном) резерве задача оценки надежности системы довольно сложна. Если же число резервных элементов более одного, задача еще больше усложняется.

    Однако задача может быть сильно упрощена, если предположить, что потоки неисправностей, действующие на все элементы (основной и резервные), представляют собой простейшие потоки, интенсивность каждого из которых постоянна (это допущение равносильно тому, что закон надежности каждого элемента - экспоненциальный, а включение элемента в работу меняет только параметр этого закона). При таком допущении надежность системы S может быть найдена путем решения дифференциальных уравнений для вероятностей ее состояний.

    Задача 2. Система с холодным резервом и простейшими потоками отказов. Резервированная система (блок) 5 состоит из основного элемента Э, и двух резервных: При отказе элемента Э] в работу включается при отказе (рис. 7.32).

    До включения каждый из резервных элементов находится «холодном» резерве и отказать не может. Интенсивность потока отказов основного элемента интенсивность потока отказов каждого из резервных элементов, когда они работают, одинакова и равна Все потоки отказов простейшие. Требуется определить надежность системы

    Представим процесс, протекающий в системе S, как марковский случайный процесс (см. гл. 4) с непрерывным временем и с дискретными состояниями:

    Работает основной элемент

    Работает резервный элемент

    Не работает ни один элемент.

    Граф состояний системы показан на рис. 7.33. Так как восстановления элементов не происходит, все стрелки на графе ведут в одну сторону.

    Система уравнений Колмогорова для вероятностей состояний будет:

    К ним надо прибавить нормировочное условие:

    Из первого уравнения выражаем как функцию

    (начальное условие, при котором мы проинтегрировали это уравнение, ) . Подставляя (6.10) во второе уравнение, получим:

    Проинтегрируем это уравнение с начальным условием получим:

    Эту функцию подставим в третье уравнение (6.8); получим:

    Уравнение (6.13) нужно проинтегрировать тоже при начальном условии получим:

    Для нахождения функции не нужно интегрировать последнее уравнение (6.8) - ее можно найти из условия (6.9):

    Задача 3. Система с облегченным резервом и простейшими потоками отказов. Резервированная система (блок) S состоит из основного элемента и трех резервных: (рис. 7.34). Основной элемент подвергается ростейшему потоку отказов с интенсивностью каждый из резервных до своего включения подвергается потоку отказов с интенсивностью после включения резервного элемента эта интенсивность мгновенно подскакивает до значения При отказе основного элемента Э, включается в работу резервный при отказе и т. д.

    1. Нормальный режим

    Особенность энергосистемы состоит в том что процессы выработки и потребления электрической энергии происходят одновременно, тоесть невозможно накапливать выработанную электрическую энергию в заметных количествах. Поэтому для источника питания и электрических потребителей в каждый момент должен соблюдаться баланс:

    · активных мощнастей ;

    · реактивніх мощнастей ,

    где Р г, Q г – соответственно активная и реактивная мощность генераторов ИП;

    Мощность потребляемых нагрузок;

    Потери мощности в сетях;

    Мощности собственных нужд.

    В нормальном установившемся режиме все генераторы имеют синхронную частоту. Отключение частоты (𝜟f) – один из основных показателей качества электроэнергии (ПКЭ), в нормальном режиме допускается отклонение на ±0,2 Гц. При нарушении баланса активной мощности изменяется частота вращения генератора, а следовательно и частота переменного тока.

    При ƩР Г < ƩРп - частота снижается (например при резком увеличении нагрузки в связи с включением большого числа электрических нагревателей при падении температуры воздуха).

    При ƩР г > ƩР П - частота растет, при уменьшении нагрузки, ту рбины начинают разгонятся и вращаются быстрее.

    Следствием больших отклонений частоты могут являться:

    · выход из строя электрических станций;

    · понижение производительности двигателя;

    · нарушение технологического процесса;

    · брак продукции.

    А при недопустимых снижениях частоты происходит развал системы.

    При аварийных отключениях генератора или линий с трансформаторами, допускается 𝜟f = +0,5 Гц, 𝜟f = -1 Гц, общей продолжительности на год, не более 90 часов.

    Рост частоты можно ликвидировать уменьшением мощности генератора или отключением части из них, при понижении частоты:

    · мобилизация резервов;

    · использованием автоматического частотного регулирования (АЧР).

    На электростанциях должен быть «горячий» резерв мощности (когда генератор нагружают до мощности меньшей номинальной), в таком случае они быстро набирают нагрузку при внезапном нарушении баланса мощности и « холодный » резерв (ввод нового генератора). Кроме резерва мощности на электростанциях системы необходимый резерв по энергии на ТЭС должен быть обеспечен соответствующий запас топлива, а на ГЭС - запас воды.

    Если резерв электростанции исчерпан, а частота в системе не достигла номинального значения, то в действия вступают устройства АЧР, которые предназначены для быстрого восстановления, путем отключения части менее ответственных потребителей (в первую очередь отключения потребителей 3 категории надёжности).



    При полной нагрузке генераторов по активному току в системе может возникнуть дефицит реактивной мощности, если же реактивная нагрузка потребителей значительно превысит возможную, реактивную мощность генераторов (при отключении части из них), то произойдет такое понижение напряжения, при котором ток потребителей значительно увеличится, что приведет к дальнейшему снижению напряжения и т.д. Такое снижение напряжения в системе называется лавиной напряжений.

    В современных системах для предохранения от аварийного лавинного напряжения все генераторы снабжают автоматическим регулятором напряжения и быстродействию форсировки возбуждения, следовательно в системе всегда должен быть определенный резерв реактивной мощности, для этого делают компенсацию реактивной мощности.

    2. Использование генератора в режиме синхронного компенсатора

    Синхронный компенсатор – это генератор без нагрузки на валу.

    Турбогенераторы и гидрогенераторы могут работать в режиме синхронного компенсатора.

    3. Аномальные режимы:

    · перегрузка (работа с током статора и ротора больше номинального);

    · асинхронный режим;

    · несимметричный режим.

    Кратковременная перегрузка по току статора и ротора обычно бывает вызвана:

    · внешними короткими замыканиями;

    · выпадом генератора из синхронизма;

    · форсированным возбуждением.

    При этом повышается температура обмоток генератора, а при коротком замыкании возможно и механическое повреждение, поэтому допускается только кратковременная перегрузка, которая зависит от системы охлаждения.

    Асинхронный режим работы генератора возникает при:



    · потери возбуждения генератора в следствии повреждения в системи возбуждения;

    · выпадения генератора из синхронизма из-за КЗ в сети;

    · резкого сброс или наброса нагрузки.

    Несимметричные режимы работы генератора могут быть вызваны обрывами и отключениями одной фазы сети, однофазной нагрузки в виде электрической тяги и плавильных печей и др.

    Повышение надежности за счет резервирования оборудования

    Резервирование - один из самых распространенных и кардинальных способов повышения надежности и живучести вычислительных систем. Однако, за резервирование приходится расплачиваться значительным увеличением габаритов, массы и потребляемой мощности.

    Так же при этом усложняется проверка аппаратуры и ее обслуживание. Так как количество отказов увеличивается из-за увеличения количества аппаратуры. Резервирование уменьшает полезную нагрузку на аппаратуру и увеличивает ее себестоимость.

    Основным параметром резервирования является кратность резервирования. Это отношение числа резервных устройств к числу рабочих (основных) устройств. Кратность резервирования ограничена жесткими пределами в отношении массы, габаритов и потребляемой мощности БЦВС.

    Различают общее и раздельное резервирование. Резервирование БЦВМ в целом – это общее резервирование. В этом случае параллельно работают основная и резервные БЦВМ.

    При раздельном резервировании БЦВМ разбивается на отдельные подсистемы, каждая из которых или некоторые из них резервируются отдельно. При использовании раздельного резервирования можно выделить несколько уровней резервирования:

    1. Резервирование на уровни деталей

    2. Резервирование на уровне элементов

    3. Резервирование на уровне устройств.

    На данный момент наиболее распространенным раздельным резервированием является резервирование на уровне устройств (ОЗУ, процессор, жесткие диски и т.д.), так как современные БЦВМ имеют модульное построение, а резервирование на уровне модулей значительно повышает ремонтопригодность.

    В зависимости от способа включения резервного элемента или БЦВМ различают горячее и холодное резервирование.

    При горячем резервировании резервные элементы работают в одинаковых условиях с основными элементами и выполняют все их функции. При этом увеличивается потребляемая мощность и усложняется обслуживание, так как необходимо выявлять отказавшие элементы и своевременно их заменять.

    При холодном резервировании резервные элементы не работают, либо работают в облегченных условиях. В этом случае резервный элемент включается в работу только в случае выхода из строя основного элемента. Холодное резервирование потребляет меньше мощности, легче в обслуживании, и резервное элементы не расходуют свой ресурс. Однако, при холодном резервировании необходимо использовать специальные переключатели, позволяющие резервному элементу вступить в работу. Включение резервных элементов может происходить, как вручную, так и автоматически.

    Холодное резервирование используется только на уровне крупных элементов или целых БЦВМ с применением различных методов обнаружения неисправностей.

    Горячее резервирование может применяться и на более глубоких уровнях с использованием избыточности на основе мажоритарной логикой.

    В реальной аппаратуре холодное и горячее резервирование обычно применятся в различных сочетаниях.

    Рассмотрим различные способы резервирования:

    1. Резервирование на основе мажоритарной логики.

    Этот тип резервирования используется при горячем резерве элементов или целых БЦВМ. Выходные сигналы с основного и всех резервных элементов преобразуются в один сигнал на мажоритарном элементе. При этом сравниваются все сигналы, и правильным считается тот, который совпал большее число раз (2 из 3, 3 из 5 и так далее).

    Достоинства мажоритарной логики резервирования:

    2. Не требуется обнаружение неисправного элемента и переключение на резервный.

    3. Подавляются все сбои.

    Недостатки:

    1. Существенно увеличивается объем, масса и потребляемая мощность оборудования.

    2. Снижается быстродействие, так как мажоритарные элементы включаются последовательно с основными элементами вычислительной системы.

    3. Отсутствует индикация отказавших устройств, что уменьшает ремонтопригодность.

    4. Система отказывает, когда еще есть исправные элементы, так как мажоритарный элемент не может принять верные решения, если отказавших элементов больше, чем исправных.

    При таком виде резервирования после каждого резервируемого элемента стоит детектор ошибок, фиксирующий несовпадение результатов работы основного и резервного элемента. В случае обнаружение несовпадения запускается диагностическая программа, определяющая, какой именно блок отказал, и исключающая его из работы до устранения ошибки.

    Схематично подобная схема включения выглядит следующим образом:

    Здесь Ао и Ар составляют первый блок вычислительной системы, причем Ао – основной элемент, а Ар – резервный. Оба этих элемента, за исключением случая, когда один из них неисправен, имеют одинаковые выходы.

    Во и Вр – составляют второй блок. Выходы этих элементов так же идентичны.

    Сигналы с основных и резервных элементов объединяются с помощью логического элемента «или» для того, чтобы при исключении из работы неисправного элемента сигнал все равно поступал в оба канала.

    Аналогично можно применять резервирование на три, четыре и так далее элементов. При этом увеличивается вероятность безотказной работы, однако, значительно повышается потребляемая мощность, габариты, вес, усложняется структура вычислительной системы и программирование для нее.

    Преимущества резервирования дублированием с детектором отказов:

    1. Значительно увеличивается вероятность безотказной работы вычислительной системы.

    2. Меньше резервных элементов, чем при использовании мажоритарной логики резервирования.

    3. Повышается ремонтопригодность, так как точно известно, какой элемент отказал

    4. Детектор ошибок не влияет на информационные потоки и не снижает быстродействие вычислительной системы, так как подключается параллельно, относительно проверяемых устройств.

    Недостатки:

    1. В случае обнаружения ошибки необходимо прервать работу основного программного обеспечения для обнаружения неисправного элемента и исключения его из работы.

    2. Усложняется программное обеспечение, так как требуется специальная программа обнаружения неисправных элементов.

    3. Система не может обнаружить ошибку при отказе одновременно основного и резервного элемента.

    3. Резервирование на основе постепенной деградации вычислительной системы.

    В этом случае, если все элементы вычислительной системы исправны, они функционируют в полном объеме, и каждый элемент выполняет свою функцию. Однако, стоит выйти из строя хотя бы одному элементу, сразу же запускается диагностическая программа, определяющая, какой именно элемент вышел из строя, и исключающая его из работы. При этом функции, которые исполнял вышедший из строя элемент, перераспределяются между рабочими элементами с сохранением всех функциональных возможностей, за счет уменьшения объема обрабатываемой информации или с уменьшением функциональности при сохранении объема обрабатываемой информации.

    Так как бортовые вычислительные системы рассчитаны на максимальную загрузку, которая происходит достаточно редко, подобный способ резервирования значительно повышает надежность, без серьезных затрат.

    Достоинства:

    1. Повышается живучесть вычислительной системы.

    2. Не увеличиваются габариты, масса и потребляемая мощность.

    3. Повышается ремонтопригодность, так как точно известно, какой элемент отказал.

    4. Не требуются специализированные элементы, анализирующие сигналы элементов, а, следовательно, всю вычислительную систему можно разрабатывать на стандартизированном оборудовании.

    Недостатки:

    1. Усложняется программное обеспечение, так как необходимо реализовывать алгоритмы, отслеживающие исправность элементов вычислительной системы и перераспределяющие задачи после выхода из строя одного или нескольких элементов

    2. При выходе из строя элементов вычислительной системы снижается объем обрабатываемой информации или функциональность.

    3. Резервирование возможно только на уровне процессорных модулей и ЭВМ.

    4. Обслуживание становится дороже, так как заменять надо целые блики и ЭВМ.

    Это основные способы резервирования с помощью оборудования. Обычно, в реальной аппаратуре они применяются в различных комбинациях, в зависимости от требуемого результата, степени необходимой надежности и живучести отдельных элементов вычислительной системы и всего комплекса в целом.


    При вариантах «холодного» резервирования резервное оборудование находится в выключенном состоянии и включается только при подключении резерва в работу. До включения резервного оборудования его ресурс не расходуется, и «холодное» резервирование дает самую большую ВБР.

    Недостаток холодного резервирования – включение резервной аппаратуры проходит за некоторое время, в течение которого система не управляется или неработоспособна. На этом интервале ввода в строй «холодной» резервной аппаратуры источники питания выходят на режим, аппаратура тестируется, прогревается. В нее загружается необходимая информация.

    В случае «горячего» резервирования все резервные элементы ЦВМ включены и готовы сразу после команды включиться в работу. Это может обеспечить меньшее время переключения на резерв. Однако ресурс включенной резервной «горячей» аппаратуры расходуется и достижимая ВБР в этом методе меньше, чем в случае «холодного» резервирования. Время переключения на резерв – важный параметр, и допустимые его значения определяются конкретной прикладной задачей.

    Для системы дублированной замещением с холодным резервом ВБР равна:

    Данное приближение справедливо для ВБР . Использование дублирования с холодным замещением в нашем примере ЦВМ из 100 БИС с

    на каждую ВБР за один год непрерывной работы будет равна

    Рдуб.х = 1 – 0,01 = 0,99. Вместо 0.9 для нерезервированной системы.

    Таким образом, простое дублирование ЦВМ приводит значение её ВБР в желаемые рамки.

    Для системы троированной замещением с холодным резервом ВБР равна:

    Ртр.х.= 0,995

    Для системы дублированной замещением с горячим резервом ВБР равна:

    И для нашего примера ЦВМ будет иметь значение ВБР

    Рдб.г.= 0,99

    Для системы троированной замещением с горячим резервом ВБР равна:

    На графике приведены изменения Р(t) для трех случаев:

    1) нерезервированная система

    2) система дублированная с холодным резервом

    3) система дублированная с горячим резервом

    Горячее резервирование троированием с восстанавливающими органами (с мажоритарными элементами).

    Этот метод реализует горячее резервирование с восстановлением информации на мажоритарных элементах с голосованием по большинству.

    Мажоритарный элемент – логическое устройство, работающее по большинству. Если у него на входе 011,110,101,111 ,то на выходе у него1. Если у него на входе 001,010,100,000, то на выходе у него 0.

    Мажоритарный элемент (МЭ) одновременно решает задачи обнаружения отказа — выход одного из элементов отличается от двух других и подключения резервного. В случае последовательно соединения таких мажорированных троек элементов обеспечивается восстановление информации во всех элементах после отказавшего.

    Система работоспособна, когда или все каналы работоспособны, или два из трех любых (таких сочетаний три) каналов работоспособны.

    Здесь Р1 – ВБР каждого канала троированной системы.

    Данная схема хороша не своей высокой ВБР (ВБР у систем с холодным и горячим резервированием замещением выше), а тем, что функции контроля и подключения резерва выполняются одновременно и автоматически на уровне МЭ. Специализированный мажоритарный контроль идет побитно над результатом каждой машинной операции. Здесь сами МЭ не резервированы и это недостаток примененной схемы.

    В ЦВМ, резервированных по схеме троирования с мажоритарными органами, мажорированию подвергаются все разряды (поразрядно) передаваемого по шине данных числа, выбираемого из памяти или записываемого в память числа и т.п. По данным нашего примера ВБР ЦВМ с одним мажоритарным органом после выходного регистра имеет значение. Ртр.мж = 0,972

    Сравнительные характеристики различных схем резервирования по ВБР, по времени перехода на резерв.

    Изменение ВБР представлены в относительном времени . Это удобно, так как графики справедливы для любого . Здесь –

    интенсивность отказов системы Для последовательной надежностной схемы.

    Интенсивность отказа элементов, составляющих систему.

    Красным цветом отмечено изменение ВБР по t для нерезервированной системы.

    Хотел бы привлечь Ваше внимание к вопросам повышения отказо- и катастрофоустойчивости информационных систем на Вашем предприятии.

    Информационные технологии все шире используются во всех областях деятельности. Сегодня на любом предприятии уже трудно найти производственный процесс, осуществляемый без помощи компьютерных техологий. Они стали одним из основных средств производства.

    На предприятиях нефтеперерабатывающей промышленности существуют критически важные производственные и технологические процессы, любой сбой в которых может привести к крайне тяжелым или непоправимым последствиям. Многие из них управляются с помощью информационных технологий.

    Наряду с этим широкое проникновение этих технологий в производство имеет оборотную сторону. Усиливается зависимость бизнеса от них. Любой компьютерный сбой приводит к простою одного или многих работников. В это время они не выполняют свою работу, следовательно, не зарабатывают прибыль. Не заработанная прибыль - это прямые убытки.

    Сказанного достаточно, чтобы самым серьезным образом задуматься над решением проблемы обеспечения высокой готовности и отказоустойчивости информационных систем.

    Наша компания продвигает и внедряет системы повышенной надежности информационных систем на основе технологий и программного обеспечения лидеров рынка.

    Программное обеспечение, а также аппаратные комплексы предназначены для обеспечения непрерывной работы технических и программных средств, функционирующих под управлением операционных систем Windows и Linux. Оно устанавливается на двух идентичных серверах и позволяет продолжать выполнение запущенных приложений в случае отказа или сбоя любого из серверов, исключая даже незначительные перерывы в работе пользователей.

    Основными преимуществами предлагаемых нами решений являются:

    Экономичность — совокупная стоимость владения значительно ниже, чем у других систем высокой готовности при более высоких параметрах надежности и живучести.

    Простота — это единственная технология высокой готовности, которая так же легка для администрирования, как и единый сервер. Установка и эксплуатация не требуют больших затрат на подготовку персонала.

    Минимальное время простоя — отказы элементов серверов практически никак не влияют на производительность и целостность данных.

    Виды резервирования

    Катастрофоустойчивость — позволяет сохранять работоспособность сервера даже при физическом уничтожении одного из узлов, при этом узлы могут территориально находиться на разных этажах здания, в разных зданиях или даже в разных городах.

    Полная защита информации — данные не теряются даже в случае отказа одного из узлов.

    Открытая архитектура — все компоненты системы абсолютно стандартны, применение специальных аппаратных средств, модифицированных или специально написанных драйверов устройств не требуется.

    Наши решения успешно применяется в составе современных систем управления производственными и бизнес-процессами, мониторинга технического состояния оборудования, анализа и оценки обстановки, сбора и обработки важной информации, потеря которой связана с непоправимым ущербом. А также обеспечивают отказоустойчивость работы автоматизированных систем управления технологическими процессами, применяются для обеспечения безопасности объектов, в составе систем видеонаблюдения и контроля доступа,

    Было бы целесообразным с учетом имеющегося у нас положительного опыта внедрения отказоустойчивых технологий совместно рассмотреть вопрос о расширении их использования в рамках единой технической политики в том числе и в целях предотвращения экстренных и критических ситуаций на Вашем объекте.

    Мы готовы предоставить дополнительную информацию и провести демонстрацию данных технологий.

    Резервирование в электроснабжении

    2.4.1 .Виды резервирования

    На стадии проектирования СЭС для обеспечения требуемой надежности приходится во многих случаях как минимум дублировать отдельные элементы и даже отдельные системы, т.е. использовать резервирование.

    Резервирование характерно тем, что оно позволяет повысить надежность системы по сравнению с надежностью составляющих ее элементов. Повышение надежности отдельно взятых элементов требует больших материальных затрат. В этих условиях резервирование, например, за счет введения дополнительных элементов, является эффективным средством обеспечения требуемой надежности систем.

    Если при последовательном соединении элементов общая надежность системы (т.е. вероятность безотказной работы) ниже надежности самого ненадежного элемента, то при резервировании общая надежность системы может быть выше надежности самого надежного элемента.

    Резервирование осуществляется путем введения избыточности. В зависимости от природы последней резервирование бывает:

    Структурное (аппаратное);

    Информационное;

    Временное.

    Структурное резервирование заключается в том, что в минимально необходимый вариант системы, состоящей из основных элементов, вводятся дополнительные элементы, устройства или даже вместо одной системы предусматривается использование нескольких одинаковых систем.

    Информационное резервирование предусматривает использование избыточной информации. Его простейшим примером является многократная передача одного и того же сообщения по каналу связи. Другим примером являются коды, применяемые в управляющих ЭВМ для обнаружения и исправления ошибок, возникающих в результате сбоев и отказов аппаратуры.

    Временное резервирование предусматривает использование избыточного времени. Возобновление прерванного в результате отказа функционирования системы происходит путем ее восстановления, если имеется определенный запас времени.

    Существуют два метода повышения надежности систем путем структурного резервирования:

    1) общее резервирование, при котором резервируется система в целом;

    2) раздельное (поэлементное) резервирование, при котором резервируются отдельные части (элементы) системы.

    Схемы общего и раздельного структурного резервирования представлены соответственно на рис. 2.6. и 2.7., где n — число последовательных элементов в цепи, m – число резервных цепей (при общем резервировании) или резервных элементов для каждого основного (при раздельном резервировании).

    При m = 1 имеет место дублирование, а при m =2 – троирование. Обычно стремятся по возможности применять раздельное резервирование, т.к. при этом выигрыш в надежности часто достигается значительно меньшими затратами, чем при общем резервировании.

    В зависимости от способа включения резервных элементов различают постоянное резервирование, резервирование замещением и скользящее резервирование.

    Постоянное резервирование – это такое резервирование, при котором резервные элементы участвуют в работе объекта наравне с основными. В случае отказа основного элемента не требуется специальных устройств, вводящих в действие резервный элемент, поскольку он включается в работу одновременно с основным.

    Резервирование замещением – это такое резервирование, при котором функции основного элемента передаются резервному только после отказа основного. При резервировании замещением необходимы контролирующие и переключающие устройства для обнаружения факта отказа основного элемента и переключения с основного на резервный.

    Включение резервного оборудования замещением. Холодное и горячее резервирование.

    Скользящее резервирование – представляет собой разновидность резервирования замещением, при котором основные элементы объекта резервируются элементами, каждый из которых может заменить любой отказавший элемент.

    Оба вида резервирования (постоянное и замещением) имеют свои преимущества и недостатки.

    Достоинством постоянного резервирования является простота, т.к. в этом случае не требуются контролирующие и переключающие устройства, понижающие надежность системы в целом, и, самое главное, отсутствует перерыв в работе. Недостатком постоянного резервирования является нарушение режима работы резервных элементов при отказе основных.

    Включение резерва замещением обладает следующим преимуществом: не нарушает режима работы резервных элементов, сохраняет в большей степени надежность резервных элементов, позволяет использовать один резервный элемент на несколько рабочих (при скользящем резервировании).

    В зависимости от режима работы резервных элементов различают нагруженный (горячий) и ненагруженный (холодный) резерв.

    Нагруженный (горячий) резерв в энергетике называют также вращающимся или включенным. В данном режиме резервный элемент находится в том же режиме, что и основной. Ресурс резервных элементов начинает расходоваться с момента включения в работу всей системы и вероятность безотказной работы резервных элементов в этом случае не зависит от того, в какой момент времени они включаются в работу.

    Облегченный (теплый) резерв характеризуется тем, что резервный элемент находится в менее нагруженном режиме, чем основной. Поэтому, хотя ресурс резервных элементов также начинает расходоваться с момента включения всей системы в целом, интенсивность расхода ресурса резервных элементов до момента их включения вместо отказавших значительно ниже, чем в рабочих условиях.

    Этот вид резерва обычно размещается на агрегатах, работающих на холостом ходу, и, следовательно, в данном случае ресурс резервных элементов срабатывается меньше по сравнению с рабочими условиями, когда агрегаты несут нагрузку.

    Вероятность безотказной работы резервных элементов в случае этого вида резерва будет зависеть как от момента их включения в работу, так и от того, насколько отличаются законы распределения вероятности безотказной работы их в рабочем и резервном условиях.

    В случае ненагруженного (холодного) резерва резервные элементы начинают расходовать свой ресурс с момента их включения в работу вместо основных. В энергетике этим видом резерва служат обычно отключенные агрегаты.

    Расчеты надежности систем с параллельно включенными элементами зависят от способа резервирования.

    ⇐ Предыдущая13141516171819202122Следующая ⇒

    Похожая информация:

    Поиск на сайте:

    В практике построения высокодоступных систем, прежде всего IT, существует понятие “единой точки отказа” (SPOF, Single Point Of Failure). Любая система высокой доступности данных стремится не иметь в своей архитектуре узла, линии связи или объекта, отказ которого может вывести из строя всю систему, или вызвать недоступность данных.

    Все это так. Однако я обратил внимание, что в последнее время, в особенности в IT-шной среде возникло своеобразное “фетиширование” вот этого вот “отсутствия единой точки отказа”. Широко распространилось мнение, что “отсутствие единой точки отказа” это синоним “хорошо” и “система правильная ”, а ее присутствие – “плохо” и “система неправильная ”. �?

    холодный резерв

    на этом исследование вопроса архитектурной правильности заканчивается. Однако, как и в любом другом деле, суть, на самом деле, лежит несколько глубже.

    Дело в том, что “отсутствие единой точки отказа” это “инструмент” для достижения высокой доступности, но не “цель”. “No SPOF” это одно из средств достижения доступности, но не сама доступность как таковая, средство, одно из, а не цель, часто необходимое, но не достаточное условие.

    Что же, в таком случае, на самом деле определяет годность решения?

    Мне представляется, что это удовлетворение требованиям по RPO/RTO для данной конкретной бизнес-задачи.

    Термины RPO/RTO хорошо известны специалистам в области защиты данных и резервного копирования. RPO, Return Point Objective – это “точка доступности данных”, в случае их потери. RTO, Return Time Objective – это время, которое неоьходимо системе для восстановления своей работы, и возобновления обслуживания.

    Например, если вы делаете резервное копирование вашей базы данных раз в сутки по вечерам, после окончания рабочего дня, в 21:00, то RPO для вашей системы будет 21:00 вечера предыдущего дня, то есть момент начала создания резервной копии.

    Допустим, вы потеряли данные, восстановили их из бэкапа по состоянию на 21 час прошлого дня. Восстановление базы заняло 40 минут. Если у вас работает база данных, то вам еще надо актуализировать ее состояние из archive logs, накатив изменения, записанные с 21:00 по текущее время. Допустим, это заняло 15 минут. �?того, RTO, в вашем случае – 55 минут.

    Плохо это или хорошо? Невозможно ответить с точки зрения IT. Ответ должен дать бизнес, которому вы служите. Для какой-то задачи даже 10 минут простоя это много. Какая-то вполне готова подождать пару часов, а какие-то задачи вполне могут и сутки постоять, ничего страшного не случится. Падение биржи NYSE может быть чревато паникой в масштабах глобальной экономики. Падение сети обслуживания банкоматов крупного банка, который за 10 минут периода простоя мог бы обработать десятки тысяч обращений “физиков”, это еще не паника, но все еще очень неприятно. А хостинг домашних страничек вполне может и сутки полежать с сообщением “�?звините, ведутся работы”, в лучшем случае выплатив клиентам неустойку за сутки простоя.

    Разумеется, бизнес будет требовать нулевого RPO/RTO, это всегда так, они всегда это требуют. 🙂 Однако следует помнить, что все стоит денег, и каждое улучшение ситуации с временем недоступности стоит денег, причем часто растет по экспоненте, каждое следующее улучшение этих параметров обойдется бизнесу все дороже и дороже.

    Поэтому, как правило, бизнес и IT обычно приходят к некоему компромиссу. Компромисс этот, как правило, сегментирован по задачам. Но в конечном счете бизнес и IT, совместно вырабатывают какие-то требования по RPO/RTO.

    �? система, которая выполняет эти требования, система, удовлетворяющая этим требованиям бизнеса, за примелемые для бизнеса деньги – это хорошая система . Система, которая не удовлетворяет им – плохая .

    Обратите внимание, что в моем опредении “плохой” и “хорошей” системы я не использовал понятие “отсутствия единой точки отказа” вовсе.

    Может ли быть хорошей, то есть удовлетворять требованиям бизнеса по RPO/RTO, система с наличием “единой точки отказа”? Да запросто. Если период восстановления работоспособности системы укладывается в заданные рамки – да пусть сколько угодно там будет точек отказа. В особенности, если ликвидация в решении всех “единых точек отказа” экономически нецелесообразна, потому что чрезмерно дорога для решаемой бизнесом задачи.

    Помните, что надежность, это комплексный параметр, зависящий от множества факторов и множества участников. Создание сверхнадежного стораджа для хранения данных не сделает сверхнадежной вашу IT-систему, если к этому сверхнадежному, кластерному, без единой точки отказа, и по FC Dual Fabric подключены ненадежные сервера, без кластеризации и с истекшим сервисным контрактом, выполняющие собственно бизнес-приложение и бизнес-функцию. Помните, что как и в случае морской эскадры, скорость которой определяется скоростью самого медленного в ней корабля, надежность IT-системы определяется надежностью самого слабого в ней звена , а отнюдь не самого надежного.

    В надежности нет “волшебной пули”, как нет и абсолютной надежности. �? наличие или отсутствие “единой точки отказа” в вашей части IT-системы может никак не отражаться на надежности бизнес-системы в целом. Всегда следует смотреть глубже, и задаваться целью, выполняются ли требования по RPO/RTO, необходимые бизнесу, и сколько это стоит. �? можно ли за те же деньги, или дешевле, найти решение, улучшающее этот показатель, и каким образом.

    А не просто фетишировать на один из множества инструментов для достижения этой цели.

    Метки: RPO, RPO/RTO, RTO, SPOF
    Рубрика: justread | Комментариев нет

    Резервирование дисков и каналов

    При использовании зеркального диска есть вероятность повреждения единых для обоих дисков канала, контроллера и блока питания.

    OS NetWare 386 может резервировать целиком каналы, при этом используются два контроллера, к которым соответственно подключены два диска. Для питания этих контроллеров и дисков используются два блока питания.

    Горячее резервирование серверов

    Восстановление данных с зеркального диска может потребовать, в зависимости от объема диска, времени порядка нескольких часов. Иногда такая задержка в работе сети является совершенно недопустимой.

    Относительно недавно фирма Novell разработала сетевую OS NetWare System Fault Tolerance Level III (SFT III) версии 3.11. Эта OS обеспечивает горячее резервирование серверов.

    Система NetWare SFT III состоит из двух серверов, соединенных между собой скоростной линией связи, с использованием специальных адаптеров MSL (Mirrored Server Link).Эти адаптеры могут соединяться коаксиальным кабелем длиной до 33 метров или оптоволоконным кабелем длиной до 4 километров.

    Выход из строя одного сервера не влечет за собой остановку работы сети — в дело автоматически включается резервный сервер. Благодаря высокоскоростному каналу связи диски резервного сервера содержат те же файлы, что и диски основного, поэтому никакого восстановления данных не требуется. Можно ремонтировать один из двух используемых серверов без остановки всей системы, что очень важно, если система должна работать круглосуточно.

    Глава II. Техническое построение локальной сети

    Постановка задачи

    Целью курсовой является организация локальной сети и выход в Интернет в жилом доме

    Для решения поставленной цели в курсовой работе решаются следующие задачи:

    · Выбор топологии и кабельной системы сети;

    · Выбор сетевого оборудования;

    · Выбор программного обеспечения.

    Необходимо разработать рациональную, гибкую структурную схему сети жилого дома, предусмотреть режимы быстрого обновления оперативной информации на сервере, а так же проработать вопросы необходимого уровня защиты данных.

    Построение сети

    Для решения первой задачи мною была выбрана топология «Звезда» так как:

    Традиционно считается, что локальные сети должны строиться по топологии "звезда", а кольцевая архитектура присуща серьезным телекоммуникационным системам на основе SDH/ATM (это очень эффективное средство повышения надежности в телефонии, где несколько АТС могут продолжать работать независимо от вышедшего из строя узла).

    Однако, любая многосвязная архитектура более надежна, чем простое соединение. И кольцо Ethernet не исключение. С распространением недорогих коммутаторов, поддерживающих STP (протокол покрывающего дерева), использование резервных связей стало достаточно простым процессом, не требующим вмешательства администраторов сети.

    Горячий резерв

    При использовании "кольца" в случае выхода из строя какого-либо узла (или части кабельной системы) работоспособность сети в целом сохраняется.

    Однако, кольцевая топология является избыточной по числу связей, а значит и более дорогой. А вопрос надежности стоит не слишком остро из-за небольших размеров ЛВС.

    Очевидно что с точки зрения надёжности предпочтительнее топология «кольцо», но так как для домашней сети значительнее актуальнее вопрос стоимости сети и, учитывая, трудности возникающие при прокладке кабеля, то в итоге топология «звезда» является наиболее оптимальной.

    Для решения задачи выбора кабельной системы сети мною был выбран кабель витая пара категории «cat5e» так как:

    Для абонентской системы здания оптимальным выбором служит витая пара категории 5е. Она позволяет передавать данные со скоростью 100мбит/c, удобна в прокладке, обладает достаточно низкой стоимостью и отвечает всем требованиям по надёжности, предъявляемым к абонентской системе.

    Учитывая низкий общий бюджет проекта, очевидным выбором для магистральных соединений становилась витая пара категории 5e для внешней проводки. Её существенным недостатком является низкий уровень защищённости от внешних электромагнитных наводок и статического напряжения, что сказывается на общей надёжности сети, но этот недостаток подавляется прокладкой кабеля в специальных кабель каналах, отдельно от общедомой электропроводки.

    Для решения задачи выбора сетевого оборудования, мною были выбраны 2 коммутатора D-Link DES-3028, так как управляемые коммутаторы второго уровня серии DES-3028 представляют собой наиболее эффективное решение в категории управляемых сетевых коммутаторов начального уровня. Обладая богатым функционалом, эти коммутаторы предоставляют недорогое решение по созданию безопасной и эффективной сети отделов предприятий малого и среднего бизнеса, а также промышленных предприятий. Также эта серия является оптимальным по соотношению «цена/функционал» решением уровня доступа сети провайдера услуг. Отличительными функциями данного коммутатора являются высокая плотность портов, 4 гигабитных порта Uplink, небольшой шаг изменения настроек для управления полосой пропускания и улучшенное сетевое управление. Эти коммутаторы позволяют оптимизировать сеть как по функционалу, так и по стоимостным характеристикам.

    Главный и идинственный сервер в сети должен обеспечивать:

    · WEB — сервер

    · Файловое хранилище

    · P2P – трекер

    · Выступать посредником между серверами интернет-провайдера и локальной сетью

    Для решения этой задачи мною было принято решения отказатся от специализированных серверных решений и выбрать систему примерной конфигурации:

    · Процессор: Core 2 Quad Q9650

    · Память: 8Gb DDR II

    · 2x 1,5Tb HDD обьедененых в RAID 0

    В качестве сетевой ОС была выбрана Ubuntu Server x64, так как эта ОС имеет ряд огромных плюсов, такких как:

    · Бесплатность в отличии, например, от Windows Server

    · Гибкость конфигурации

    · Наличие всего необходимого софта в базовом пакете

    · Поддердка практически всего оборудования

    · Регулярные обновления и наличие русскоязычного сайта поддержки