Как найти определить наработку на отказ

2.1. Критерии и количественные характеристики надежности

Критерием
надежности
называется
признак, по которому можно количественно
оценить надежность различных устройств.
К числу наиболее широко применяемых
критериев надежности относятся:

— вероятность
безотказной работы в течение определенного
времени P(t);

— средняя
наработка до первого отказа Tср;

— наработка
на отказ tср;

— частота
отказов f(t)
или а(t);

— интенсивность
отказов λ(t);

— параметр
потока отказов ω(t);

— функция
готовности Kг(t);

— коэффициент
готовности Kг.

Характеристикой
надежности
следует
называть количественное значение
критерия надежности конкретного
устройства. Выбор количественных
характеристик надежности зависит от
вида объекта.

2.1.2.
Критерии надежности невосстанавливаемых
объектов

Рассмотрим
следующую модель работы устройства.
Пусть в работе (на испытании) находится
N0
элементов и работа считается законченной,
если все они отказали. Причем вместо
отказавших элементов отремонтированные
не ставятся. Тогда критериями надежности
данных изделий являются:

— вероятность
безотказной работы P(t);

— частота
отказов f(t)
или a(t);

— интенсивность
отказов λ(t);

— средняя
наработка до первого отказа Tср.

Вероятностью
безотказной работы
называется
вероятность того, что при определенных
условиях эксплуатации в заданном
интервале времени или в пределах заданной
наработки не произойдет ни одного
отказа.

Согласно
определению:

P(t
)
= P(T
>
t
),

(4.2.1)

где:
T

время работы элемента от его включения
до первого отказа;

t

время, в течение которого определяется
вероятность безотказной работы.

Вероятность
безотказной работы по
статистическим данным
об
отказах оценивается выражением:


(4.2.2)

где:
N0
— число элементов в начале работы
(испытаний);

n(t)
— число отказавших элементов за время
t;


статистическая
оценка вероятности безотказной работы.
При большом числе элементов (изделий)
N0
статистическая оценка P
(t)
практически совпадает с вероятностью
безотказной работы P(t).
На практике иногда более удобной
характеристикой является вероятность
отказа Q(t).

Вероятностью
отказа
называется
вероятность того, что при определенных
условиях эксплуатации в заданном
интервале времени возникает хотя бы
один отказ. Отказ и безотказная работа
являются событиями несовместными и
противоположными, поэтому:

Частотой
отказов
по
статистическим
данным
называется
отношение числа отказавших элементов
в единицу времени к первоначальному
числу работающих (испытываемых) при
условии, что все вышедшие из строя
изделия не восстанавливаются. Согласно
определению:

где:
nt)
— число отказавших элементов в интервале
времени от (t

Δt)
/ 2 до (t
+
Δt)
/ 2.

Частота
отказов
есть
плотность вероятности (или закон
распределения) времени работы изделия
до первого отказа. Поэтому:

Интенсивностью
отказов
по
статистическим
данным
называется
отношение числа отказавших изделий в
единицу времени к среднему числу изделий,
исправно работающих в данный отрезок
времени. Согласно определению

где:
— среднее число исправно работающих
элементов в интервале Δt;

Ni

число изделий, исправно работающих в
начале интервала Δt;

Ni+1
— число элементов, исправно работающих
в конце интервала Δt.

Вероятностная
оценка характеристики λ(t)
находится из выражения:

λ(t
)
=
f
(t
)
/ P(t
).

(4.2.7)

Интенсивность
отказов и вероятность безотказной
работы связаны между

собой
зависимостью:

Средней
наработкой до первого отказа
называется
математическое ожидание времени работы
элемента до отказа. Как математическое
ожидание, Tср
вычисляется
через частоту отказов (плотность
распределения времени безотказной
работы):

Так
как t
положительно
и P(0)=1,
а P(∞)
=
0,
то:

По
статистическим
данным
об
отказах средняя наработка до первого
отказа вычисляется по формуле

где:
ti
— время безотказной работы i-го
элемента;

N0
— число исследуемых элементов.

Как
видно из формулы (4.2.11), для определения
средней наработки до первого отказа
необходимо знать моменты выхода из
строя всех испытуемых элементов. Поэтому
для вычисления средней наработки на
отказ пользоваться указанной формулой
неудобно. Имея данные о количестве
вышедших из строя элементов ni
в
каждом i
интервале времени, среднюю наработку
до первого отказа лучше определять из
уравнения:

В
выражении (4.2.12) tсрi
и
m
находятся
по следующим формулам:

tcpi
=
(ti–1
+
ti
)
/ 2, m
=
tk
/
Δt,

где:
ti–1

время начала i-го
интервала;

ti

время конца i-го
интервала;

tk

время, в течение которого вышли из строя
все элементы;

Δt
=
(ti–1

t1
)
— интервал времени.

Из
выражений для оценки количественных
характеристик надежности видно, что
все характеристики, кроме средней
наработки до первого отказа, являются
функциями времени. Конкретные выражения
для практической оценки количественных
характеристик надежности устройств
рассмотрены в разделе «Законы распределения
отказов».

Рассмотренные
критерии надежности позволяют достаточно
полно оценить надежность невосстанавливаемых
изделий. Они также позволяют оценить
надежность
восстанавливаемых изделий до первого
отказа
.
Наличие нескольких критериев вовсе не
означает, что всегда нужно оценивать
надежность элементов по всем критериям.

Наиболее
полно надежность изделий характеризуется
частотой
отказов f
(t)
или a(t).
Это объясняется тем, что частота отказов
является плотностью распределения, а
поэтому несет в себе всю информацию о
случайном явлении — времени безотказной
работы.

Средняя
наработка до первого отказа
является
достаточно наглядной характеристикой
надежности. Однако применение этого
критерия для оценки надежности сложной
системы ограничено в тех случаях, когда:

— время
работы системы гораздо меньше среднего
времени безотказной работы;

— закон
распределения времени безотказной
работы не однопараметрический и для
достаточно полной оценки требуются
моменты высших порядков;

— система
резервированная;

— интенсивность
отказов не постоянная;

— время
работы отдельных частей сложной системы
разное.

Интенсивность
отказов

наиболее удобная характеристика
надежности простейших элементов, так
как она позволяет более просто вычислять
количественные характеристики надежности
сложной системы.

Наиболее
целесообразным критерием надежности
сложной системы
является
вероятность
безотказной работы
.
Это объясняется следующими особенностями
вероятности безотказной работы:

— она
входит в качестве сомножителя в другие,
более общие характеристики системы,
например, в эффективность и стоимость;

— характеризует
изменение надежности во времени;

— может
быть получена сравнительно просто
расчетным путем в процессе проектирования
системы и оценена в процессе ее испытания.

2.1.3.
Критерии надежности восстанавливаемых
объектов

Рассмотрим
следующую модель работы. Пусть в работе
находится N
элементов
и отказавшие элементы немедленно
заменяются исправными (новыми или
отремонтированными). Если не учитывать
времени, потребного на восстановление
системы, то количественными характеристиками
надежности могут быть параметр потока
отказов ω(t)
и
наработка на отказ tср.

Параметром
потока отказов
называется
отношение числа отказавших изделий в
единицу времени к числу испытываемых
при условии, что все вышедшие из строя
изделия заменяются исправными (новыми
или отремонтированными). Статистическим
определением
служит
выражение:

где:
nt)
— число отказавших образцов в интервале
времени от t

Δt/2

до
t
t/2;

N

число испытываемых элементов;

Δt

интервал времени.

Параметр
потока отказов и частота отказов для
ординарных потоков с ограниченным
последействием связаны интегральным
уравнением Вольтера второго рода:

По
известной f
(t)
можно найти все количественные
характеристики надежности невосстанавливаемых
изделий. Поэтому (4.2.14) является основным
уравнением, связывающим количественные
характеристики надежности невосстанавливаемых
и восстанавливаемых элементов при
мгновенном восстановлении.

Уравнение
(4.2.14) можно записать в операторной форме:

Соотношения
(4.2.15) позволяют найти одну характеристику
через другую, если существуют преобразования
Лапласа функций f(s)
и ω(s)
и обратные преобразования выражений
(4.2.15).

Параметр
потока отказов обладает следующими
важными свойствами:

1)
для любого момента времени, независимо
от закона распределения времени
безотказной работы, параметр потока
отказов больше, чем частота отказов, т.
е. ω(t)
> f(t);

2)
независимо от вида функций f(t)
параметр потока отказов ω(t)
при t

∞ стремится
к 1/Tср.
Это важное свойство параметра потока
отказов означает, что при длительной
эксплуатации ремонтируемого изделия
поток его отказов, независимо от закона
распределения времени безотказной
работы, становится стационарным. Однако
это вовсе не означает, что интенсивность
отказов есть величина постоянная;

3)
если λ(t)
— возрастающая функция времени, то λ(t)
> ω(t)
> f(t),
если λ(t)
— убывающая функция, то ω(t)
> λ(t)
> f(t);

4)
при λ(t
)

const
параметр потока отказов системы не
равен сумме параметров потока отказов
элементов, т. е.:

Это
свойство параметра потока отказов
позволяет утверждать, что при вычислении
количественных характеристик надежности
сложной системы нельзя суммировать
имеющиеся в настоящее время значения
интенсивности отказов элементов,
полученных по статистическим данным
об отказах изделий в условиях эксплуатации,
так как указанные величины являются
фактически параметрами потока отказов;

5)
при λ(t)
= λ= const параметр потока отказов равен
интенсивности отказов

ω(t)
= λ(t)
= λ.

Из
рассмотрения свойств интенсивности и
параметра потока отказов видно, что эти
характеристики различны.

В
настоящее время широко используются
статистические данные об отказах,
полученные в условиях эксплуатации
оборудования. При этом они часто
обрабатываются таким образом, что
приводимые характеристики надежности
являются не интенсивностью отказов, а
параметром потока отказов ω(t).
Это вносит ошибки при расчетах надежности.
В ряде случаев они могут быть значительными.

Для
получения интенсивности отказов
элементов из статистических данных об
отказах ремонтируемых систем необходимо
воспользоваться формулой (4.2.6), для чего
необходимо знать предысторию каждого
элемента технологической схемы. Это
может существенно усложнить методику
сбора статистических данных об отказах.
Поэтому целесообразно определять λ(t)
по параметру потока отказов ω(t).
Методика расчета сводится

к
следующим вычислительным операциям:

— по
статистическим данным об отказах
элементов ремонтируемых изделий и по
формуле (4.2.13) вычисляется параметр
потока отказов и строится гистограмма
ωi(t);

— гистограмма
заменяется кривой, которая аппроксимируется
уравнением;

— находится
преобразование Лапласа ωi(s)
функции ωi(t);

— по
известной
ωi(s)
на основании (4.2.15) записывается
преобразование Лапласа fi
(s)
частоты отказов;

— по
известной fi(s)
находится обратное преобразование
частоты отказов fi(t);

— находится
аналитическое выражение для интенсивности
отказов по формуле:

— строится
график λi(t).

Если
имеется участок, где λi(t)
= λi
=
const, то постоянное значение интенсивности
отказов принимается для оценки вероятности
безотказной работы. При этом считается
справедливым экспоненциальный закон
надежности.

Приведенная
методика не может быть применена, если
не удается найти по f(s)
обратное преобразование частоты отказов
f(t).
В этом случае приходится применять
приближенные методы решения интегрального
уравнения (4.2.14).

Наработкой
на отказ
называется
среднее значение времени между соседними
отказами. Эта характеристика определяется
по статистическим
данным
об
отказах по формуле:

где:
ti

время исправной работы элемента между
(i

1)-м и i
отказами;

n

число отказов за некоторое время t.

Из
формулы (4.2.18) видно, что в данном случае
наработка на отказ определяется по
данным испытания одного образца изделия.
Если на испытании находится N
образцов
в течение времени t,
то наработка на отказ вычисляется по
формуле:

где:
tij

время исправной работы j-го
образца изделия между (i

1)-м и i
отказом;

nj

число отказов за время tj-го
образца.

Наработка
на отказ является достаточно наглядной
характеристикой надежности, поэтому
она получила широкое распространение
на практике. Параметр потока отказов
и наработка на отказ характеризуют
надежность восстанавливаемого изделия
и не учитывают времени, необходимого
на его восстановление. Поэтому они не
характеризуют готовности устройства
к выполнению своих функций в нужное
время. Для этой цели вводятся такие
критерии, как коэффициент готовности
и коэффициент вынужденного простоя.

Коэффициентом
готовности
называется
отношение времени исправной работы к
сумме времен исправной работы и
вынужденных простоев устройства, взятых
за один и тот же календарный срок. Эта
характеристика по статистическим
данным
определяется:

где:
tр

суммарное время исправной работы
изделия;

tп

суммарное время вынужденного простоя.

Времена

и
tп
вычисляются
по формулам:

где:
tрi

время работы изделия между (i

1)-м и i
отказом;

tпi

время вынужденного простоя после i-го
отказа;

n

число отказов (ремонтов) изделия.

Для
перехода к вероятностной трактовке
величины
и
tп
заменяются
математическими ожиданиями времени
между соседними отказами и времени
восстановления соответственно. Тогда:

Kr
=
tcp
/
(tcp
+
tв
),
(4.2.22)

где:
tср

наработка на отказ;

tв

среднее время восстановления.

Коэффициентом
вынужденного простоя
называется
отношение времени вынужденного простоя
к сумме времен исправной работы и
вынужденных простоев изделия, взятых
за один и тот же календарный срок.

Согласно
определению:

K
п
=
t
p

/
(t
p
+
tп
),
(4.2.23)

или,
переходя к средним величинам:

Kп
=
tв
/
(tcp
+
tв
).
(4.2.24)

Коэффициент
готовности и коэффициент вынужденного
простоя связаны между собой зависимостью:

Kп
=
1–
Kг
.
(4.2.25)

При
анализе надежности восстанавливаемых
систем обычно коэффициент готовности
вычисляют по формуле:

Kг
=Tcp
/
(Tcp
+
tв
).
(4.2.26)

Формула
(4.2.26) верна только в том случае, если
поток отказов простейший, и тогда tср
=
Tср.

Часто
коэффициент готовности, вычисленный
по формуле (4.2.26), отождествляют с
вероятностью того, что в любой момент
времени восстанавливаемая система
исправна. На самом деле указанные
характеристики неравноценны и могут
быть отождествлены при определенных
допущениях.

Действительно,
вероятность возникновения отказа
ремонтируемой системы в начале
эксплуатации мала. С ростом времени t
эта
вероятность возрастает. Это означает,
что вероятность застать систему в
исправном состоянии в начале эксплуатации
будет выше, чем после истечения некоторого
времени. Между тем на основании формулы
(4.2.26) коэффициент готовности не зависит
от времени работы.

Для
выяснения физического смысла коэффициента
готовности
запишем
формулу для вероятности застать систему
в исправном состоянии. При этом рассмотрим
наиболее простой случай, когда
интенсивность отказов λ и интенсивность
восстановления μ есть величины постоянные.

Предполагая,
что при t
=
0
система находится в исправном состоянии
(P(0)
= 1), вероятность застать систему в
исправном состоянии определяется из
выражений:

где
λ
= 1
/Tcp
;
μ
= 1
/ tв
;
Kг
=Tcp
/
(Tcp
+
tв
).

Это
выражение устанавливает зависимость
между коэффициентом готовности системы
и вероятностью застать ее в исправном
состоянии в любой момент времени t.

Из
(4.2.27) видно, что
приt

∞,
т. е. практически коэффициент готовности
имеет смысл вероятности застать изделие
в исправном состоянии при установившемся
процессе эксплуатации.

В
некоторых случаях критериями
надежности восстанавливаемых систем
могут быть критерии невосстанавливаемых
систем
,
например: вероятность
работы, частота отказов, средняя наработка
до первого отказа, интенсивность отказов
.
Такая необходимость
возникает
:

— когда
имеет смысл оценивать надежность
восстанавливаемой системы до первого
отказа;

— в
случае, когда применяется резервирование
с восстановлением отказавших резервных
устройств в процессе работы системы,
причем отказ всей резервированной
системы не допускается.

Наработка на отказ | areliability.com блог инженера по надёжности

наработка на отказ

Наработка на отказ

Наработка на отказ — один из важнейших параметров надежности оборудования. По моему опыту обучения это один из самых малопонятных аспектов теории надежности. Я регулярно сталкиваюсь с такой ситуацией — специалист видит, что в паспорте на изделие указана наработка на отказ, например 60.000 часов, как на примере на картинке, взял их отсюда.

наработка на отказ пример

наработка между отказами

В 99% случаев я слышу одну и ту же фразу — ну раз написано 60000 часов, значит этот контроллер должен отработать 60000 часов? И все всегда удивляются, когда я говорю нет. Давайте разберемся, почему так вышло и даже подтвердим это расчетом.

Обратите внимание, на приведенной выше картинке указано ключевое слово — средняя наработка на отказ. Это означает, что цифра в 60000 часов относится не к единичному изделию, а ко всей произведенной партии.

Давайте посмотрим, как получается эта средняя наработка на отказ. Представим ситуацию, когда было произведено 100 однотипных изделий, например насосов. Все партию в 100 штук одновременно включают и не выключают до тех пор, пока все насосы не откажут. Часы работы тикают, насосы отказывают, люди, ответственные за испытания фиксируют время отказа того или иного насоса. Привожу иллюстрацию того, как это происходит:

наработка на отказ mtbf

Тоже самое можно проиллюстрировать графиком:

наработка на отказ график

В какой-то момент (в моем примере это это 1100 часов или через 46 суток) все изделия откажут, число работающих будет равно 0. Теперь, если мы возьмем среднее значение времени, за которое произошли все отказы, мы и получим среднюю наработку на отказ для данной партии насосов.

средняя наработка на отказ

Иными словами, средняя наработка на отказ, это среднее значение от срока в часах, за которое умрут все изделия из испытательной партии. Означает ли это, что наработка на отказ это бесполезный параметр, не несущий практической информации?

Не совсем так. Наработка на отказ позволяет нам сделать несколько важных вещей, имеющих практическое значение: рассчитать вероятность безотказной работы изделия, рассчитать интенсивность отказов изделия и рассчитать коэффициент готовности. Но прежде чем мы перейдем к расчетам, налью ещё немножко теории.

Момент номер 1. В современной нормативной документации понятие наработка на отказ вообще отсутствует. Термин существовал до 2017 года, а потом был заменен на наработку между отказами. Если мы возьмем актуальный ГОСТ Р 27.102-2021. Надежность в технике, надежность объекта, термины и определения, то увидим там следующие термины:

наработка до отказа: Наработка объекта от начала его эксплуатации или от момента его восстановления до отказа. Примечание — Частным случаем наработки до отказа является наработка до первого отказа — наработка объекта от начала его эксплуатации до первого отказа.
наработка между отказами: Наработка объекта между двумя следующими друг за другом отказами. Примечание — Наработка между отказами есть частный случай наработки до отказа, применимый только к восстанавливаемым объектам.

За рубежом же чаще всего используются аббревиатуры MTBF и MTTF. Поясню в чем между ними разница простой табличкой:

Русский термин Расшифровка термина Англоязычный термин Расшифровка аббревиатуты Примечание
Наработка до отказа Наработка объекта от начала его эксплуатации или от момента его восстановления до отказа MTTF Mean time to failure Для невосстанавливаемых. неремонтопригодных объектов — фильтры, конденсаторы, прочая рассыпная электроника
Наработка между отказами Наработка объекта между двумя следующими друг за другом отказами MTBF Mean time between failures Для восстанавливаемых, ремонтопригодных изделий

Таким образом говорить фразу «наработка на отказ» не совсем корректно с точки зрения нормативной документации, но выражение стало настолько устойчивым и настолько прочно ушло в народ, что если вы будете говорить по другому, вас могут просто не понять. Я бы сказал, что в неофициальном, «негостовском» профессиональном жаргоне под наработкой на отказ понимается как наработка до отказа (MTTF), так и наработка между отказами (MTBF), а уж какой именно вид наработки определится на этапе детального рассмотрения изделия.

Момент номер 2. А как же тогда подтверждаются все эти 60000 тысяч часов наработки на отказ, (для отдельных устройств, например промышленных контроллеров безопасности наработка на отказ достигается нескольких миллионов часов) если в году всего лишь 8760 часов?
Понятно, что никто не будет проводить испытания десятки лет — на это нет ни денег, ни возможностей — тебя просто съедят конкуренты. В этом случае поступают разными способами:

1) Проводят ускоренные испытания на надёжность, когда изделие испытывает повышенное воздействие ВВФ (внешних воздействующих факторов), например для электроники это в первую очередь температурное нагружение. Так же это может быть давление, влажность, вибрация и иные ВВФ.
Пример подобной методики вы можете посмотреть здесь.
Испытания на надежность для радиоэлектроники проводит МНИИРИП.

2) Определяем расчётным или расчёто-экспериментальным способом время наступления первых двух-трех отказов. Как известно, линию можно построить через 2 точки. Соответственно по 2-3 точкам можно построить график методами аппроксимации, которые есть даже в Эксель. И определить среднюю наработку на отказ по графику. Разумеется есть и другие, более точные и более сложные способы, но суть думаю вы уловили.


Теперь давайте вместе посчитаем!

1. Определим ВБР (вероятность безотказной работы) изделия, например контроллера, для которого известна средняя наработка на отказ, например 60000 часов.

Воспользуемся известной формулой (преобразованная формула 26 из ГОСТ Р МЭК 61078-2021):

(1)

Где, t — время работы оборудования, для которого мы должны провести расчет ВБР. T — наработка до отказа (маловероятно, что контроллер будут восстанавливать).

Если использовать англоязычные термины, формула преобразуется следующим образом:

(2)

Предположим, что контроллер должен безостановочно отработать 1000 часов, соответственно t = 1000, T = MTTF = 60000. Тогда подставив числа в формулу (1) или (2) мы узнаем, что ВБР контроллера для времени работы 1000 часов составит:

Именно с такой вероятностью наш контроллер не откажет на интервале в 1000 часов.

Я сделал калькулятор, позволяющий быстро определить ВБР используя в качестве исходных данных время требуемое непрерывной работы оборудования в часах и наработку на отказ.

Маленькое примечание: я пишу наработка на отказ и MTBF, но все расчеты будут справедливы и для наработки до отказа (MTTF) и для наработки между отказами (MTBF). Так же я пишу Надежность (ВБР). Это не совсем корректно, поскольку надежность это не только безотказность (ВБР), но еще и долговечность, ремонтопригодность, сохраняемость. Более подробно об этом я говорю здесь. Но на практике очень часто под надежностью понимается именно безотказность, которая характеризуется ВБР и наработкой на отказ.

Попробуйте выполнить следующий эксперимент: введите в качестве исходных данных требуемое время непрерывной работы оборудования, например 60000 часов и наработку на отказ 60000 часов. Попробовали? Удивительный результат, правда? То есть если наработка на отказ и время работы одинаковы, вероятность безотказной работы составит всего лишь 0,37! Или из партии в 100 изделий лишь 37 не откажут, если время работы и наработка на отказ равны. Вот и ответ, на вопрос, который мы поставили в начале этой статьи. Маленькое примечание: все это справедливо лишь том случае, если мы имеем экспоненциальное распределение отказов. Хорошая новость в том, что экспоненциальное распределение лучше всего описывает большинство отказов оборудования и идеально подходит для отказов электроники, то есть нашего многострадального контроллера.


2. Продолжаем экзерсисы.
Давайте теперь найдем интенсивность отказов, зная наработку на отказ. Интенсивность отказов, она же λ (в англоязычной литературе failure rate) является параметром, определяющим надёжность того или иного элемента (составной части) системы. λ, это как правило табличное значение, задаётся в размерности 10 в минус 6 степени отказов в час (отказов на миллион часов работы). Интенсивность отказов (или как писали раньше в советской литературе — опасность отказа) соотносится с наработкой на отказ следующими соотношениями:

(3)

(4)

Повторяю своё предыдущее примечание: все расчеты будут справедливы и для наработки до отказа (MTTF) и для наработки между отказами (MTBF).

Зная интенсивность отказов оборудования и требуемое время непрерывной работы мы можем легко посчитать ВБР изделия по классической формуле надежности (формула 26 из ГОСТ Р МЭК 61078-2021):

(5)

Точно так же, можете воспользоваться моим калькулятором. Значения интенсивности отказов для многих элементов конструкций можно найти здесь. Например, по приведенной по ссылке таблице вы нашли, что интенсивность отказов манометра составляет 1.3 на 10 в минус 6 степени. Для расчёта берите значение именно 1.3, степень вводить не надо, калькулятор автоматически переведёт в нужную размерность.

Интенсивность отказов удобна тем, что зная интенсивности отказов каждого элемента системы мы можем легко определить его ВБР и наработку на отказ. Для этого нужно просто сложить все интенсивности отказов оборудования и воспользоваться формулой (5) — если хотим найти ВБР или формулой (3) если хотим найти наработку. Важно! Это будет справедливо только для схемы без резервирования элементов. Как считать ВБР и наработку если в системы используются различные схемы резервирования — приходите к нам учиться. Расскажем и детально покажем.


3. Чем ещё нам полезна наработка на отказ? А тем, что она позволяет определить коэффициент готовности оборудования или если выражаться англоязычными терминами — availability — доступность оборудования. Как раз в этом и заключен физический смысл коэффициента готовности — вероятность того, что в произвольный момент времени оборудование будет доступно для использования. Доступность оборудования тесно связана с экономикой. Чем выше доступность — тем меньше простои оборудования. Чем меньше простои — тем больше оборудование приносит денег. Когда карьерный самосвал стоит на ремонте или самолет стоит на перроне — деньги он не приносит, только прожирает.

Давайте посмотрим, как выглядит формула для расчета Ктг — коэффициента технической готовности оборудования.

(6)

Где, А — availability — она же доступность, она же Ктг.
MTBF — знакомая нам аббревиатура, наработка между отказами.
MTTR (mean time to repair) — среднее время восстановления работоспособности. Оно может рассчитываться, а может определяться опытным путем. То есть это то время, которое требуется сервисным инженерам, ремонтной бригаде чтобы локализовать и устранить отказ.

Точно так же привожу калькулятор, которой позволит вам провести расчет коэффициента готовности онлайн.

А уже зная Ктг можно посчитать и время простоя оборудования, перевести его на деньги и показать руководству, что если не внедрить мероприятия по повышению надежности стоимостью x рублей, то стоимость простоя составит x*y рублей.
Полагаю, на этом пока можно остановиться. Пусть ваша техника будет надежной.


Если вы хотите заказать у меня расчет надежности — нажмите на эту ссылку или на кнопку ниже.

расчет надежности

Внимание! Если вас интересует корпоративное групповое обучение специалистов вашей компании, пожалуйста перейдите по ссылке ниже. Возможна адаптация учебной программы под ваши требования/пожелания/возможности как по объёму учёбы срокам обучения, формату обучения, так и по балансу теория/практика.

корпоративное обучение


все мои курсы

До встречи на обучении! С уважением, Алексей Глазачев. Инженер и преподаватель по надежности.

Как вычисляется среднее время до отказа и вероятность безотказной работы?

Время на прочтение
4 мин

Количество просмотров 118K

Понятиям MTTF (Mean Time To Failure — среднее время до отказа) и другим терминам теории надежности посвящено большое количество статей, в том числе на Хабре (см., например, тут). Вместе с тем, редкие публикации «для широкого круга читателей» затрагивают вопросы математической статистики, и уж тем более они не дают ответа на вопрос о принципах расчета надежности электронной аппаратуры по известным характеристикам ее составных элементов.

В последнее время мне довольно много приходится работать с расчетами надежности и рисков, и в этой статье я постараюсь восполнить этот пробел, отталкиваясь от своего предыдущего материала (из цикла о машинном обучении) о пуассоновском случайном процессе и подкрепляя текст вычислениями в Mathcad Express, повторить которые вы сможете скачав этот редактор (подробно о нем тут, обратите внимание, что нужна последняя версия 3.1, как и для цикла по machine learning). Сами маткадовские расчеты лежат здесь (вместе с XPS- копией).

1. Теория: основные характеристики отказоустойчивости
Вроде бы, из самого определения (Mean Time To Failure) понятен его смысл: сколько (конечно, в среднем, поскольку подход вероятностный) прослужит изделие. Но на практике такой параметр не очень полезен. Действительно, информация о том, что среднее время до отказа жесткого диска составляет полмиллиона часов, может поставить в тупик. Гораздо информативнее другой параметр: вероятность поломки или вероятность безотказной работы (ВБР) за определенный период (например, за год).

Для того чтобы разобраться в том, как связаны эти параметры, и как, зная MTTF, вычислить ВБР и вероятности отказа, вспомним некоторые сведения из математической статистики.

Ключевое понятие теории надежности — это понятие отказа, измеряемое, соответственно, интервальным показателем
Q(t) = вероятность того, что изделие откажет к моменту времени t.
Соотвественно, вероятность безотказной работы (ВБР, в английской терминологии «reliability»):
P(t) = вероятность того, что изделие проработает без отказа от момента t0=0 до момента времени t.
По определению, в момент t0=0 изделие находится в работоспособном состоянии, т.е. Q(0)=0, а P(0)=1.

Оба параметра — это интервальные характеристики отказоустойчивости, т.к. речь идет о вероятности отказа (или наоборот, безотказной работы) на интервале (0,t). Если отказ рассматривать, как случайное событие, то, очевидно, что Q(t) — это, по определению, его функция распределения. А точечную характеристику можно определить, как
p(t)=dQ(t)/dt = плотность вероятности, т.е. значение p(t)dt равно вероятности, что отказ произойдет в малой окрестности dt момента времени t.

И, наконец, самая важная (с практической точки зрения) характеристика: λ(t)=p(t)/P(t)=интенсивность отказов.
Это (внимание!) условная плотность вероятности, т.е. плотность вероятности возникновения отказа в момент времени t при условии, что до этого рассматриваемого момента времени t изделие работало безотказно.

Измерить параметр λ(t) экспериментально можно путём испытания партии изделий. Если к моменту времени t работоспособность сохранило N изделий, то за оценку λ(t) можно принять процент отказов в единицу времени, происходящих в окрестности t. Точнее, если в период от t до t+dt откажет n изделий, то интенсивность отказов будет примерно равна
λ(t)=n/(N*dt).

Именно эта λ-характеристика (в пренебрежении ее зависимостью от времени) и приводится чаще всего в паспортных данных различных электронных компонент и самых разных изделий. Только сразу возникает вопрос: а как вычислить вероятность безотказной работы и при чем здесь среднее время до отказа (MTTF).

А вот при чем.

2. Экспоненциальное распределение
В терминологии, которую мы только что использовали, пока не было никаких предположений о свойствах случайной величины — момента времени, в который происходит отказ изделия. Давайте теперь конкретизируем функцию распределения значения отказа, выбрав в качестве нее экспоненциальную функцию с единственным параметром λ=const (смысл которого будет ясен через несколько предложений).

Дифференцируя Q(t), получим выражение для плотности вероятности экспоненциального распределения:
,
а из него – функцию интенсивности отказов: λ(t)=p(t)/P(t)=const=λ.

Что мы получили? Что для экспоненциального распределения интенсивность отказов – есть величина постоянная, причем совпадающая с параметром распределения. Этот параметр и является главным показателем отказоустойчивости и его часто так и называют λ-характеристикой.

Мало того, если теперь посчитать среднее время до первого отказа – тот самый параметр MTTF (Mean Time To Failure), то мы получим, что он равен MTTF=1/ λ.

image

Все это замечательные свойства экспоненциального распределения. Почему мы выбрали в качестве для описания отказов именно его? Да потому что это наиболее простая модель – модель пуассоновского потока событий, которая уже была нами рассмотрена в статье про анализ конверсии сайта. Поэтому-то в теории надежности наиболее часто используется показательное (экспоненциальное) распределение, для которого, как мы выяснили:

  • надежность элементов можно оценить одним числом, т.к. λ=const;
  • по известной λ довольно просто оценить остальные показатели надежности (например, ВБР для любого времени t);
  • λ обладает хорошей наглядностью
  • λ нетрудно измерить экспериментально

Но это еще не все, потому, что для экспоненциального распределения особенно легко делать расчет систем, состоящих из множества элементов. Но об этом – в следующей статье (продолжение следует).

Надежность автоматизированной системы является комплексной характеристикой системы и состоит из нескольких показателей, основными из которых являются безотказность и ремонтопригодность. Безотказность численно характеризуется средней наработкой до отказа (MTTF — «Mean Time to Failure»), обозначается буквой , или интенсивностью отказов («Average probability of failure per hour»), а также вероятностью безотказной работы в течение заданного времени .

Ремонтопригодность характеризуется средним временем восстановления после отказа (MTTR — «Mean Time To Repair») или вероятностью восстановления в течение заданного времени.

Для расчета показателей надежности сложных систем, состоящих из большого количества элементов, используют метод декомпозиции (расчет надежности по частям). Если показатели надежности отдельных элементов (в том числе резервированных) заданы или рассчитаны, то вероятность безотказной работы системы рассчитывают следующим образом. Событие, состоящее в безотказной работе -того элемента системы, обозначают символами , а противоположное событие (отказ элемента) обозначают как . Отказ системы без резервирования наступает при отказе хотя бы одного элемента. Поэтому событие, состоящее в безотказной работе системы , равно произведению событий , т. е. , где — количество элементов в системе. Вероятность произведения независимых событий равна произведению вероятностей событий. Поэтому вероятность работоспособного состояния системы равна

.

(8.9)

Учитывая зависимость вероятности безотказной работы элементов от времени (8.5) для каждого -того элемента, предыдущее выражение можно записать в виде

где

=,

(8. 11)

— интенсивность отказа всей системы; — интенсивность отказа -того элемента.

Поскольку в эксплуатационной документации обычно указывают среднюю наработку до отказа, которая связана с интенсивностью отказов соотношением (8.8), то, пользуясь выражением (8.11), наработку до отказа всей системы можно представить в виде

=,

(8.12)

где — наработка до отказа -того элемента.

В частности, для системы из одинаковых элементов с наработкой =

=,

(8.13)

т. е. наработка на отказ системы обратно пропорциональна количеству ее элементов.

Резервированный элемент (контроллер, датчик и др.) при расчете надежности можно рассматривать как один элемент системы, если для него найдены показатели надежности.

Поскольку в системах автоматизации используются, как правило, только два вида резервирования: горячее резервирование замещением и резервирование методом голосования, то при расчете их показателей безотказности можно обойтись без аппарата цепей Маркова [Александровская], ограничившись алгеброй случайных событий и теорией вероятностей. При расчете вероятности отказа «теплое» резервирование не отличается от горячего.

В случае горячего резервирования два элемента (например, два ПЛК) находятся постоянно во включенном состоянии и при отказе одного из них в работу включается второй. Если считать, что общие элементы, обеспечивающие процесс резервирования, абсолютно надежны, то безотказная работа резервированной системы , состоящей из двух ПЛК, будет обеспечена, если работоспособен хотя бы один из них. Обозначим событие, состоящее в безотказной работе 1-го элемента как , 2-го как , а противоположные им события (отказы элементов) как и . Тогда событие, состоящее в работоспособности резервированной системы (в данном примере система состоит из двух ПЛК), будет иметь место, если работоспособен первый ПЛК и одновременно работоспособен второй () ИЛИ работоспособен первый и отказал второй () ИЛИ отказал первый и работоспособен второй: (), т.е.

Найдем теперь вероятность работоспособности системы , пользуясь тем, что события , и несовместны (т.е. не могут иметь место в одно и то же время), следовательно, вероятность суммы событий равна сумме вероятностей каждого из них, а вероятность произведения событий равна произведению вероятностей:

Здесь использовано также свойство .

Поскольку элементы в резервированной системе идентичны, то и, обозначая , получим

=.

(8.16)

Подставляя сюда вместо его зависимость от времени (8.5), получим вероятность безотказной работы системы при горячем резервировании в виде

=,

(8.17)

где — интенсивность отказов элемента без резервирования.

Плотность распределения времени до отказа (частота отказов) согласно (8.6) равна

=,

(8.18)

а среднее время наработки до отказа

,

(8.19)

где — средняя наработка на отказ одного контроллера. Интеграл в (8.19) берется по частям.

Рассуждая аналогично, можно получить вероятность безотказной работы системы из трех элементов, например, трех контроллеров, в схеме голосования 2оо3. Обозначим события, состоящие в работоспособности трех элементов соответственно и , а противоположные им события (отказы) — как и . Тогда резервированная система будет работоспособной, если работоспособны первый И второй И отказал третий контроллер ИЛИ работоспособен первый И третий И отказал второй контроллер ИЛИ работоспособен второй И третий И отказал первый контроллер ИЛИ работоспособны все три контроллера одновременно, т.е.

=.

(8. 20)

Переходя от событий к их вероятностям и учитывая, что слагаемые в (8.20) являются событиями несовместными, а также считая, что все контроллеры идентичны, т.е. , получим:

поэтому

=.

(8. 22)

Графики зависимостей (8.17) и (8.22) показаны на (рис. 8.21-а).

Плотность распределения времени до отказа (частота отказов) согласно (8.6) равна

=,

(8.23)

а среднее время наработки до отказа

,

(8.24)

где — средняя наработка на отказ одного контроллера.

Обратим внимание, что средняя наработка до отказа у системы с голосованием получилась ниже, чем у нерезервированной системы. Это объясняется тем, что система с тремя контроллерами и голосованием по схеме 2оо3 не является троированной, а имеет дробную кратность резервирования 1:2, т.е. в ней резервный элемент — один, а резервируемых — два, поскольку в схеме голосования только наличие двух работоспособных контроллеров обеспечивает работоспособность системы. Поэтому эффект снижения безотказности вследствие нарастания числа элементов в системе (8.13) при больших наработках оказывается сильнее эффекта резервирования. График вероятности безотказной работы для системы с голосованием (рис. 8.21-б) идет ниже, чем у системы без резервирования, начиная с некоторого значения наработки, а средняя наработка до отказа получается меньше.

а)

б)

Рис. 8.21. Вероятность безотказной работы ПЛК с =500 тыс. час. в течение времени наработки для случаев дублирования, голосования по схеме 2оо3 и при отсутствии резервирования. Графики а) и б) отличаются масштабом.

Сравнение систем только по средней наработке до отказа может вводить в заблуждение так же, как «средняя температура по больнице». Такое сравнение эффективно только для случаев, когда функциональные зависимости элементов имеют одинаковый вид. Для систем с резервированием это условие не выполняется. Поэтому следует делать сравнение по более информативному показателю — вероятности безотказной работы, которая у системы с голосованием в течение практически всего времени эксплуатации значительно больше, чем у системы без резервирования (рис. 8.21-а и -б).

Графики, приведенные на рис. 8.21, иллюстрируют вероятность безотказной работы системы, в которой после отказа одного из элементов не выполняется его замена или ремонт. Если же замена элемента производится сразу, то понятие вероятности безотказной работы теряет значение, поскольку после замены вероятность отказа без замены элемента реализоваться не может. Актуальной становится длительность перехода на резерв, а также продолжительность выполнения горячей замены или восстановления после отказа. Поэтому для обслуживаемых систем автоматизации целью резервирования является обеспечение непрерывности процесса управления или увеличение коэффициента готовности, но не увеличение вероятности безотказной работы. По этим же характеристикам система с голосованием превосходит все остальные.

Проделанный выше сравнительный анализ двух методов резервирования не может быть использован для систем безопасности, в которых вероятности опасного и безопасного отказов различны. Если в системах 2оо3, где требуется безотказность, после отказа двух элементов наступает отказ всей системы, то в системах безопасности опасный отказ наступает только после того, как исчерпаны все варианты деградации (например, 2оо3 — 1оо2 — 1001 — 0). Таким образом, для анализа вероятности опасного отказа система 2оо3 имеет кратность резерва не 2:1, а 1:2, т.е. она является троированной; после отказа одного элемента становится дублированной, после отказа двух элементов становится не резервированной и только после отказа всех трех элементов наступает отказ системы. Кроме того, для анализа систем, связанных с безопасностью, важна не вероятность отказа, а вероятность отказа при наличии запроса [МЭК] которая рассчитывается иным путем.

Поскольку автоматизированная система выполняет множество самостоятельных задач (функций), то параметры надежности по ГОСТ 24.701-86 [ГОСТ] оцениваются не для всей системы, а для каждой выполняемой функции отдельно.

При количественных оценках параметров надежности, а также при интерпретации полученных результатов следует учитывать достоверность исходных данных. Существующие методы экспериментальной оценки показателей надежности [ГОСТ, ГОСТ] были разработаны во времена, когда наработка на отказ вычислительных машин (EC-1061, «Электроника Д3-28» и др.) составляла от нескольких часов до нескольких суток. Экспериментальный материал по отказам, собранный в течение месяца, был достаточен не только для оценки наработки на отказ, но даже для построения функций распределения, изучения зависимостей параметров надежности от условий эксплуатации (температуры, вибрации, влажности и т. п.).

С тех пор ситуация изменилась коренным образом. Появилась технология поверхностного монтажа, увеличилась степень интеграции микросхем, были разработаны новые материалы для монтажа и изготовления печатных плат. Надежность электронных изделий возросла настолько, что экспериментальные данные невозможно накопить в достаточном количестве не только при стендовых испытаниях у изготовителя, но даже путем анализа отказов изделий, возвращенных потребителями в течение гарантийного срока (такая методика используется фирмой GE Fanuc [Programmable]). Так, из 30 тыс. модулей ввода-вывода RealLab! серии NL [Денисенко], проданных фирмой RealLab!, в течение гарантийного срока не было ни одного возврата по причине аппаратного отказа.

Кроме того, ПЛК не относятся к изделиям массового производства и поэтому за период между сменой их поколений количество отказавших изделий может оказаться недостаточным для расчета наработки на отказ. Получить же зависимость показателей надежности от условий эксплуатации еще более проблематично.

Ускоренные испытания [Федоров], широко применяемые в полупроводниковом производстве, неприменимы к ПЛК из-за невозможности экспериментального или расчетного определения коэффициентов подобия.

В то же время органы сертификации, в соответствии с существующими стандартами, требуют обязательного указания параметров надежности в ТУ и эксплуатационной документации на изделие. Одним из реально осуществимых методов оценки показателей надежности является использование статистических данных объектов-аналогов по ГОСТ 27.301-95 [ГОСТ]. Поскольку аналоги, как правило, являются изделиями, изготовленными по устаревшей технологии, показатели надежности оказываются заниженными, по крайне мере, на порядок.

Рассмотрим, например, вероятность безотказной работы процессора CPU 313C-2DP фирмы Siemens, на который изготовителем указывается наработка на отказ (MTBF) =16,9 лет [Product]. В соответствии с (8.4) и (8.5), вероятность отказа процессора в течение гарантийного срока 18 мес. будет равна =0,08. Поскольку оценка вероятности отказа рассчитывается как доля отказавших изделий в испытуемой партии, то, например, из 1000 находящихся в эксплуатации процессоров в течение гарантийного срока должны отказать в среднем 80 шт. и только 920 шт. остаться исправными. Однако любой пользователь продукции Siemens скажет, что эта цифра отличается от реальной, по крайней мере, на порядок. Можно было бы предположить, что наработка на отказ занижена потому, что при ее экспериментальном определении условия испытаний были выбраны предельными. Однако документ «Reliability Consulting» («Консультация по надежности»), расположенный рядом с таблицей наработок на отказ [Reliability] указывает только одно условие: температура при испытаниях составляет 40 °С, и не дает методики пересчета для других условий эксплуатации. Выглядит странным также указание наработки на отказ тремя значащими цифрами, что по теории погрешностей должно означать, что приведенные данные отличаются от действительных не более чем на 1%.

Наличие большого числа парадоксов наводит на мысль, что показатели надежности, указываемые производителями электронных средств автоматизации, определяются политическими, а не техническими факторами, и по мере совершенствования технологии производства мы будем наблюдать только снижение достоверности этих показателей. В этих условиях о надежности изделий лучше судить по общей репутации фирмы и наличии системы управления качеством на базе стандартов ISO 9001 или ISO 9014, но не по наработке на отказ.

Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookies и персональных данных в соответсвии с политикой. Окей, не возражаю

Понравилась статья? Поделить с друзьями:
  • Как найти нейтроны в атоме физика
  • Как составить уравнение прямой по двум заданным точкам
  • Как найти метры кубические в физике
  • Как найти налоговое бремя продавца
  • Arcanum как найти вирджила